Tether đã giới thiệu khung QVAC Fabric, cung cấp khả năng tinh chỉnh LoRA đa nền tảng cho mô hình BitNet. Nhờ tiến bộ này, các mô hình ngôn ngữ lớn có thể hoạt động và được huấn luyện trực tiếp trên thiết bị di động hoặc phần cứng phổ thông. Thành tựu này đã góp phần hạ thấp đáng kể các rào cản trong phát triển AI, đồng thời mở ra nhiều cơ hội mới cho AI phi tập trung.

Đột phá lớn trong ngưỡng huấn luyện AI

Trong lĩnh vực phát triển mô hình AI, việc huấn luyện các mô hình ngôn ngữ lớn từ trước đến nay thường đòi hỏi phần cứng đắt đỏ và tài nguyên điện toán đám mây, khiến công nghệ này tập trung vào tay một số tổ chức lớn.

Đột phá lớn trong ngưỡng huấn luyện AI (Nguồn: Tether)

Việc Tether vừa ra mắt QVAC Fabric đã giới thiệu một khung tinh chỉnh LoRA mới dành riêng cho BitNet (mô hình ngôn ngữ lớn 1-bit). Đột phá này giúp giảm mạnh yêu cầu về tính toán và bộ nhớ, mở ra cơ hội cho người dùng phổ thông tham gia vào quá trình huấn luyện mô hình AI.

Vận hành đa nền tảng: Hỗ trợ toàn diện từ máy tính đến thiết bị di động

Một ưu điểm nổi bật của QVAC Fabric là khả năng tương thích phần cứng rộng rãi. Khung này vận hành trên nhiều thiết bị khác nhau, bao gồm:

Máy tính xách tay
GPU phổ thông (Intel, AMD, Apple Silicon)
Điện thoại thông minh (bao gồm nhiều loại GPU di động)

Điều này đồng nghĩa với việc các mô hình AI không còn bị giới hạn trong trung tâm dữ liệu hoặc phần cứng chuyên dụng—giờ đây có thể được huấn luyện và vận hành trực tiếp trên các thiết bị sử dụng hàng ngày.

Huấn luyện mô hình lớn trên điện thoại di động

Một trong những điểm nổi bật của công nghệ này là khả năng tinh chỉnh mô hình ngay trên thiết bị di động.

Ví dụ:

Trên Samsung S25 (GPU Adreno), một mô hình 125 triệu tham số có thể được tinh chỉnh trong khoảng 10 phút
Trên cùng thiết bị, một mô hình 1 tỷ tham số mất khoảng 1 giờ 18 phút
Trên iPhone 16, một mô hình 1 tỷ tham số cần khoảng 1 giờ 45 phút

Đội ngũ phát triển thậm chí đã vận hành thành công các mô hình lên đến 13 tỷ tham số trên điện thoại thông minh, cho thấy năng lực AI của phần cứng di động đang tăng trưởng nhanh chóng.

Tiến bộ chủ chốt về hiệu năng và tối ưu hóa bộ nhớ

So với các mô hình truyền thống, kiến trúc BitNet thể hiện rõ ưu thế về hiệu năng và hiệu quả sử dụng tài nguyên:

Hiệu năng

Tốc độ suy luận trên GPU di động nhanh hơn CPU từ 2 đến 11 lần
Có thể xử lý các tác vụ từng yêu cầu trung tâm dữ liệu

Sử dụng bộ nhớ

Giảm sử dụng VRAM lên đến khoảng 77,8% so với mô hình 16-bit
Tăng khả năng vận hành, hỗ trợ các mô hình lớn hơn và ứng dụng cá nhân hóa

Những cải tiến này giúp việc triển khai ứng dụng AI trên thiết bị đầu cuối trở nên đơn giản hơn rất nhiều.

Vượt qua sự phụ thuộc vào NVIDIA và điện toán đám mây

Huấn luyện AI truyền thống phụ thuộc lớn vào phần cứng NVIDIA và các dịch vụ đám mây. QVAC Fabric đã phá vỡ sự phụ thuộc này khi cho phép tinh chỉnh LoRA LLM 1-bit trên phần cứng không phải NVIDIA—bao gồm AMD, Intel, Apple Silicon và các GPU di động như Adreno, Mali. Sự chuyển đổi này không chỉ giúp giảm chi phí mà còn thúc đẩy một hệ sinh thái phát triển AI phi tập trung hơn.

Thúc đẩy phi tập trung và bảo vệ quyền riêng tư

Một lợi ích quan trọng khác của QVAC Fabric là hỗ trợ bảo mật dữ liệu và học liên kết phân tán:

Việc huấn luyện mô hình có thể thực hiện tại chỗ, không cần tải dữ liệu nhạy cảm lên mạng
Hỗ trợ học liên kết (federated learning)
Giảm sự phụ thuộc vào hạ tầng tập trung

Những đặc điểm này mở ra hướng đi an toàn và có khả năng mở rộng cho hệ sinh thái AI trong tương lai.

Tầm nhìn của Tether về tương lai AI

Paolo Ardoino nhận định AI sẽ đóng vai trò then chốt trong xã hội tương lai, và sự phát triển của nó không nên bị độc quyền bởi một nhóm nhỏ sở hữu tài nguyên. Ông nhấn mạnh rằng việc quá phụ thuộc vào kiến trúc tập trung cho huấn luyện AI không chỉ kìm hãm đổi mới mà còn đe dọa sự ổn định của toàn hệ sinh thái. Việc cho phép AI vận hành trên thiết bị cá nhân vì thế là bước đi quan trọng hướng tới phổ cập rộng rãi.

Tóm tắt

QVAC Fabric của Tether không chỉ là một đổi mới công nghệ mà còn có tiềm năng thay đổi mô hình phát triển AI. Bằng cách hạ thấp rào cản phần cứng và tăng cường khả năng đa nền tảng, các mô hình ngôn ngữ lớn đang dần rời khỏi trung tâm dữ liệu để xuất hiện trên các thiết bị hàng ngày. Khi công nghệ tiếp tục phát triển, AI đang hướng đến một tương lai mở, phi tập trung và dễ tiếp cận hơn bao giờ hết.

Tác giả: Allen

Tuyên bố từ chối trách nhiệm

* Đầu tư có rủi ro, phải thận trọng khi tham gia thị trường. Thông tin không nhằm mục đích và không cấu thành lời khuyên tài chính hay bất kỳ đề xuất nào khác thuộc bất kỳ hình thức nào được cung cấp hoặc xác nhận bởi Gate.

* Không được phép sao chép, truyền tải hoặc đạo nhái bài viết này mà không có sự cho phép của Gate. Vi phạm là hành vi vi phạm Luật Bản quyền và có thể phải chịu sự xử lý theo pháp luật.

Mời người khác bỏ phiếu

Nội dung

Đột phá lớn trong ngưỡng huấn luyện AI

Vận hành đa nền tảng: Hỗ trợ toàn diện từ máy tính đến thiết bị di động

Huấn luyện mô hình lớn trên điện thoại di động

Tiến bộ chủ chốt về hiệu năng và tối ưu hóa bộ nhớ

Vượt qua sự phụ thuộc vào NVIDIA và điện toán đám mây

Thúc đẩy phi tập trung và bảo vệ quyền riêng tư

Tầm nhìn của Tether về tương lai AI

Tóm tắt

Tin nhanh

Kelp DAO Chuyển sang Chainlink CCIP Sau Vụ Phân Bố (Bridge) LayerZero Bị Khai Thác Trị Giá 292 Triệu USD

2026-05-06 04:42

Nhà giao dịch Hyperliquid Yixie10 ghi nhận lãi chưa thực hiện 1,446 triệu USD khi Long SNDK, 3,81 triệu USD trên AMD và MU

2026-05-06 04:41

Chỉ số Sợ hãi và Tham lam Crypto giảm xuống 45, giảm 6 điểm so với hôm qua

2026-05-06 04:33

MPS nâng mục tiêu doanh thu năm 2026 lên mức tăng trưởng 85% so với cùng kỳ, đồng thời nâng chỉ tiêu năng lực lên $60B vào ngày 6/5

2026-05-06 04:31

USD/JPY Giảm 60 pip Trong Ngày, Hiện Đang Giao Dịch Ở Mức 157,06

2026-05-06 04:31

Bài viết liên quan

Người mới bắt đầu

Mô hình kinh tế token ONDO: Cơ chế thúc đẩy tăng trưởng nền tảng và gia tăng sự tham gia của người dùng?

ONDO là token quản trị trung tâm và công cụ ghi nhận giá trị của hệ sinh thái Ondo Finance. Mục tiêu trọng tâm của ONDO là ứng dụng cơ chế khuyến khích bằng token nhằm gắn kết các tài sản tài chính truyền thống (RWA) với hệ sinh thái DeFi một cách liền mạch, qua đó thúc đẩy sự mở rộng quy mô lớn cho các sản phẩm quản lý tài sản và lợi nhuận trên chuỗi.

2026-03-27 13:53:10

Người mới bắt đầu

Phân tích chuyên sâu về tokenomics của Morpho: tiện ích, phân phối và khung giá trị của MORPHO

MORPHO là token gốc của giao thức Morpho, đảm nhận vai trò trọng tâm trong quản trị và thúc đẩy các hoạt động của hệ sinh thái. Bằng cách kết hợp phân phối token với các cơ chế khuyến khích, Morpho gắn kết sự tham gia của người dùng, quá trình phát triển giao thức và quyền lực quản trị, từ đó xây dựng nền tảng vững chắc cho giá trị lâu dài trong hệ sinh thái cho vay phi tập trung.

2026-04-03 13:14:14

Trung cấp

Sentio và The Graph: so sánh cơ chế lập chỉ số theo thời gian thực và cơ chế lập chỉ số subgraph

Sentio và The Graph đều là nền tảng chỉ số dữ liệu trên chuỗi, nhưng lại khác biệt rõ rệt về mục tiêu thiết kế cốt lõi. The Graph sử dụng subgraph để chỉ số dữ liệu trên chuỗi, tập trung chủ yếu vào nhu cầu truy vấn và tổng hợp dữ liệu. Ngược lại, Sentio áp dụng cơ chế chỉ số theo thời gian thực, ưu tiên xử lý dữ liệu độ trễ thấp, giám sát trực quan và các tính năng cảnh báo tự động, nhờ đó đặc biệt phù hợp cho các trường hợp giám sát theo thời gian thực và cảnh báo rủi ro.

2026-04-17 08:55:07

Người mới bắt đầu

Các thành phần cốt lõi của Giao thức 0x gồm những gì? Cụ thể là phân tích về Relayer, Mesh và kiến trúc API

Giao thức 0x xây dựng hạ tầng giao dịch phi tập trung bằng các thành phần chủ chốt như Relayer, Mesh Network, 0x API và Exchange Proxy. Relayer chịu trách nhiệm phát sóng lệnh ngoài chuỗi, Mesh Network đảm nhiệm chia sẻ lệnh, 0x API cung cấp giao diện báo giá thanh khoản thống nhất, còn Exchange Proxy quản lý thực thi giao dịch trên chuỗi và điều phối thanh khoản. Nhờ sự phối hợp này, kiến trúc tổng thể cho phép kết hợp việc truyền lệnh ngoài chuỗi với thanh toán giao dịch trên chuỗi, giúp Ví, DEX và các Ứng dụng DeFi tiếp cận thanh khoản đa nguồn chỉ qua một giao diện duy nhất.

2026-04-29 03:06:50

Người mới bắt đầu

Plasma (XPL) và các hệ thống thanh toán truyền thống: Tái định nghĩa thanh toán xuyên biên giới bằng stablecoin và thay đổi động lực thanh khoản

Plasma (XPL) nổi bật so với các hệ thống thanh toán truyền thống ở nhiều điểm cốt lõi. Về cơ chế thanh toán, Plasma cho phép chuyển tài sản trực tiếp trên chuỗi, trong khi các hệ thống truyền thống lại dựa vào phương thức ghi sổ tài khoản và các quy trình bù trừ qua trung gian. Xét về hiệu suất thanh toán và cấu trúc chi phí, Plasma mang đến giao dịch gần như theo thời gian thực với chi phí cực thấp, còn hệ thống truyền thống thường bị chậm trễ và phát sinh nhiều loại phí. Đối với quản lý thanh khoản, Plasma sử dụng stablecoin để phân bổ thanh khoản trên chuỗi theo nhu cầu thực tế, thay vì phải cấp vốn trước như các khuôn khổ truyền thống. Hơn nữa, Plasma còn hỗ trợ hợp đồng thông minh và mạng lưới mở toàn cầu cho phép lập trình và tiếp cận rộng rãi, trong khi các hệ thống thanh toán truyền thống chủ yếu bị giới hạn bởi kiến trúc cũ và hệ thống ngân hàng.

2026-03-24 11:58:52

Trung cấp

Phân tích nguồn lợi nhuận của USD.AI: cách các khoản vay hạ tầng AI tạo ra lợi nhuận

USD.AI chủ yếu tạo ra lợi nhuận bằng cách cho vay hạ tầng AI, cung cấp tài chính cho các đơn vị vận hành GPU và hạ tầng sức mạnh băm, đồng thời thu lãi suất từ các khoản vay. Giao thức phân phối lợi nhuận này cho người nắm giữ tài sản lợi suất sUSDai, trong khi lãi suất và các tham số rủi ro được quản lý thông qua token quản trị CHIP, tạo ra một hệ thống lợi suất trên chuỗi dựa trên tài trợ sức mạnh băm AI. Cách tiếp cận này chuyển đổi lợi nhuận thực tế từ hạ tầng AI thành nguồn lợi nhuận bền vững trong hệ sinh thái DeFi.

2026-04-23 10:56:01