Tin Gate News, ngày 24 tháng 4 — DeepSeek V4-Pro và DeepSeek V4-Flash đã được phát hành chính thức và công bố mã nguồn mở vào ngày 24 tháng 4; độ dài xử lý theo ngữ cảnh được mở rộng đáng kể từ 128K lên 1M, tương đương mức tăng dung lượng gần gấp 10 lần. Huawei Computing cho biết các sản phẩm siêu điểm nút (supernode) Ascend của họ hỗ trợ đầy đủ các mô hình thuộc dòng DeepSeek V4 thông qua sự hợp tác chặt chẽ giữa công nghệ chip và công nghệ mô hình.
Huawei Ascend 950 đạt triển khai suy luận mô hình DeepSeek V4 với thông lượng cao và độ trễ thấp nhờ các kỹ thuật kernel hợp nhất (fused kernel) và song song đa luồng (multi-stream parallelism) nhằm giảm chi phí tính toán Attention và chi phí truy cập bộ nhớ. Đối với DeepSeek V4-Pro với đầu vào 8K, Ascend 950 đạt khoảng 20ms TPOT với thông lượng Decode 4,700 TPS trên một thẻ đơn; đối với DeepSeek V4-Flash với đầu vào dưới 8K, nó đạt khoảng 10ms TPOT với thông lượng 1,600 TPS. Dòng siêu điểm nút (supernode) Ascend A3 cũng đạt tương thích hoàn toàn, kèm theo các triển khai mã huấn luyện mẫu để tinh chỉnh nhanh. Dựa trên siêu điểm nút 64 thẻ Ascend A3 với chế độ EP lớn, DeepSeek V4-Flash đạt hơn 2,000 TPS thông lượng Decode trên một thẻ đơn trong các tình huống đầu vào/đầu ra 8K/1K bằng cách sử dụng công cụ suy luận vLLM. Toàn bộ các dòng sản phẩm Huawei Ascend A2, A3 và 950 đều hỗ trợ cả DeepSeek V4-Flash và V4-Pro.
Huawei Cloud công bố khả năng tương thích theo phương thức “đi trước” với DeepSeek V4, cung cấp cho nhà phát triển dịch vụ token API chỉ với một lần nhấp thông qua nền tảng MaaS của họ. Huawei Cloud đã tối ưu năng lực của lớp hệ thống (system layer), lớp toán tử (operator layer) và lớp cụm (cluster layer) để đảm bảo thích nghi nhanh mô hình và triển khai hiệu năng cao. Các doanh nghiệp bao gồm Kingsoft WPS và 360 đã tích hợp mô hình mới của DeepSeek thông qua Huawei Cloud.
Cambricon cũng công bố tương thích “Day 0” với DeepSeek V4-Flash và V4-Pro dựa trên khung suy luận vLLM, đồng thời mã thích nghi được công bố mã nguồn mở cho cộng đồng GitHub. Cambricon trước đó cũng đã đạt khả năng thích nghi theo phương thức “đi trước” khi DeepSeek V3.2 được phát hành vào năm ngoái, nhờ đã thực hiện tối ưu hóa hiệu năng sâu về phần mềm-hardware (phần mềm–phần cứng) đồng tác giữa các mô hình thuộc dòng DeepSeek.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Huawei kỳ vọng doanh thu chip AI năm 2026 đạt 12 tỷ USD, tăng 60% so với năm 2025
Theo Reuters, Huawei kỳ vọng doanh thu chip AI năm 2026 đạt khoảng 12 tỷ đô la Mỹ, tương đương mức tăng ít nhất 60% so với 7,5 tỷ đô la Mỹ trong năm 2025. Phần lớn các đơn đặt hàng trong năm nay dành cho bộ xử lý Ascend 950PR, đã bắt đầu sản xuất hàng loạt vào tháng 3. Công ty dự kiến sẽ ra mắt một
GateNews1phút trước
NVIDIA đầu tư vào startup công nghệ pháp lý AI của Thụy Điển Legora, Jude Law làm đại sứ thương hiệu toàn cầu
Nvidia thực hiện đầu tư mở rộng vòng Series D trị giá 50 triệu USD vào Legora, nâng tổng vốn huy động của Legora lên 600 triệu USD, định giá 5,6 tỷ USD. Atlassian, Adams Street Partners và Insight Partners tham gia. Legora tập trung vào công nghệ pháp lý AI, cung cấp các công cụ như thẩm định tự động, phân tích hợp đồng và nghiên cứu pháp lý. ARR vượt 100 triệu USD, số nhân viên tăng từ 40 lên 400. Jude Law trở thành đại sứ thương hiệu toàn cầu, với khẩu hiệu quảng cáo là Law just got more attractive.
ChainNewsAbmedia27phút trước
Anthropic Mở bản beta bảo mật Claude cho người dùng doanh nghiệp vào ngày 1 tháng 5
Theo BlockBeats, vào ngày 1 tháng 5, Anthropic đã công bố rằng Claude Security, một công cụ bảo mật mã nguồn, đã mở thử nghiệm beta công khai cho người dùng Claude Enterprise. Công cụ này quét các kho mã để tìm lỗ hổng bảo mật, thực hiện xác minh thứ cấp để giảm sai số dương tính, và tự động g
GateNews33phút trước
Cơ quan Lao động Mỹ ra mắt cổng thông tin AI cho người học việc để giúp doanh nghiệp đào tạo nhân lực
Bộ Lao động Hoa Kỳ khởi động cổng thông tin AI cho chương trình học nghề trên toàn quốc vào Tuần lễ Học nghề, cung cấp nguồn tài nguyên đào tạo một cửa. Thông qua khung năng lực AI, cổng này chuyển đổi sang kỹ năng thực hành, thiết kế các mô-đun cho nhiều ngành và lộ trình linh hoạt, giúp doanh nghiệp tích hợp đào tạo AI vào chương trình học nghề đã đăng ký, nhằm nâng cao năng lực nhân lực và sức cạnh tranh của ngành.
ChainNewsAbmedia57phút trước
X Ra mắt Nền tảng quảng cáo AI được xây dựng lại vào tháng 4 năm 2026, Cải tổ lớn nhất trong 20 năm
Theo X, nền tảng này đã bắt đầu triển khai theo giai đoạn một nền tảng quảng cáo được xây dựng lại vào tháng 4/2026. Động thái này đánh dấu đợt đại tu hệ thống quảng cáo lớn nhất của họ trong khoảng 20 năm khi công ty chuyển nhiều công cụ quảng cáo hơn sang AI. Ads Manager mới sử dụng nhắm mục tiêu và xếp hạng dựa trên AI, dựa trên
GateNews1giờ trước
Intel tăng 114% trong tháng 4 nhờ kết quả kinh doanh mạnh mẽ và kỳ vọng về AI
Theo CNBC, cổ phiếu Intel đã tăng 114% trong tháng 4, ghi nhận tháng tốt nhất theo kỷ lục, được thúc đẩy bởi lợi nhuận theo quý mạnh hơn và sự lạc quan trở lại của nhà đầu tư về đợt phục hồi liên quan đến AI. Cổ phiếu đã tăng 24% vào ngày 24 tháng 4 sau khi CEO Lip-Bu Tan công bố rằng doanh thu theo quý tăng hơn 7%, trong khi
GateNews2giờ trước