Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.
Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.
Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
IREN mua lại Mirantis với $625M trong một thương vụ hoán đổi cổ phiếu để mở rộng nền tảng AI Cloud
Theo BlockBeats, IREN Limited đã đồng ý mua công ty phần mềm hạ tầng đám mây Mirantis với khoảng 625 triệu USD trong một giao dịch toàn cổ phiếu vào ngày 5/5. Việc mua lại nhằm tăng cường năng lực AI trên đám mây của IREN bằng cách giới thiệu khả năng phần mềm và điều phối để
GateNews3giờ trước
Giám đốc điều hành Anthropic: Mỹ đang xem xét quy trình phát hành mô hình AI đơn giản hóa, các đối thủ chậm 1-3 tháng
Theo 金十, CEO của Anthropic cho biết vào ngày 5/5 rằng chính phủ Mỹ dường như đang cân nhắc đơn giản hóa quy trình phát hành các mô hình trí tuệ nhân tạo. Vị CEO cho biết năng lực của các phòng thí nghiệm AI lớn khác có thể còn tụt hậu so với Anthropic từ 1 đến 3
GateNews4giờ trước
Nhóm SGLang hoàn tất vòng gọi vốn Seed tại $100M định giá $400M , do Accel dẫn dắt
Theo Beating, nhóm đứng sau công cụ suy luận mã nguồn mở SGLang đã chính thức thành lập RadixArk và hoàn tất vòng gọi vốn hạt giống 100 triệu USD với định giá sau đầu tư 400 triệu USD. Accel dẫn dắt vòng này, với Spark Capital đồng dẫn dắt. Các đối thủ bán dẫn Nvidia (thông qua
GateNews4giờ trước
OpenAI cấp phép cho 8.000 nhà phát triển tăng giới hạn tốc độ Codex lên 10 lần đến ngày 5 tháng 6
Theo Beating, OpenAI đã gửi email cho hơn 8.000 nhà phát triển đã đăng ký tham dự sự kiện GPT-5.5 offline ở San Francisco, cấp cho họ mức tăng gấp 10 lần giới hạn tốc độ của Codex, có hiệu lực ngay lập tức đến ngày 5/6. Tất cả ứng viên đều nhận phần thưởng bất kể họ có nhận được sự kiện hay không.
GateNews4giờ trước
Liên doanh của OpenAI với Anthropic đang đàm phán để mua 3 công ty dịch vụ AI vào ngày 5/5
Theo Jin 10, liên doanh của OpenAI với Anthropic đang trong các cuộc đàm phán để mua ba công ty dịch vụ AI vào ngày 5/5. Các công ty mục tiêu được cho là bao gồm các doanh nghiệp tập trung vào kỹ thuật trong lĩnh vực dịch vụ AI
GateNews4giờ trước
Anthropic ra mắt 10 tác nhân AI cho dịch vụ tài chính vào thứ Ba
Anthropic đã ra mắt 10 tác nhân AI mới vào hôm thứ Ba, được thiết kế để xử lý các tác vụ dịch vụ tài chính bao gồm soạn thảo bài thuyết trình cuộc họp với khách hàng, rà soát báo cáo tài chính và chuyển vụ việc lên để xem xét tuân thủ. Các công cụ này nhắm tới các chuyên gia trong lĩnh vực ngân hàng, bảo hiểm, quản lý tài sản và fintech
GateNews4giờ trước