Cựu kỹ sư Seed của ByteDance: Lượt lặp AI của ByteDance mất sáu tháng so với ba tháng của Google

Tin tức Cổng, ngày 24 tháng 4 — Zhang Chi, cựu kỹ sư tại đội Seed của ByteDance và hiện là trợ giảng tại Đại học Bắc Kinh, đã tiết lộ trên podcast “Into Asia” rằng ByteDance cần khoảng sáu tháng để hoàn thành một chu kỳ đầy đủ huấn luyện mô hình ngôn ngữ lớn (pretraining cộng thêm hậu huấn luyện), trong khi Google theo như báo cáo chỉ cần ba tháng. Zhang cho rằng sự chênh lệch tốc độ này là một lý do cốt lõi khiến các công ty Trung Quốc gặp khó khăn trong việc bắt kịp phát triển AI.

Zhang mô tả một “văn hóa đánh giá chuẩn” trong Seed, nơi các trưởng nhóm được đánh giá dựa trên điểm số benchmark mà họ giám sát, và mọi thành viên đều tập trung vào việc nâng cao các con số. Tuy nhiên, ông cho biết điều này không chuyển hóa thành trải nghiệm người dùng tốt hơn trong thực tế. Mặc dù các mô hình của các công ty lớn của Trung Quốc có vẻ cạnh tranh với các mô hình frontier của Mỹ trên giấy tờ, chúng lại thua kém trong cách sử dụng thực tế. Mục tiêu của Seed là đạt hiệu năng thuộc nhóm hàng đầu toàn cầu, nhưng Zhang cho biết ông không tin rằng nhóm đã đạt được điều đó, và cũng chưa đạt được mục tiêu dẫn dắt trong nước.

Vào cuối năm 2024, Seed tự đánh giá mình ngang với GPT-4o, nhưng sau khi DeepSeek ra mắt, nhóm nhận ra khoảng cách vẫn còn. Khi Zhang tham gia, cả nhóm đang khẩn trương chuyển hướng sang học tăng cường để bù đắp sự thiếu hụt.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Tổng giám đốc OpenAI Brockman bị tòa án tiết lộ sở hữu 30 tỷ đô la Mỹ, với các khoản đầu tư cá nhân của Altman có mức độ đan xen cao

Ngày 4/5, phiên tòa trong vụ kiện của Musk đã làm lộ việc Greg Brockman nắm giữ khoảng 30 tỷ USD cổ phần của OpenAI, có liên hệ chặt chẽ với các khoản đầu tư tư nhân của Sam Altman, liên quan đến ba lợi ích gồm Cerebras, Helion Energy và quỹ gia đình Altman. Sự đan xen này được xem là bằng chứng động cơ khiến Brockman ủng hộ việc chuyển sang hoạt động vì lợi nhuận, đồng thời chạm tới tranh cãi về quản trị khi OpenAI chuyển từ mô hình phi lợi nhuận sang mô hình vì lợi nhuận.

ChainNewsAbmedia1phút trước

Ủy ban châu Âu liên hệ với Anthropic Mythos: Dombrovskis xác nhận EU can thiệp vào các mô hình AI bí mật

Ủy ban châu Âu đã xác nhận đang thảo luận với Anthropic về tác động kỹ thuật và quy định của Mythos, đồng thời cân nhắc sự bất đối xứng trong khả năng tiếp cận an ninh AI giữa Mỹ và châu Âu. Có thể sử dụng các công cụ như Đạo luật AI, quy định về trợ cấp từ nước ngoài và NIS2/DORA để thúc đẩy hình thức cho phép truy cập có điều kiện, yêu cầu Mythos mở quyền truy cập tương đương cho các ngân hàng tại châu Âu hoặc cung cấp kết quả thử nghiệm; sau đó sẽ tiếp tục theo dõi các phản hồi và mức độ minh bạch của Glasswing.

ChainNewsAbmedia3phút trước

Cập nhật chuỗi cung ứng điện thoại của OpenAI: MediaTek độc quyền bộ xử lý? Tiến lịch sản xuất hàng loạt lên nửa đầu năm 2027

Guo Ming-chi cho biết OpenAI đang tăng tốc phát triển chiếc điện thoại di động AI Agent đầu tiên, mục tiêu sản xuất hàng loạt vào nửa đầu năm 2027, hoặc khiến MediaTek giành độc quyền đơn hàng bộ xử lý. Chip tùy chỉnh sẽ được xây dựng trên nền tảng Dimensity 9600, được TSMC sản xuất trên quy trình N2P vào nửa cuối năm 2026. Các thông số trọng điểm gồm ISP dải động cao, hai NPU, LPDDR6, UFS 5.0 và bảo mật pKVM. Nếu mọi việc thuận lợi, đến giai đoạn 2027—2028 dự kiến xuất xưởng khoảng 30 triệu chiếc, mang ý nghĩa đáng kể đối với câu chuyện IPO của OpenAI và việc bước vào thị trường tiêu dùng rộng lớn.

ChainNewsAbmedia11phút trước

TrendAI bắt tay với Anthropic để tìm lỗ hổng nền tảng AI, phát hiện lỗ hổng CVSS 9,8 trong Nvidia Isaac GR00T

Theo Trend Micro, TrendAI đang hợp tác với Anthropic để sử dụng Claude Opus 4.7 cho nghiên cứu an ninh, nhằm xác định các lỗ hổng phần mềm có thể bị khai thác và xếp hạng chúng theo mức độ rủi ro. TrendAI đã tham gia Chương trình Xác minh An ninh mạng của Anthropic, chương trình này cấp cho các nhóm được phê duyệt quyền truy cập vào AI tiên tiến

GateNews25phút trước

Chỉ số Hang Seng Hồng Kông Giảm 0,76% Hôm Nay; Cổ Phiếu AI và Chip Cũng Giảm

Chỉ số Hang Seng của Hồng Kông đóng cửa giảm 0,76% hôm nay (ngày 5/5), trong khi Chỉ số Hang Seng Tech giảm 0,94%. Các cổ phiếu mô hình ngôn ngữ lớn và bán dẫn dẫn đầu đà giảm, với Zhipu AI giảm hơn 3%, Minimax giảm hơn 2%, SMIC giảm 1,87% và Huahong Semiconductor giảm 1,65%.

GateNews25phút trước

Jensen Huang bác bỏ thuyết tận thế của AI: Tương lai sẽ tạo ra cơ hội việc làm mới quy mô lớn

Giám đốc điều hành Nvidia Jensen Huang tại một cuộc thảo luận toàn cầu cho biết AI không phải là ngày tận thế, và tin rằng AI sẽ thúc đẩy Mỹ tái công nghiệp hóa và tạo ra việc làm. Ông dự đoán làn sóng tiếp theo của “AI dạng tác nhân” sẽ làm nhu cầu GPU tăng vọt gấp hàng nghìn lần, đòi hỏi cơ sở hạ tầng công nghiệp mới và một thị trường lao động quy mô lớn. Ông nhấn mạnh AI nâng cao năng suất lao động, không thay thế con người, đồng thời kêu gọi phát triển có trách nhiệm và các tiêu chuẩn an toàn xuyên quốc gia; tác động đến việc làm và kinh tế vẫn cần được theo dõi trong dài hạn.

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận