Vào ngày 14 tháng 05 năm 2026, một công ty còn khá xa lạ với công chúng nhưng được dự báo sẽ làm rung chuyển toàn bộ ngành chip AI—Cerebras Systems—đã hoàn tất đợt IPO công nghệ lớn nhất năm trên sàn Nasdaq. Giá chào bán là 185 USD/cổ phiếu, cổ phiếu mở cửa tăng vọt lên 350 USD và kết phiên đầu tiên với mức tăng 68%. Được mệnh danh là "đối thủ mạnh nhất của NVIDIA", ngôi sao mới nổi trong lĩnh vực chip AI này đã phát động một cuộc tấn công công nghệ trực diện vào gã khổng lồ GPU NVIDIA với con chip "kích thước bằng đĩa ăn" theo kiến trúc wafer-scale.
Tuy nhiên, chỉ hơn một tháng sau khi niêm yết, báo cáo tài chính quý đầu tiên của Cerebras đã làm dấy lên những tranh luận gay gắt trên thị trường. Doanh thu vượt kỳ vọng và khoản lỗ thu hẹp đáng kể, nhưng dự báo biên lợi nhuận gộp sụt giảm mạnh đã khiến giá cổ phiếu sau giờ giao dịch lao dốc hơn 10%. Thị trường đang lo ngại điều gì? Liệu chiến lược chip wafer-scale độc lập có thực sự đủ tiềm năng dài hạn để thách thức NVIDIA? Chúng tôi sẽ phân tích toàn diện Cerebras từ bốn góc độ: công nghệ, hiệu quả tài chính, cạnh tranh ngành và kênh giao dịch.
Giá trị cốt lõi của Cerebras
Sản xuất chip truyền thống tuân theo một logic quen thuộc: một tấm wafer silicon 12 inch sẽ được khắc hàng trăm con chip, sau đó cắt nhỏ, đóng gói và kiểm thử. Kích thước mỗi chip bị giới hạn bởi khẩu độ của mặt nạ quang khắc, nên không thể làm chip lớn hơn. Cerebras đã đảo ngược hoàn toàn mô hình này—thay vì cắt nhỏ, họ thực hiện quang khắc toàn bộ wafer trong một lần, biến cả tấm wafer silicon thành một con chip khổng lồ duy nhất.
Đây chính là Cerebras Wafer-Scale Engine (WSE). Thế hệ mới nhất, WSE-3, được sản xuất trên tiến trình 5nm của TSMC, diện tích mỗi chip lên tới 46.225 mm², tích hợp 4 nghìn tỷ transistor và 900.000 lõi AI, trang bị 44 GB SRAM trên chip, cung cấp hiệu năng AI lên tới 125 petaflops. Để so sánh, NVIDIA H100—"cỗ máy chủ lực" của các trung tâm dữ liệu AI—chỉ có khoảng 80 tỷ transistor. WSE-3 nhiều gấp 50 lần.
Tuy nhiên, số lượng transistor khổng lồ không phải là "hào lũy" thực sự của Cerebras. Điểm khác biệt cốt lõi nằm ở kiến trúc bộ nhớ.
GPU truyền thống (như H100) phụ thuộc rất nhiều vào bộ nhớ HBM băng thông cao bên ngoài, dữ liệu di chuyển giữa chip và bộ nhớ bị giới hạn bởi băng thông vật lý. Trong ngành, đây được gọi là "bức tường bộ nhớ"—dù đơn vị tính toán mạnh đến đâu, nếu dữ liệu không truyền tải đủ nhanh thì hiệu năng vẫn bị bóp nghẹt. Cerebras tích hợp 44 GB SRAM ngay trên chip, đạt băng thông bộ nhớ nội bộ 21 PB/s. Các nhà phân tích nhận định băng thông bộ nhớ của WSE-3 cao hơn NVIDIA B200 tới 2.625 lần. Trong các kịch bản suy luận AI, điều này giúp trọng số mô hình không cần liên tục truyền từ bộ nhớ ngoài, giảm mạnh độ trễ suy luận.
Dĩ nhiên, phương pháp wafer-scale cũng mang lại không ít đánh đổi. Chỉ một lỗi chí mạng ở bất cứ đâu trên tấm wafer cũng có thể khiến toàn bộ chip không sử dụng được. Giải pháp của Cerebras là "công nghệ sửa lỗi lõi dư thừa"—thiết kế rất nhiều lõi tính toán dự phòng để tự động bỏ qua vùng bị lỗi. Điều này làm tăng độ phức tạp thiết kế và chi phí. Việc sử dụng cả tấm wafer làm một chip duy nhất đòi hỏi cách tiếp cận hoàn toàn khác về quản lý lỗi và tỷ lệ thành phẩm so với sản xuất chip truyền thống.
Khác biệt căn bản về hướng tiếp cận kỹ thuật: NVIDIA theo đuổi mô hình "cụm siêu lớn + liên kết tốc độ cao", ghép nối siêu máy tính từ vô số GPU. Cerebras chọn con đường "mở rộng cực đại trên một chip", thay thế hàng trăm, hàng nghìn GPU bằng một con chip khổng lồ. NVIDIA có hệ sinh thái phần mềm hàng chục năm và khả năng tương thích vượt trội. Cerebras sở hữu lợi thế hiệu suất lý thuyết trong một số kịch bản suy luận nhất định, nhưng hệ sinh thái phần mềm phải xây dựng từ con số 0.
Một tháng sau IPO: Từ thăng hoa đến điều chỉnh—Diễn biến giá CBRS
Ngày 14 tháng 05 năm 2026, Cerebras lên sàn Nasdaq với giá 185 USD/cổ phiếu, mở cửa ở mức 350 USD. Giá cổ phiếu tăng hơn 108% trong ngày, kích hoạt tạm ngừng giao dịch, và đóng cửa ở mức 311,07 USD. Với mức tăng 68% trong ngày đầu, đây trở thành IPO công nghệ lớn nhất tại Mỹ năm 2026.
Những tuần tiếp theo, cổ phiếu CBRS biến động dữ dội. Giá đạt đỉnh lịch sử 386 USD, rồi giảm mạnh về vùng 197 USD. Tính đến thứ Ba, ngày 23 tháng 06, CBRS chốt phiên ở 226,72 USD—vẫn cao hơn giá IPO khoảng 23%, nhưng đã giảm hơn 27% so với giá đóng cửa ngày đầu tiên.
Sau phiên 23 tháng 06, Cerebras công bố báo cáo tài chính quý đầu tiên kể từ khi niêm yết, khiến giá cổ phiếu sau giờ giảm hơn 10%. Trong phiên giao dịch đêm 24 tháng 06, CBRS tiếp tục giảm gần 11% về 201,8 USD.
Tại thời điểm công bố bài viết, vốn hóa thị trường của CBRS vào khoảng 49,8 tỷ USD, với hệ số P/E trailing khoảng 527 lần. Định giá này phản ánh kỳ vọng tăng trưởng rất cao, đồng thời cũng có nghĩa là bất kỳ thất vọng nào cũng dễ gây biến động mạnh.
Báo cáo tài chính đầu tiên: Doanh thu vượt kỳ vọng, vì sao thị trường vẫn chưa hài lòng?
Kết quả tài chính quý 1 năm 2026 (kết thúc ngày 31 tháng 03) của Cerebras cho thấy một bức tranh "hai mặt" rõ rệt:
Điểm sáng:
- Tổng doanh thu đạt 193,4 triệu USD, tăng 94% so với cùng kỳ, vượt dự báo 181,2 triệu USD của các nhà phân tích
- Doanh thu phần cứng đạt 110,6 triệu USD, tăng 59% so với cùng kỳ
- Doanh thu dịch vụ đám mây và các dịch vụ khác đạt 82,8 triệu USD, tăng 178% so với cùng kỳ
- Lỗ ròng 14 triệu USD, thu hẹp mạnh so với mức lỗ 23,9 triệu USD cùng kỳ năm trước
- Lỗ trên mỗi cổ phiếu là 0,22 USD, tốt hơn mức dự báo 0,25 USD
- Dự báo doanh thu cả năm đạt 855–865 triệu USD, cao hơn mức đồng thuận 824,8 triệu USD của giới phân tích
Điểm lo ngại:
- Dự báo biên lợi nhuận gộp cốt lõi quý 2 chỉ đạt 36%-38%, giảm hơn 10 điểm phần trăm so với mức 46,5% của quý 1
- Dự báo biên lợi nhuận hoạt động cốt lõi cả năm ở mức -28% đến -32%
- Doanh thu cốt lõi quý 2 dự kiến khoảng 194 triệu USD
Doanh thu tăng gấp đôi, lỗ thu hẹp, nâng dự báo—tất cả đều rất ấn tượng với một công ty tăng trưởng. Tuy nhiên, thị trường lại phản ứng bằng một đợt bán tháo sau giờ giao dịch. Lý do khá rõ ràng: định giá của Cerebras dựa trên kỳ vọng "tăng trưởng cao + biên lợi nhuận cao", và sự sụt giảm mạnh của biên lợi nhuận đã làm lung lay trụ cột thứ hai.
CFO Bob Komin giải thích trong cuộc họp báo cáo rằng nguyên nhân giảm biên lợi nhuận là do thiếu không gian trung tâm dữ liệu, buộc Cerebras phải thuê lại một số hệ thống từ khách hàng, đồng thời công ty đang "tích cực" mở rộng năng lực hạ tầng của chính mình. Những chi phí này dự kiến sẽ làm giảm biên lợi nhuận năm 2026 khoảng 10–15 điểm phần trăm. CEO Andrew Feldman thẳng thắn: "Thật trớ trêu khi sau khi phát minh ra tất cả công nghệ này, yếu tố giới hạn lại là xây dựng cơ sở hạ tầng vật lý."
Nói cách khác, nút thắt hiện tại của Cerebras không nằm ở công nghệ hay nhu cầu, mà là tốc độ cung ứng hạ tầng vật lý chưa bắt kịp tốc độ tăng trưởng đơn hàng. Điều này tạo áp lực lợi nhuận ngắn hạn, nhưng đồng thời cũng xác nhận thực tế và tính cấp thiết của nhu cầu.
OpenAI và AWS: Chuyển đổi cơ cấu khách hàng phía sau đơn hàng 20 tỷ USD
Sự thay đổi trong cơ cấu khách hàng là yếu tố then chốt để đánh giá giá trị dài hạn của Cerebras.
Nửa đầu năm 2024, công ty AI G42 có trụ sở tại UAE chiếm tới 87% doanh thu của Cerebras. Mức tập trung khách hàng cực đoan này từng là mối lo lớn nhất của thị trường. Tuy nhiên, tháng 01 năm 2026, Cerebras công bố hợp tác chiến lược với OpenAI trị giá hơn 20 tỷ USD—OpenAI sẽ triển khai 750 megawatt năng lực suy luận tốc độ cao của Cerebras trước năm 2028. Hai bên cũng đồng phát triển Codex-Spark, mô hình AI tạo mã gần như tức thời, sinh hơn 1.000 token mỗi giây.
Song song, Cerebras thiết lập hợp tác chiến lược nhiều năm với Amazon AWS, dự kiến triển khai hệ thống Cerebras CS-3 tại các trung tâm dữ liệu AWS. Hai bên sẽ cung cấp "chiến lược suy luận tách rời": chip Trainium 3 của AWS xử lý tính toán prefill, còn Cerebras CS-3 đảm nhận suy luận giải mã siêu tốc.
Những hợp tác này không chỉ có ý nghĩa về quy mô đơn hàng. Từ một khách hàng (G42) sang hai trụ cột (OpenAI và AWS), rủi ro tập trung khách hàng của Cerebras đã được giảm đáng kể. Quan trọng hơn, OpenAI và AWS đại diện cho hai kịch bản suy luận AI cốt lõi toàn cầu—huấn luyện mô hình tiên tiến và triển khai đám mây quy mô lớn. Việc giành được đơn hàng dài hạn từ cả hai "ông lớn" này chính là "sự xác nhận của thị trường" đối với hướng đi công nghệ của Cerebras.
Tính đến cuối năm 2025, Cerebras có 24,6 tỷ USD giá trị hợp đồng tồn đọng, công ty kỳ vọng sẽ ghi nhận 3,7 tỷ USD doanh thu từ số này trước năm 2027. Tỷ lệ hợp đồng tồn đọng/doanh thu hiện tại khoảng 48 lần—thể hiện mức độ "nhìn thấy trước" doanh thu tương lai, nhưng cũng cho thấy Cerebras vẫn đang ở giai đoạn đầu của quá trình giao hàng quy mô lớn.
Chip wafer-scale: Lý do và giới hạn trong cuộc chiến thách thức thế độc quyền của NVIDIA
Cerebras đã chọn một hướng kỹ thuật hoàn toàn khác biệt so với NVIDIA.
NVIDIA đi theo xu hướng chủ đạo của ngành—lắp ráp chiplet. Chip được chia thành các "chiplet" chức năng như tính toán, bộ nhớ đệm, IO, sản xuất riêng biệt rồi ghép nối bằng đóng gói tiên tiến. Cách này giúp tỷ lệ thành phẩm cao, kiểm soát chi phí tốt và dễ sản xuất hàng loạt. NVIDIA B200 và Huawei Ascend đều áp dụng phương pháp này.
Cerebras lại chọn lối đi "đúc nguyên khối"—không cắt, không lắp ráp, dùng toàn bộ wafer làm một chip duy nhất. Phương án này mang lại lợi thế hiệu suất lý thuyết vượt trội cho suy luận, nhưng đối mặt với độ phức tạp sản xuất cực cao, khó kiểm soát tỷ lệ thành phẩm và thách thức xây dựng hệ sinh thái phần mềm từ đầu.
Cuộc cạnh tranh giữa hai bên thực chất là cuộc đối đầu giữa "hiệu ứng quy mô" và "hiệu suất cực đại". NVIDIA có lợi thế hệ sinh thái phần mềm CUDA hàng chục năm và năng lực sản xuất khổng lồ. Cerebras nổi bật ở khả năng tăng tốc suy luận gấp 10 lần trong một số kịch bản nhất định.
Với nhà đầu tư, câu hỏi then chốt không phải là "Cerebras có đánh bại được NVIDIA không?"—điều này gần như bất khả thi trong tương lai gần. Vấn đề thực sự là: Liệu thị trường suy luận AI có đủ lớn để nuôi dưỡng một hướng kỹ thuật độc lập, phi GPU hay không? Nếu có, sự độc nhất của Cerebras với tư cách là người duy nhất thương mại hóa hướng đi này sẽ trở thành logic định giá riêng.
Yếu tố rủi ro: Bốn thách thức lớn không thể bỏ qua
Biên lợi nhuận gộp và khả năng sinh lời còn nhiều bất định. Dự báo biên lợi nhuận quý 2 giảm mạnh từ 46,5% xuống 36%-38%, biên lợi nhuận hoạt động cốt lõi cả năm vẫn âm sâu. Công ty còn xa mới đạt được lợi nhuận bền vững. Morgan Stanley cho rằng việc sụt giảm biên lợi nhuận chỉ là tạm thời, kỳ vọng biên lợi nhuận sẽ trở lại mục tiêu 60% khi Cerebras giảm phụ thuộc vào hạ tầng thuê ngoài—nhưng điều này vẫn chưa được thị trường kiểm chứng.
Cần thời gian để xác nhận sự thay đổi cấu trúc khách hàng. Dù OpenAI và AWS đã giúp đa dạng hóa khách hàng, đơn hàng 20 tỷ USD của OpenAI vẫn chiếm tỷ trọng lớn trong hợp đồng tồn đọng (20 tỷ USD/24,6 tỷ USD). Bất kỳ thay đổi nào về tiến độ triển khai của OpenAI đều có thể tác động lớn đến doanh thu.
Áp lực cung ứng từ việc hết hạn khóa cổ phiếu. Thứ Năm tuần này (25 tháng 06), cổ phiếu IPO sẽ hết hạn khóa, giải phóng khoảng 13% lượng cổ phiếu cho các nhà đầu tư sớm và nội bộ bán ra. Lượng cổ phiếu lưu hành tăng có thể gây áp lực giảm giá ngắn hạn.
Định giá vượt xa tốc độ tăng trưởng. CBRS hiện giao dịch ở mức giá/doanh thu khoảng 91 lần, cao hơn nhiều so với mức 23 lần của NVIDIA. Các công ty tăng trưởng cao xứng đáng được định giá cao, nhưng nếu tăng trưởng chậm lại hoặc biên lợi nhuận không cải thiện, rủi ro co hẹp định giá là rất lớn.
Kết luận
Sự trỗi dậy của Cerebras là hình ảnh thu nhỏ của xu hướng nhu cầu tính toán AI dịch chuyển từ "huấn luyện" sang "suy luận". Khi huấn luyện mô hình lớn ngày càng được tiêu chuẩn hóa và mở rộng quy mô, nhu cầu tối ưu độ trễ, chi phí và hiệu suất năng lượng trong suy luận đang mở ra "cửa sổ thương mại" cho các công nghệ phi truyền thống như chip wafer-scale.
Ngay từ báo cáo tài chính đầu tiên, Cerebras đã mang lại doanh thu và đơn hàng vượt kỳ vọng, nhưng sự sụt giảm mạnh biên lợi nhuận cũng phơi bày những "cơn đau tăng trưởng" của giai đoạn mở rộng ban đầu—hạ tầng trung tâm dữ liệu vật lý chưa theo kịp đà bùng nổ nhu cầu tính toán. Đó là một "cơn đau ngọt ngào", nhưng cũng là lực cản thực sự với lợi nhuận.
Với nhà đầu tư, Cerebras không phải là "người thay thế NVIDIA", mà là "một khả năng khác cho suy luận AI". Thành bại cuối cùng của hướng đi độc lập này sẽ phụ thuộc vào hai biến số cốt lõi: liệu thị trường suy luận AI có tiếp tục mở rộng đủ nhanh để nuôi dưỡng nhiều hướng kỹ thuật khác nhau, và liệu Cerebras có thể chuyển hóa hiệu quả 24,6 tỷ USD hợp đồng tồn đọng thành doanh thu và dòng tiền dương trong giai đoạn 2026–2027 hay không.
Liệu chip wafer-scale của Cerebras có thực sự làm lung lay đế chế GPU của NVIDIA? Câu trả lời có thể chưa rõ ràng hôm nay, nhưng sẽ dần hé lộ qua từng cột mốc quan trọng trong 12–24 tháng tới: tỷ lệ chuyển đổi đơn hàng, phục hồi biên lợi nhuận và triển khai hợp tác với AWS.
Câu hỏi thường gặp
Q1: Khác biệt cốt lõi giữa chip wafer-scale WSE-3 của Cerebras và H100 của NVIDIA là gì?
WSE-3 là một tấm wafer 12 inch nguyên vẹn, không cắt, tích hợp 4 nghìn tỷ transistor và 900.000 lõi; H100 là chip truyền thống được cắt và đóng gói. Điểm khác biệt lớn nhất là kiến trúc bộ nhớ: WSE-3 có 44 GB SRAM trên chip với băng thông 21 PB/s; H100 dựa vào HBM ngoài với băng thông chỉ 3,35 TB/s. WSE-3 vượt trội về tốc độ suy luận, nhưng đi kèm độ phức tạp và chi phí sản xuất cao hơn.
Q2: Những con số chính trong báo cáo tài chính quý 1 năm 2026 của Cerebras là gì?
Doanh thu quý 1 đạt 193,4 triệu USD, tăng 94% so với cùng kỳ và vượt kỳ vọng 181,2 triệu USD; lỗ ròng 14 triệu USD, thu hẹp mạnh so với mức lỗ 23,9 triệu USD cùng kỳ năm trước; doanh thu phần cứng 110,6 triệu USD, doanh thu dịch vụ đám mây 82,8 triệu USD. Dự báo doanh thu cả năm là 855–865 triệu USD.
Q3: Vì sao cổ phiếu Cerebras giảm sau báo cáo tài chính?
Dù doanh thu và khoản lỗ đều vượt kỳ vọng, dự báo biên lợi nhuận gộp quý 2 lại giảm mạnh từ 46,5% xuống 36%-38%. Nguyên nhân chính là thiếu không gian trung tâm dữ liệu, buộc công ty phải thuê lại hệ thống từ khách hàng và đẩy mạnh mở rộng hạ tầng, khiến chi phí tăng và biên lợi nhuận giảm khoảng 10–15 điểm phần trăm. Thị trường lo ngại về khả năng sớm đạt lợi nhuận.
Q4: Những rủi ro chính của Cerebras là gì?
Bốn rủi ro lớn: biên lợi nhuận gộp giảm mạnh và khả năng sinh lời chưa rõ ràng; khách hàng vẫn tập trung cao ở OpenAI (đơn hàng 20 tỷ USD trên tổng hợp đồng tồn đọng 24,6 tỷ USD); ngày 25 tháng 06 hết hạn khóa cổ phiếu, giải phóng khoảng 13% lượng cổ phiếu IPO cho giao dịch; tỷ lệ giá/doanh thu khoảng 91 lần, cao hơn nhiều so với mức 23 lần của NVIDIA, tạo rủi ro co hẹp định giá đáng kể.




