Google Ra Mắt Gemini 3.1 Flash TTS với Khả Năng Thể Hiện Cảm Xúc Nâng Cao và Hỗ Trợ Nhiều Người Nói

Tin nhắn Gate News, ngày 17 tháng 4 — Google đã công bố Gemini 3.1 Flash TTS, một mô hình nâng cao chuyển văn bản thành giọng nói với các tính năng thể hiện cảm xúc và kiểm soát được tăng cường, vào ngày 15 tháng 4. Mô hình mới sẽ được triển khai dần dần thông qua các API dành cho nhà phát triển, Vertex AI cho doanh nghiệp và các công cụ cộng tác.

Các khả năng cốt lõi của mô hình bao gồm các thẻ âm thanh dựa trên ngôn ngữ tự nhiên để tinh chỉnh tốc độ, ngữ điệu và cảm xúc, cùng với “Director Mode” để chỉ định cảnh và vai trò nhân vật nhằm tạo ra các đầu ra giọng nói tinh tế hơn. Tính năng nhiều người nói cho phép tạo hội thoại đồng thời, giúp luồng trò chuyện tự nhiên hơn, phù hợp cho podcast, nội dung âm thanh và trợ lý AI. Mô hình hỗ trợ hơn 70 ngôn ngữ và phương ngữ, phản ánh giọng và cách diễn đạt theo khu vực cho trải nghiệm giọng nói được bản địa hóa trên toàn cầu.

Google nhấn mạnh hiệu năng và tối ưu chi phí, đạt điểm cao trên các chuẩn đánh giá con người mù trong khi giảm chi phí tính toán nhờ kiến trúc Flash—được thiết kế cho việc triển khai doanh nghiệp quy mô lớn. Âm thanh được tạo ra bao gồm gắn watermark SynthID để nhận diện nội dung do AI tạo ra và chống lại tin giả.

Động thái này phản ánh sự cạnh tranh ngày càng gay gắt trong các giao diện giọng nói. OpenAI đang kết hợp các tính năng giọng nói thời gian thực với AI hội thoại để tạo ra tương tác giống con người, trong khi Meta đang mở rộng đầu tư vào các nhân vật AI với trải nghiệm xã hội dựa trên giọng nói. Các nhà quan sát trong ngành cho rằng dù hoạt động diễn xuất cấp cao và công việc sáng tạo có thể vẫn do con người dẫn dắt trong hiện tại, nhưng các thị trường sản xuất lặp lại và quy mô lớn có thể sẽ chứng kiến việc AI dần được áp dụng trong các lĩnh vực lồng tiếng, quảng cáo và sách nói.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Giám đốc điều hành Google DeepMind: Mọi công ty sản phẩm AI đều nên xây dựng các bộ chuẩn tùy chỉnh

Tin tức Gate ngày 27 tháng 4 — Logan Kilpatrick, quản lý sản phẩm cấp cao tại Google DeepMind và là người phụ trách sản phẩm của Google AI Studio, cho biết trên X rằng mọi công ty đang xây dựng các sản phẩm dựa trên AI đều nên thiết lập các bộ chuẩn tùy chỉnh của riêng mình để đo hiệu suất của mô hình AI. Ông mô tả đây là một cách để

GateNews32phút trước

MediaTek giành được đơn hàng lớn TPU thế hệ thứ 8 của Google! ASIC thúc đẩy nhóm cổ phiếu liên quan trong 3 mã được hưởng lợi

MediaTek đã tham gia vào chuỗi cung ứng chip huấn luyện TPU thế hệ thứ 8 của Google, phụ trách thiết kế I/O Die, và sử dụng công nghệ N3P của TSMC cùng đóng gói CoWoS-S, cho thấy hãng đã nâng mình lên trình độ thiết kế AI ASIC cao cấp. Dự kiến doanh thu ASIC trong năm nay sẽ vượt 1 tỷ USD, số lượng TPU xuất xưởng đến năm 2027 có khả năng đạt hàng chục triệu chiếc; chuỗi cung ứng Đài Loan như King Yuan Electronics, iST, Hon Hai… cũng sẽ được hưởng lợi, thị trường dần chuyển sang hợp tác phân công và tương lai của chiplet, tích hợp dị chất.

ChainNewsAbmedia48phút trước

RE:AI của Singtel hợp tác với Mistral AI để phát triển hạ tầng AI tại Singapore

Tin tức từ cổng, ngày 27 tháng 4 — Tập đoàn Singtel đã công bố rằng RE:AI, đơn vị hạ tầng kỹ thuật số tại Singapore của họ, đã hợp tác với Mistral AI để hỗ trợ năng lực AI cho các ngành tại Singapore. Quan hệ đối tác này sẽ tập trung vào việc đồng phát triển hạ tầng AI và giải pháp cho ngành dịch vụ tài chính

GateNews1giờ trước

He Yi's YZi Labs Đầu Tư vào Công Ty Mô Hình Ngôn Ngữ Lớn AI của Trung Quốc

Tin tức từ Gate, ngày 27 tháng 4 — He Yi, cùng với văn phòng gia đình của Changpeng Zhao là YZi Labs, đã đầu tư vào một công ty mô hình ngôn ngữ lớn trí tuệ nhân tạo của Trung Quốc, cô tiết lộ trong một buổi gặp riêng dành cho KOL tại Carnival Web3 Hồng Kông. Tên cụ thể của công ty được đầu tư không được tiết lộ.

GateNews1giờ trước

OpenAI hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý AI cho điện thoại thông minh, Foxconn Connector sẽ bắt đầu sản xuất vào năm 2028

Tin cổng thông tin, ngày 27 tháng 4 — OpenAI đang hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý cho điện thoại thông minh, theo phân tích chuỗi cung ứng của nhà phân tích Ming-Chi Kuo thuộc Tianfeng International Securities. Foxconn Connector (Luxshare Precision) sẽ đảm nhiệm vai trò là đối tác thiết kế hệ thống độc quyền và

GateNews1giờ trước

MiniMax-W niêm yết tại Hồng Kông giảm hơn 14%, Zhipu giảm hơn 6% khi ra mắt mẫu hình của DeepSeek

Tin tức từ cổng, ngày 27 tháng 4 — MiniMax-W niêm yết tại Hồng Kông giảm hơn 14% trong ngày, trong khi Zhipu giảm hơn 6% trong cùng phiên. Sự sụt giảm diễn ra sau khi DeepSeek ra mắt một mẫu hình mới vào thứ Sáu và công bố các ưu đãi khuyến mãi trong thời gian giới hạn vào

GateNews1giờ trước
Bình luận
0/400
Không có bình luận