Resemble AI Phát hành DramaBox, mô hình tạo lời thoại có thể kiểm soát cấp độ giám đốc, trên Hugging Face hôm nay

ON1,18%
PROMPT0,63%
IN-0,17%

Theo Beating, Resemble AI đã phát hành DramaBox, một mô hình tạo lời thoại, trên Hugging Face vào hôm nay. Mô hình có khả năng kiểm soát cấp độ đạo diễn thông qua cú pháp prompt tách riêng—người dùng nhập thoại trong dấu ngoặc kép, đồng thời chỉ định các chỉ dẫn sân khấu như thở dài, ngắt quãng hoặc thì thầm nằm ngoài dấu ngoặc kép. Mô hình chuyển các chỉ dẫn này thành lời thoại có sắc thái cảm xúc thay vì đọc chúng thành tiếng.

DramaBox hỗ trợ tạo giọng nói theo yêu cầu từ đầu (zero-shot voice cloning) chỉ với 10 giây dữ liệu âm thanh tham chiếu và cho phép dùng prompt bằng ngôn ngữ tự nhiên để thiết lập tuổi nhân vật, giọng địa phương và cảm xúc. Âm thanh đầu ra đạt chất lượng studio stereo 48kHz. Tất cả âm thanh được tạo đều có watermark Perth vô hình, chống chịu tốt với nén MP3 và các thao tác chỉnh sửa âm thanh tiêu chuẩn nhằm ngăn lạm dụng deepfake.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận