Google запускає Gemini 3.1 Flash TTS із покращеним емоційним вираженням і багатоголосими можливостями

Повідомлення Gate News, 17 квітня — Google представила Gemini 3.1 Flash TTS, вдосконалену модель тексту в мовлення з розширеними функціями емоційного вираження та керування, 15 квітня. Нову модель буде поступово впроваджено через API для розробників, корпоративний Vertex AI та інструменти для співпраці.

Ключові можливості моделі включають аудіотеги на основі природної мови для точного налаштування швидкості, інтонації та емоції, а також “Director Mode” для вказання сцен і ролей персонажів, щоб генерувати більш нюансовані голосові результати. Багатоголосий режим дає змогу одночасно генерувати діалоги, дозволяючи природніші сценарії розмов, що підходять для подкастів, аудіоконтенту та ШІ-асистентів. Модель підтримує понад 70 мов і діалектів, відображаючи регіональні акценти та вирази для локалізованого голосового досвіду в усьому світі.

Google наголосила на продуктивності та економічній ефективності: досягнено високих показників на сліпих бенчмарках людської оцінки, водночас зменшено обчислювальні витрати завдяки архітектурі Flash — розробленій для масштабованого корпоративного впровадження. Згенерований аудіоконтент містить водяний знак SynthID для ідентифікації контенту, створеного ШІ, та боротьби з дезінформацією.

Цей крок відображає загострення конкуренції в голосових інтерфейсах. OpenAI поєднує функції голосу в реальному часі з розмовним ШІ для взаємодії, схожої на людську, тоді як Meta розширює інвестиції в ШІ-персонажів із соціальним досвідом на основі голосу. Аналітики галузі зазначають, що хоча високорівнева акторська майстерність і творча робота можуть і надалі залишатися керованими людьми, ринки повторюваного та великомасштабного виробництва можуть поступово переходити до використання ШІ в дубляжі, рекламі та сегменті аудіокниг.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів