Xiaomi เปิดซอร์ส OmniVoice โมเดลโคลนเสียงแบบ Zero-Shot รองรับ 646 ภาษา

ตามการรายงานของ Beating ทีม Kaldi ของ AI Lab ของ Xiaomi ได้ปล่อยโอเพ่นซอร์ส OmniVoice ซึ่งเป็นโมเดล TTS โคลนเสียงแบบ zero-shot รองรับ 646 ภาษา โมเดลนี้โคลนลักษณะเสียงจากเพียงไม่กี่วินาทีของเสียงอ้างอิง และทำงานได้ข้ามภาษา—เสียงเดียวสามารถสังเคราะห์คำพูดได้ทั้งภาษาจีน ญี่ปุ่น เกาหลี และภาษาอื่นๆ ทั้งหมด ทั้งโค้ด น้ำหนัก และข้อมูลการฝึก ถูกเปิดซอร์สภายใต้ใบอนุญาต Apache-2.0

OmniVoice ใช้สถาปัตยกรรมที่เรียบง่ายด้วย Transformer แบบสองทิศทางเพียงตัวเดียว ซึ่งแมปข้อความไปยังโทเคนเสียงเชิงไม่ต่อเนื่องโดยตรง ทำให้การอนุมานเร็วกว่าเรียลไทม์ถึง 40 เท่าใน PyTorch โมเดลนี้ฝึกบนข้อมูลเสียง 580,000 ชั่วโมงจาก 50 ชุดข้อมูลโอเพ่นซอร์ส OmniVoice ทำผลงานได้ดีกว่าระบบเชิงพาณิชย์ในด้านความเหมือนของเสียงและความเข้าใจได้ใน 24 ภาษา ที่ทดสอบ และทำได้เท่าหรือเหนือกว่าการบันทึกของมนุษย์ใน 102 ภาษา

news.article.disclaimer

btc.bar.articles

DMG Blockchain จัดตั้งบริษัทย่อย DMG Infrastructure เพื่อดำเนินงานด้าน AI และ HPC

ตาม BlockBeats เมื่อวันที่ 9 พฤษภาคม บริษัทขุด Bitcoin อย่าง DMG Blockchain ได้จัดตั้งบริษัทย่อย DMG Infrastructure เพื่อดำเนินธุรกิจด้านปัญญาประดิษฐ์และการประมวลผลสมรรถนะสูง (HPC) บริษัทมีแผนจะปรับเปลี่ยนศูนย์ข้อมูลไปสู่บริการด้าน AI และ HPC DMG Blockchain ผลิตได้ 21 BTC ในเดือนเมษายน ลดลงจาก 23 BTC ในเดือนมีนาคม

GateNews15 ชั่วโมง ที่แล้ว

Spotify เปิดตัวฟีเจอร์พ็อดแคสต์ส่วนตัวที่สร้างด้วย AI วันนี้ พร้อมให้บันทึกลงไลบรารีได้

ตามรายงานของ MacRumors Spotify ได้เปิดตัวฟีเจอร์ใหม่วันนี้ (8 พฤษภาคม) ที่ให้ผู้ใช้สร้างและบันทึกพอดแคสต์ส่วนตัวที่ขับเคลื่อนด้วย AI ได้โดยตรงลงในคลังของ Spotify ผู้ใช้สามารถติดตั้งและเข้าสู่ระบบ “Save to Spotify CLI” บนเดสก์ท็อป จากนั้นใช้เอเจนต์สำหรับการเขียนโค้ดด้วย AI จาก OpenAI, Anthropic และอื่นๆ ได้

GateNews05-08 14:46

Benzinga เปิดตัวเอ็นจินแปลภาษาเกาหลี และชุดข้อมูลทางการเงินสำหรับ AI จำนวน 400 ล้านคำ

ตามรายงานของบริษัท Benzinga ได้เปิดตัวเครื่องมือแปลภาษาเกาหลี และชุดข้อมูลการเงินภาษาเกาหลีขนาดใหญ่สำหรับการฝึก AI เมื่อไม่นานมานี้ ระบบดังกล่าวจะแปลข่าวตลาดสหรัฐเป็นภาษาเกาหลีแบบเรียลไทม์ โดยยังคงรักษาศัพท์การเงิน การอ้างอิงทิกเกอร์ และบริบทของตลาดไว้ The

GateNews05-08 11:32

FLock.io เข้าร่วมการประชุม Oxford Roundtable เพื่อผลักดันความร่วมมือ Sarawak Sovereign AI MoU

ตามรายงานของ Foresight News, FLock.io เข้าร่วมการหารือโต๊ะกลมของมหาวิทยาลัยออกซ์ฟอร์ด เพื่อผลักดันบันทึกความเข้าใจ 3 ฝ่ายเกี่ยวกับการพัฒนา AI อธิปไตยของซาราวัก การหารือเน้นประเด็นความเป็นเจ้าของข้อมูล การร่วมมือด้าน AI การกำกับดูแลด้านความมั่นคงของข้อมูล และฮาร์ดแวร์

GateNews05-08 11:01

WORLD3 เปิดตัว RouterLink AI Routing Network วันนี้ รองรับโมเดลมากกว่า 68 รายการ รวมถึง GPT-5.5 และ Claude Opus 4.7

ตาม ChainCatcher, WORLD3 ได้เปิดตัวเครือข่ายการกำหนดเส้นทาง AI แบบกระจายอำนาจ RouterLink วันนี้ ซึ่งช่วยให้ใช้โดเมนถาวร routerlink.ai ได้ แพลตฟอร์มดังกล่าวรองรับโมเดล 68+ รายการจากผู้ให้บริการ 20+ ราย ด้วยอัตราการให้บริการต่อเนื่อง 99.9% และความเร็วในการชำระเงินรายวันสูงกว่า 1.5 ล้านดอลลาร์สหรัฐในโทเค็น $WAI . The live

GateNews05-08 06:20

LG CNS เปิดตัวแพลตฟอร์ม PhysicalWorks สำหรับการจัดการกองหุ่นยนต์แบบผสมผสาน

LG CNS ซึ่งเป็นหน่วยบริการด้านไอทีของ LG Group ในเกาหลีใต้ เปิดตัวแพลตฟอร์ม PhysicalWorks เพื่อฝึกอบรมและบริหารจัดการกองยานยนต์ผสมหลากหลายด้วยซอฟต์แวร์แบบชั้นเดียวที่รวมการทำงานไว้ในที่เดียว ตามรายงานของ The Korea Herald ในการสาธิต หุ่นยนต์ 4 ตัวจาก Unitree, Deep Robotics, Dexmate และ Bear Robotics ได้เคลื่อนย้ายกล่อง

CryptoFrontier05-08 05:01
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น