ElevenLabs และ Stability AI เปิดตัวโมเดลใหม่สำหรับการสร้างเพลงด้วย AI สัปดาห์นี้ โดยทั้งคู่เน้นย้ำถึงข้อมูลสำหรับการฝึกที่ได้รับอนุญาต ท่ามกลางคดีความด้านลิขสิทธิ์ที่ยังดำเนินอยู่ในอุตสาหกรรม ElevenLabs บริษัท AI ด้านเสียงที่ก่อตั้งในโปแลนด์ มีมูลค่า 11 พันล้านดอลลาร์ หลังระดมทุน Series D มูลค่า 500 ล้านดอลลาร์ ในเดือนกุมภาพันธ์ ได้เปิดตัว Music v2 ขณะที่ Stability AI ปล่อย Stable Audio 3.0 ซึ่งเป็นตระกูลโมเดล 4 แบบ โดยให้ open weights สำหรับ 3 เวอร์ชันที่สร้างแทร็กได้ยาวสูงสุด 6 นาที 20 วินาที การเปิดตัวครั้งนี้เกิดขึ้นหลังจากสมาคมอุตสาหกรรมบันทึกเสียงแห่งสหรัฐอเมริกา (Recording Industry Association of America) ยื่นฟ้องคดีลิขสิทธิ์ในปี 2024 ต่อแพลตฟอร์มเพลงด้วย AI อย่าง Suno และ Udio ทำให้ข้อมูลสำหรับการฝึกที่ได้รับอนุญาตกลายเป็นจุดศูนย์กลางของแนวทางเข้าสู่ตลาดสำหรับผู้เล่นรายใหม่ ElevenLabs ได้ทำข้อตกลงด้านไล선ส์กับ Believe, Kobalt และ Merlin ขณะที่ Stability AI ร่วมมือกับ Warner Music Group และ Universal Music Group Suno ซึ่งมีมูลค่า 2.45 พันล้านดอลลาร์ ณ เดือนพฤศจิกายน 2025 ทำรายได้ recurring รายปีทะลุ 300 ล้านดอลลาร์ และถูกใช้งานโดยผู้คนประมาณ 100 ล้านคน สร้างเพลงได้ราว 7 ล้านเพลงต่อวัน
Music v2 เป็นโมเดลเพลงรุ่นที่ 2 ของ ElevenLabs โดยมาถึงราว 10 เดือนหลังจากเวอร์ชันแรก โมเดลนี้สามารถเปลี่ยนแนวเพลงภายในแทร็กเดียว—from โอเปร่า ไปเป็น heavy metal และย้อนกลับ—ขณะเดียวกันยังคงความสอดคล้องขององค์ประกอบเพลงไว้ได้ ตามที่ ElevenLabs ระบุ โมเดลสามารถจัดการ rap ที่มาเร็ว และฝังเอฟเฟกต์เสียงที่ไม่ใช่ดนตรีได้โดยที่องค์ประกอบเพลงไม่พังทลาย
โมเดลมีความสามารถแบบ inpainting ทำให้ผู้ใช้สามารถเลือกและสร้างส่วนเฉพาะใหม่อีกครั้ง โดยยังปล่อยส่วนที่เหลือของแทร็กไว้ไม่เปลี่ยนแปลง ผู้ใช้สามารถประกอบเพลงแบบเป็นช่วงๆ—intro, verse, chorus—โดยโมเดลยังคงความต่อเนื่องตลอดทั้งงาน แทนที่จะมองคลิปแต่ละชิ้นเป็นการสร้างแบบแยกเดี่ยว การรองรับหลายภาษาได้รับการปรับปรุงแล้ว แม้ ElevenLabs จะไม่ได้เผยรายละเอียดเฉพาะเจาะจง
Music v2 ขับเคลื่อน 3 แพลตฟอร์ม: ElevenMusic สำหรับครีเอเตอร์, ElevenAPI สำหรับนักพัฒนา และ ElevenCreative สำหรับแบรนด์ ตอนนี้โมเดลพร้อมใช้งานบน ElevenMusic และ ElevenCreative แล้ว การเข้าถึงผ่าน API เปิดให้ในช่วง early entry ผ่านทีมขาย
ElevenLabs ลดราคาของ Music v1 และ v2 ลงได้ถึง 50% สำหรับ ElevenAPI และสูงสุด 40% สำหรับ ElevenCreative แบบ self-serve บริษัททำรายได้ recurring รายปีได้ 500 ล้านดอลลาร์ ในเดือนเมษายน 2026 ElevenMusic เปิดตัวเป็นแอปสำหรับผู้บริโภคในเดือนเมษายน
Stable Audio 3.0 มีโมเดล 4 แบบ: Small SFX (เอฟเฟกต์เสียงบนอุปกรณ์), Small (องค์ประกอบเพลงแบบเต็มบนอุปกรณ์), Medium (สูงสุด 6:20 ต้องใช้ฮาร์ดแวร์ที่แรงกว่า) และ Large (สำหรับ API เท่านั้น) โมเดล 3 ใน 4 แบบมี open weights ให้ใช้งานบน Hugging Face เวอร์ชันก่อนหน้าอย่าง Stable Audio 2.0 สร้างแทร็กได้ยาวสูงสุด 3 นาที
โมเดล Small ใช้งานพารามิเตอร์ 459 ล้านพารามิเตอร์ต่อโมเดล โดยไม่ต้องใช้ GPU ส่วน Medium ทำงานที่ 1.4 พันล้านพารามิเตอร์ และสร้างเอาต์พุต 6:20 ในเวลาประมาณ 1.31 วินาทีบน GPU H200 ขณะที่ Large ใช้ 2.7 พันล้านพารามิเตอร์ และเป็น API เท่านั้นสำหรับองค์กรที่มีรายได้เกิน 1 ล้านดอลลาร์ โมเดลรองรับความละเอียดระดับต่อวินาที ช่วยสร้างแทร็กได้ยาวตามความยาวที่ร้องขอแบบพอดี
สถาปัตยกรรมใช้ semantic-acoustic autoencoder ที่ Stability เรียกว่า SAME ออกแบบมาเพื่อรักษาความสอดคล้องของทำนองในเอาต์พุตที่ยาวขึ้น รองรับการ fine-tuning ด้วย LoRA ทำให้นักสร้างสรรค์สามารถปรับโมเดลให้เข้ากับแคตตาล็อกของตัวเองได้ ความสามารถแบบ inpainting รองรับทั้ง single-segment, multi-segment และ causal continuation เพื่อขยายแทร็กให้ยาวเกินจุดสิ้นสุดเดิม โมเดลรองรับการใช้งานใน ComfyUI สำหรับการตั้งค่าระบบภายในเครื่อง
Suno ทำ valuation 2.45 พันล้านดอลลาร์ ในเดือนพฤศจิกายน 2025 และทำรายได้ recurring รายปีทะลุ 300 ล้านดอลลาร์ Warner Music ได้ยุติคดีที่ยื่นต่อ Suno ในเดือนพฤศจิกายน 2025 ขณะที่ Sony และ Universal Music Group ยังคงอยู่ระหว่างการพิจารณาคดีในศาลรัฐบาลกลางร่วมกับ Suno
Udio ได้ยุติข้อพิพาทกับค่ายเพลงรายใหญ่ทั้ง 3 และดำเนินการแบบ walled garden—เนื้อหาที่สร้างบนแพลตฟอร์มห้ามส่งออก
โมเดล Stable Audio 3.0 แบบ Small และ Medium พร้อมใช้งานบน Hugging Face ส่วน Large ใช้งานได้ผ่าน Stability AI API แล้ว Music v2 ฟรีสำหรับผู้ใช้ ElevenMusic โดยมีแผนระดับเชิงพาณิชย์สำหรับ ElevenCreative และ ElevenAPI
news.related.news
ElevenLabs ออกใบอนุญาตเสียงของ Stan Lee สำหรับแพลตฟอร์มนำเสนอเรื่องด้วย AI
มูลนิธิ OpenAI ให้คำมั่น $250M เพื่อรับมือกับความปั่นป่วนทางเศรษฐกิจจาก AI
Stake DAO ประสบการโจมตีอย่างต่อเนื่องหลังจากมีการมินต์ vsdCRV มูลค่า 5.4 ล้านล้านดอลลาร์สหรัฐ
MiniCPM5-1B: โมเดล 1B พารามิเตอร์รันเอเจนต์แบบออฟไลน์บนโทรศัพท์ได้
Stable เปิดตัว StableEarn ผลิตภัณฑ์รายได้จากคลังเงินทุน (Treasury Yield)