Trajectory เปิดตัวแพลตฟอร์ม SkyRL แบบโอเพนซอร์ส และทำได้การปรับปรุงประสิทธิภาพการทำงานขึ้น 2.81x

ตาม OneMillion_AI, Trajectory โดยร่วมมือกับ Sky Computing Lab ของ UC Berkeley และ Anyscale ได้ประกาศล่าสุดแพลตฟอร์มโอเพนซอร์ส SkyRL และสถาปัตยกรรม Multi-LoRA Training สำหรับการปรับแต่งโมเดลภาษาขนาดใหญ่ (fine-tuning) ระบบนี้แก้ปัญหาความไม่มีประสิทธิภาพของการเพิ่มประสิทธิภาพโมเดลแบบดั้งเดิม โดยคงฐานโมเดลที่ใช้ร่วมกันไว้ในหน่วยความจำ GPU ขณะเดียวกันก็มองการทดลอง fine-tuning หลายรายการเป็นโมดูลแอดาเตอร์ที่มีน้ำหนักเบา การทดสอบพบว่าอัตราการประมวลผลต่อกระบวนการตั้งแต่ต้นจนจบ (end-to-end) ดีขึ้น 2.81 เท่า โดยอัตราการประมวลผลแบบเวลาจริงต่อโหนดเดียว (single-node absolute time throughput) ดีขึ้นถึง 3.25 เท่า ทำให้โมเดลขนาดใหญ่สามารถทำ self-evolution ระดับรายชั่วโมงผ่านข้อมูลการผลิตแบบเรียลไทม์ได้ โค้ดการฝึกพร้อมให้ใช้งานแล้วในที่เก็บ SkyRL (SkyRL repository)
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น