Tencent Hunyuan і SSV Digital Culture Lab у співпраці з Інститутом обчислювальної техніки Китайської академії наук випустили Chronicles-OCR 18 травня — перший оцінювальний бенчмарк, що охоплює сім давніх стилів шрифтів від письма на кістках оракула до скоропису. Бенчмарк містить 2 800 зображень із експертною анотацією.
Тестування 28 найпоширеніших мультимодальних великомовних моделей показало низьку продуктивність на давніх символах. GPT-5 і Gemini 2.5 Pro досягли майже нульових результатів у виявленні символів між різними епохами, тоді як найкраща модель показала лише 16,5. Навіть якщо надати bounding boxes, щоб пропустити локалізацію, найвища точність становила 27,1%, а Gemini 3.1 Pro досяг лише 14,0% для письма на кістках оракула.
Пов’язані новини
Samsung та Intel атакують разом, TSMC відкриває 18 цехів у рамках найбільшого в історії плану розширення потужностей! Акції з виробничих матеріалів для заводів отримають вигоду
Charms.ai завершив 1,5 мільйона інвестицій і запустив AI-економіку для персонажів; у Пенсільванії подали в суд на Character.ai за надання медичних послуг
Прорив у розвитку Edge AI: TetraMem опублікувала результати MLX200-платформи, створеної на основі чипа TSMC 22 нм