Tencent випускає Chronicles-OCR — перший бенчмарк розпізнавання стародавніх символів; оцінки GPT-5 і Gemini 2.5 майже нульові

Tencent Hunyuan і SSV Digital Culture Lab у співпраці з Інститутом обчислювальної техніки Китайської академії наук випустили Chronicles-OCR 18 травня — перший оцінювальний бенчмарк, що охоплює сім давніх стилів шрифтів від письма на кістках оракула до скоропису. Бенчмарк містить 2 800 зображень із експертною анотацією.

Тестування 28 найпоширеніших мультимодальних великомовних моделей показало низьку продуктивність на давніх символах. GPT-5 і Gemini 2.5 Pro досягли майже нульових результатів у виявленні символів між різними епохами, тоді як найкраща модель показала лише 16,5. Навіть якщо надати bounding boxes, щоб пропустити локалізацію, найвища точність становила 27,1%, а Gemini 3.1 Pro досяг лише 14,0% для письма на кістках оракула.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів