2026-05-18 11:57:46
テンセントがChronicles-OCRをリリース、最初の古代文字認識ベンチマーク、GPT-5とGemini 2.5はいずれもスコアはほぼゼロ
TencentのHunyuanとSSV Digital Culture Labは、中国科学院の計算技術研究所(Institute of Computing Technology)との共同により、5月18日にChronicles-OCRを公開しました。これは、甲骨文字から草書体までの7種類の古代書体を対象とした、最初の評価ベンチマークです。このベンチマークには、専門家による注釈付き画像2,800枚が含まれています。 28の主流マルチモーダル大規模言語モデルを用いた検証では、古代文字での性能が低いことが示されました。GPT-5とGemini 2.5 Proは、時代をまたぐ文字検出でほぼ0点を達成した一方で、最も良いモデルでも16.5にとどまりました。位置情報のためのバウンディングボックスが提供され、ローカライゼーションを省略できた場合でも、最高精度は27.1%で、Gemini 3.1 Proは甲骨文字でわずか14.0%を記録しました。