A Tencent lança Chronicles-OCR, primeiro benchmark de reconhecimento de caracteres antigos, GPT-5 e Gemini 2.5 pontuam quase zero

Tencent Hunyuan e o SSV Digital Culture Lab, em colaboração com o Instituto de Tecnologia da Computação da Academia Chinesa de Ciências, lançaram Chronicles-OCR em 18 de maio, o primeiro benchmark de avaliação que cobre sete estilos de fontes antigas, do roteiro de ossos de oráculo até a escrita cursiva. O benchmark contém 2.800 imagens anotadas por especialistas.

Os testes com 28 modelos grandes multimodais de linguagem amplamente usados mostraram desempenho fraco em caracteres antigos. GPT-5 e Gemini 2.5 Pro obtiveram quase zero nas pontuações de detecção entre eras, enquanto o modelo com melhor desempenho alcançou apenas 16,5. Mesmo com caixas delimitadoras fornecidas para pular a localização, a maior acurácia foi de 27,1%, com Gemini 3.1 Pro atingindo apenas 14,0% no roteiro de ossos de oráculo.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários