Сообщение Gate News, 27 апреля — Логан Килпатрик, старший менеджер по продуктам в Google DeepMind и руководитель продуктового направления Google AI Studio, заявил в X, что каждая компания, создающая продукты на основе ИИ, должна разработать свои собственные индивидуальные бенчмарки для измерения эффективности ИИ-моделей. Он описал это как метод, позволяющий тому, чтобы улучшения модели «несоразмерно приносили выгоду вашей компании», и призвал основателей и руководителей бизнеса «начать уже завтра».

Большинство компаний сейчас полагаются на публичные лидерборды для выбора ИИ-моделей, но они измеряют общие возможности, которые часто не соответствуют конкретным сценариям бизнеса. Килпатрик привел пример компании по проверке контрактов, которая больше всего обеспокоена точностью извлечения пунктов — возможностью, отсутствующей в публичных бенчмарках, из-за чего невозможно оценить эффективность модели при выполнении этой задачи. Индивидуальные бенчмарки дают два ключевых преимущества: во-первых, они позволяют компаниям оценивать каждое обновление модели по своим бизнес-задачам и выбирать ту модель, которая лучше всего работает в их реальном сценарии использования, а не ту, что занимает наивысшее место в общем рейтинге; во-вторых, они позволяют компаниям делиться этими наборами тестов с поставщиками моделей, что способствует постоянной оптимизации в тех областях, которые важны для их бизнеса.

Килпатрик отметил, что такие компании, как Zapier и Sierra, уже внедряют этот подход, заявив, что «здесь можно создать много „альфы“».

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-27 03:21

OpenAI сотрудничает с MediaTek и Qualcomm для разработки процессора AI для смартфонов; Foxconn Connector начнет производство в 2028 году

04-27 01:13

Сэм Альтман обозначает пять операционных принципов OpenAI, сигнализирует о возможных будущих ограничениях на доступ к возможностям моделей ради безопасности

04-24 12:21

Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов

04-24 09:01

Xpeng и Xiaomi лидируют в продвижении автомобильного ИИ на Пекинском автосалоне

04-24 08:13

Инженер OpenAI Клайв Чан оспаривает рекомендации по оборудованию в V4, указывая на ошибки и расплывчатость по сравнению с V3

Детальный анализ

MediaTek заполучила крупный заказ Google на восьмое поколение TPU! ASIC стимулирует рост в трех секторальных акциях, которые получат выгоду

ChainNewsAbmedia04-27 03:57

JPMorgan: Токенизация изменит индустрию фондов, но «хорошие варианты использования» появятся через несколько лет

Crypto Frontier04-26 16:19

ИИ-агент уже может независимо воспроизводить сложные научные статьи: Mollick считает, что ошибки чаще бывают в человеческом исходном тексте, а не в ИИ

ChainNewsAbmedia04-26 03:34

комментарий

0/400

Нет комментариев