Google Gemini 3 Deep Think Велике оновлення: здатність до логічних висновків перевищує Opus 4.6, GPT-5.2, прагне стати «найбільш дослідницьким AI»

BTC-1,8%

Google випустила значне оновлення Gemini 3 Deep Think, яке у тесті ARC-AGI-2 показало результат 84,6%, суттєво перевищивши Claude Opus 4.6 (68,8%) та GPT-5.2 (52,9%), одночасно досягнувши рівня «легендарного майстра» у Codeforces.
(Попередній огляд: З’явилася модель ChatGPT для навчання: західний закат або нова ера освіти?)
(Додатковий контекст: Google офіційно презентувала «Gemini 3»! Що робить цю модель найрозумнішою у світі?)

Зміст статті

  • Не лише тестування, а й виявлення людських помилок
  • Зміни у ринкових долях
  • Вплив на криптоіндустрію
  • Науковий етап перемоги тільки починається

13-го числа Google оголосила про значне оновлення Gemini 3 Deep Think. У тесті ARC-AGI-2, спеціально розробленому для перевірки здатності моделей логічно мислити без заздалегідь заданих правил, Gemini 3 Deep Think набрав 84,6%.

Для порівняння, Claude Opus 4.6 (у режимі Thinking Max) отримав 68,8%, GPT-5.2 (у режимі Thinking xhigh) — 52,9%, а середня оцінка людських тестувальників становить близько 60%.

Ще більш вражаюче, що на базовій версії ARC-AGI-1 Deep Think показав результат 96%, фактично досягши межі тесту, який раніше вважався одним із найскладніших для штучного інтелекту.

Зараз Deep Think доступний підписникам Google AI Ultra, а API — для раннього доступу підприємствам.

Не лише тестування, а й виявлення людських помилок

Крім результатів, у повідомленні Google згадано один цікавий випадок: Deep Think під час рецензування математичної статті, що пройшла незалежне рецензування, виявив логічну помилку, яку раніше не помітили всі рецензенти. Статтю підтвердили математики з Університету Рутгерса.

Цей випадок важливий тим, що він демонструє здатність моделі працювати не лише у стандартних тестах, а й у реальних наукових сценаріях. Рецензування — це ключовий механізм контролю якості в науці, і якщо AI може стабільно допомагати у цьому процесі, це суттєво прискорить наукові дослідження, перевищуючи будь-які результати тестів.

Deep Think також досягнув рівня золотої медалі на Міжнародній фізичній олімпіаді 2025 року та Міжнародній хімічній олімпіаді, а у рейтингу Elo на Codeforces має 3455 балів, що відповідає рівню «легендарного майстра», і лише кілька людських програмістів у світі досягають такого рівня.

Ще один рекорд — у «останньому іспиті людства» (Humanity’s Last Exam), створеному експертами з різних галузей, щоб ускладнити завдання для AI, Deep Think отримав 48,4% без використання інструментів.

Зміни у ринкових долях

Конкуренція між трьома гігантами AI змінює розподіл ринку. Частка ChatGPT з пікових 87% знизилася до приблизно 68%, тоді як Gemini стрімко зросла з менш ніж 5% до понад 18%, а Claude від Anthropic поступово захоплює корпоративний сегмент.

Унікальна перевага Google — це можливість поширення. Gemini інтегрована у Android, Chrome, Google Workspace та пошукову систему, що дозволяє навіть при рівності можливостей з конкурентами залучати користувачів через канали.

Однак перевага у поширенні — двосічний меч. Якщо досвід користування Gemini буде незадовільним, вона може швидше за будь-який інший продукт втратити довіру користувачів, оскільки вони «пасивно контактують», а не «свідомо обирають». Користувачі OpenAI платять за послуги, тому мають вищу толерантність і лояльність.

Вплив на криптоіндустрію

Кожне оновлення у гонці озброєнь AI підвищує попит на обчислювальні ресурси. Вартість навчання передових моделей зросла з сотень мільйонів доларів у 2024 році до кількох мільярдів у 2026-му. Це безпосередньо впливає на два напрямки.

Перший — трансформація майнерів біткоїна. Коли прибутковість майнінгу знижується (згідно з оцінками JPMorgan, вартість виробництва BTC знизилася до 77 тисяч доларів, тоді як ціна коливається біля 66 тисяч), майнери з великими обчислювальними потужностями швидко переключаються на AI-обчислювальні послуги.

Замість «виходу з ринку» вони «перекваліфікуються», перетворюючись із майнерів біткоїна на постачальників AI-обчислень за контрактами.

Другий — нарратив навколо AI-токенів. Коли Google, OpenAI або Anthropic випускають значущі оновлення, на блокчейні з’являються короткострокові спекуляції навколо AI-активів (децентралізованих протоколів обчислень).

Однак фундаментальні проблеми цих токенів залишаються: децентралізовані обчислення ще далекі від потреб корпоративного рівня для тренування AI. Нарратив може швидко розвиватися, але інфраструктура — ні.

Науковий етап перемоги тільки починається

Оновлення Deep Think повернуло Google у лідери AI-гонки, принаймні у сфері логіки та науки. Але якщо уважно прочитати заяву Google, помітно тонкий зсув у позиціонуванні: тепер вони не акцентують увагу на «найрозумнішому універсальному AI», а знову і знову підкреслюють «створений для науки».

Коли стандарти універсального AI стають все більш насиченими та важко відрізнити один від одного, цінність «мій AI допомагає у наукових дослідженнях» стає переконливішою за «мій AI має найвищі бали у тестах». Якщо Deep Think зможе стабільно підтримувати рецензентів, прискорювати відкриття ліків або знаходити людські прогалини у фізичних моделях, це матиме значення більше за будь-який рейтинг.

Проблема у тому, що перехід від «може набрати високий бал у тесті» до «може надійно допомагати у реальній науці» може бути більш віддаленим, ніж натякає Google, адже тестові завдання мають стандартні відповіді, а наука — ні.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Гарвард продає 21% Bitcoin, отримує 86,8 мільйонів доларів від ставки на Ethereum

_Гарвард скоротив свою частку у Bitcoin ETF на 21%, відкривши позицію у Ethereum ETF у звітах за четвертий квартал._ _Bitcoin залишився найбільшим криптовалютним активом Гарварду, незважаючи на різке падіння ціни та зменшення експозиції._ _Фонд також перебудував портфель технологічних акцій, додавши значну інвестицію у залізничний сектор._

LiveBTCNews1год тому

Кетті Вуд заявляє, що Трамп може припинити оподаткування платежів у Bitcoin

Cathie Wood пропонує, що Трамп може скасувати податки на капітальні прибутки з невеликих транзакцій з Bitcoin у 2023 році, пов'язуючи цю потенційну зміну політики з майбутніми проміжними виборами та політичним значенням криптовалютних виборців. Вона також вказує на можливі майбутні покупки для резерву Bitcoin США, підкреслюючи стратегічну роль криптовалют у економічній програмі Трампа.

CryptoFrontNews1год тому

Гігант Уолл-стріт Morgan Stanley інвестує у Solana, оскільки активи у реальному світі досягають $1.66 млрд

Недавня заява SEC розкрила, що Morgan Stanley накопичив у своєму портфелі ETF для стейкінгу Solana від Bitwise і тепер володіє понад 900 000 акціями, вартістю понад $10 мільйонів. Він також придбав акції компанії Solana, компанії, що котирується на Nasdaq і виступає як проксі для володіння SOL. Одна з найвідоміших на Уолл-стріт

CryptoNewsFlash2год тому

ETH 15 хвилин піднявся на 0.82%: чистий приплив коштів ETF та резонанс макроекономічних ризиків сприяють відскоку

2026-02-16 12:15 до 12:30 (UTC) під час, ціна ETH зросла в короткостроковій перспективі, прибутковість свічки досягла +0.82%, піднявшись з приблизно $1,995 до приблизно $2,011, загальний обсяг торгів на ринку був високим, волатильність значно зросла, що сприяло зростанню уваги інвесторів. Основними драйверами цієї аномалії стали зростання макроекономічних ризиків та великий потік коштів у ETF. Останнім часом на тлі зростання очікувань зниження ставки Федеральної резервної системи, настрій щодо основних ризикових активів покращився, щоденний чистий потік у фізичний ETF ETH досяг 2,5 мільярдів доларів, що значно посилило підтримку фінансового стану ринку. Загальний ліквідність ринку

GateNewsBot5год тому

Золото падає, долар зміцнюється, а криптовалюти зберігають стабільний імпульс

Ціни на золото та срібло знизилися, при цьому ціна на золото становить $5,007.70 за унцію. Долар США посилив свої позиції, досягнувши 97.008 у індексі. Тим часом, криптовалюти, попри деяку волатильність, залишаються стабільними в межах певного торгового діапазону.

TheNewsCrypto5год тому

Попередження про зниження традиційних фінансів: VIX знизився більш ніж на 1.5%

Бот новин Gate News повідомляє, згідно з останніми даними Gate TradFi, що VIX короткостроково знизився на 1.5%, а поточний рівень волатильності значно перевищує недавнє середнє значення, активність ринку зросла.

GateNewsBot5год тому
Прокоментувати
0/400
Немає коментарів