AI-інженер Akshay Pachaar 10 травня в X опублікував повну схему Claude Code, розклавши всю систему на 6 рівнів і підкресливши, що «модель — це лише один із вузлів у циклі». У своїй публікації Pachaar цитує його лонгрід-есе від 6 квітня «The Anatomy of an Agent Harness»: ключове в тому, що Claude Code «виглядає як магія» не через саму модель, а через ретельно продуманий дизайн harness-інженерії.
6-рівнева архітектура: модель — лише один вузол
Pachaar розклав Claude Code на 6 рівнів:
Input Layer (шар введення): відповідає за керування session, контроль прав доступу та довіру, налаштовану через YAML. Будь-яка інструкція, перш ніж потрапити в модель, проходить через цей шар.
Knowledge Layer (шар знань): містить skill registry, context compressor (3 рівні стиснення, поріг 92% для спрацювання), task graph, сховище пам’яті між session. Це місце, де існує «розумність» harness — окремо від ваг моделі.
Execution Layer (шар виконання): через typed registry розсилає виклики інструментів, і кожен інструмент має власний handler — bash, read, write, grep, glob, revert. Streaming runtime підтримує паралельне виконання, prompt cache повторно використовує стабільні префікси, а витрати знижуються до 10%.
Integration Layer (інтеграційний шар): MCP runtime під’єднує зовнішні сервери (filesystem, git, власні інструменти). Інструменти реєструються зсередини, а пам’ять записується назовні в agent_memory.md.
Multi-Agent Layer (шар мультиагентності): включає subagent spawner, teammate mailboxes з комунікацією через redis pub/sub, протокол обмеженого набору станів (IDLE→REQUEST→WAIT→RESPOND), autonomous board із атомарним блокуванням, ізоляцію worktree (кожне завдання — окремий git branch).
Observability Layer (шар спостережуваності): огортає всі рівні подієвим шиною та lifecycle hooks; бекграунд-запускач працює у daemon thread без блокувань.
У центрі — «master agent loop» (головний агентний цикл): сприйняття → дія → спостереження. Anthropic самі позначили цей цикл як «dumb loop» (глупий цикл) — вся «розумність» у міркуваннях моделі, а harness відповідає лише за диспетчеризацію.
Ключовий дизайн: context compressor і ізоляція worktree
Кілька деталей, на які варто звернути увагу:
Context compressor: 3 рівні стиснення, поріг 92%. Коли контекст наближається до 92% місткості, спрацьовують підсумовування та компресія: зберігаються архітектурні рішення та невирішені bug, викидаються повторювані результати інструментів. Це перегукується з опублікованими Anthropic «context engineering вказівками»: знаходити мінімальний набір токенів із максимальною інформативністю та максимізувати імовірність досягнення цілей.
Ізоляція Worktree: кожен subagent працює у власному git worktree та на власній гілці, а під час злиття виконується детекція конфліктів. Ця схема робить можливими паралельні правки однієї й тієї ж кодової бази кількома агентами без взаємного «наступання на ногу». У трьох режимах виконання субагентів Claude Code — «Fork / Teammate / Worktree» — Worktree є найсильнішим рівнем ізоляції.
Prompt cache з вартістю 10%: через кешування стабільних префіксів (system prompt, визначення інструментів, CLAUDE.md) повторні виклики зі спільним префіксом оплачуються лише на 10% стандартної вартості токенів. Це ключ до того, щоб тривалі задачі зберігали контрольовані витрати.
Чому ця розбірка знайшла відгук у спільноті
Пост Pachaar зібрав 522 лайки та 115 ретвітів, а в коментарях з’явилися відгуки на кшталт: «Я думав, що це просто CLI-інструмент», «Я вважав, що Claude Code = model + доступ до terminal, і не знав, що в multi-agent layer стільки всього працює». Це відображає, що більшість розуміння Claude Code досі зводиться до «Claude API загорнули в один CLI» й недооцінює складність harness-інженерії.
Pachaar наводить як центральний аргумент цитату Vivek Trivedy з LangChain: «Якщо ти не модель — ти harness». Тестування LangChain на TerminalBench 2.0 підтвердило: той самий набір ваг моделі, лише змінюючи зовнішній harness, підняв позицію з 30-го місця аж до 5-го.
Для читачів abmedia ця розбірка дає конкретну точку відліку: коли ви бачите відмінності між продуктами-агентами на кшталт Claude Code, Codex, Gemini Code Assist, то більшість різниць не в самій моделі, а в дизайні harness — стратегії керування контекстом, діапазоні інструментів, верифікаційному циклі, режимах кооперації мультиагентів. Розгортка версії моделі — це одне, але вибір harness-інженерії визначає рівень якості продуктового досвіду.
Ця стаття з розбором Akshay Claude Code на 6 рівнів: «Модель — лише один вузол у циклі» вперше з’явилася на 鏈新聞 ABMedia.