Экономия Контекст и деньги

Контекст и деньги

Скопируй страницу и вставь в Claude или GPT — разберёт под твою задачу.

Контекст — это память агента в текущем разговоре. Всё, что вы ему написали, все файлы, которые он прочитал, весь вывод команд и его собственные прошлые ответы. И вот ключевое: он перечитывает это целиком на каждом своём ходу. Понимание этой механики — разница между тем, кто работает с Claude Code дёшево и точно, и тем, кто сжигает бюджет и удивляется, почему агент начал тупить.

Что такое контекст на самом деле

Представь, что ты диктуешь задачу человеку, у которого нет долговременной памяти. Перед каждым действием он заново прочитывает всю стопку бумаг на столе: твоё задание, открытые файлы, записи прошлых шагов. Чем толще стопка — тем дольше он её читает и тем легче в ней утонуть. Агент устроен так же. У него нет «памяти между ходами» в человеческом смысле — есть только текущее окно контекста, которое он каждый раз пробегает целиком, чтобы понять, что вообще происходит.

Поэтому контекст — это не абстракция. Это вполне конкретная стопка, которая растёт с каждым твоим сообщением, с каждым прочитанным файлом, с каждым запуском тестов. И у неё есть цена.

Почему контекст — главный пожиратель денег

Вот момент, который новички упускают и потом не понимают, куда ушёл бюджет. Ты платишь за контекст не один раз. Ты платишь за него на каждом ходу, пока не почистишь.

Допустим, агент прочитал большой файл. Этот файл теперь лежит в контексте. Ты говоришь «теперь поправь вот тут» — и агент снова пропускает через себя весь контекст, включая тот файл. Ты говоришь «а теперь добавь тест» — снова весь контекст. Десять шагов в одном разговоре — это не «прочитал файл один раз», это «протащил его через себя десять раз». Большой раздувшийся разговор делает каждый следующий, даже самый мелкий, шаг дорогим.

Главная ошибка новичка — вести один бесконечный разговор на весь день. Контекст копится, не сбрасывается, и каждое «поправь запятую» в конце дня стоит как полноценная задача утром.

Деньги — это ещё не вся беда. Агент начинает тупить

На раздувшемся контексте падает не только кошелёк, но и качество. Когда в окне лежат три несвязанные задачи, десяток наполовину забытых файлов и гора старого вывода, агент теряет нить. Он может зацепиться за неактуальную деталь из начала разговора, перепутать, какой файл сейчас обсуждается, потащить решение из прошлой задачи в новую. Внимание размывается по всей стопке.

Чистый, узкий контекст = собранный, точный агент. Это не только про экономию — это про то, чтобы он вообще делал то, что нужно.

Два инструмента: /clear и /compact

В Claude Code есть две команды, ровно под эту проблему.

/clear — сброс между задачами

Закончил одну задачу, начинаешь другую, не связанную с первой? Чисти контекст.

/clear

Это выкидывает всю накопленную стопку и начинает разговор с чистого листа. Чинил баг в авторизации, теперь идёшь верстать страницу — между ними нет ничего общего, агенту незачем тащить за собой код авторизации. /clear — и платишь дальше только за новую задачу, а не за обе сразу. Возьми в привычку: новая задача — новый чистый контекст.

/compact — сжать, когда жалко терять

Бывает иначе: разговор длинный, в нём важная история — что решили, что попробовали, что не сработало. Сбрасывать в ноль жалко, но и тащить всю простыню дорого. Тогда:

/compact

Эта команда сжимает длинный разговор в короткую выжимку: агент сам пересказывает суть, отбрасывая всё лишнее. Ты сохраняешь смысл и потерянную нить не теряешь, а вес контекста резко падает. Удобно посреди большой, но цельной задачи, когда чистить нельзя, а тащить всё — накладно.

Простое правило: задачи не связаны — /clear. Задача одна и длинная, но контекст распух — /compact.

Наводи точно, не пали по площадям

Самый дорогой и частый промах — расплывчатые формулировки. «Разберись во всём репозитории и поправь» звучит безобидно, но для агента это команда прочитать кучу файлов — и каждый прочитанный файл теперь висит в контексте и оплачивается на каждом следующем ходу.

Вместо этого наводи точечно. Скажи, какой файл или какую папку трогать. «Посмотри src/auth/login.js и поправь обработку ошибки» вместо «найди, где у нас логин, и почини». Чем уже ты очертил зону, тем меньше агент прочитает, тем дешевле и точнее сработает. Ты знаешь свой проект лучше — не заставляй агента вслепую прочёсывать его за твой счёт.

Подбирай модель под задачу

Модели бывают помощнее и полегче. Мощная глубже думает, но каждый её ход дороже; лёгкая дешевле и быстрее, но проще. Не гоняй тяжёлую артиллерию по мелочам. Сложная архитектура, запутанный баг, тонкий рефакторинг — да, бери мощную. Переименовать переменные, поправить текст, накидать простой скрипт — лёгкой за глаза. Осознанный выбор модели под вес задачи экономит ощутимо, особенно на потоке мелкой работы.

CLAUDE.md экономит на повторении

Если в начале каждого разговора ты заново объясняешь, как устроен проект, какой стек, какие правила — ты платишь за это объяснение каждый раз. Вынеси постоянные вещи в файл CLAUDE.md в корне проекта. Агент подхватывает его как фон, и тебе не нужно повторять одно и то же из разговора в разговор. Постоянный контекст, заданный один раз и аккуратно, а не наговорённый заново при каждом старте.

Следи за расходом, не работай вслепую

Нельзя управлять тем, чего не видишь. Держи в поле зрения, насколько разбух текущий разговор и сколько он съедает. Когда чувствуешь, что контекст оплыл, а задача давно сменилась — это сигнал чистить. Привычка поглядывать на расход отделяет того, кто держит бюджет под контролем, от того, кто в конце месяца хватается за голову.

Подписка или оплата за объём — общими словами

Грубо есть две модели оплаты. Подписка — фиксированная сумма в месяц, внутри которой действуют какие-то лимиты использования. Оплата по API — платишь за фактический объём, за токены: больше прогнал контекста — больше заплатил. На API механика «платишь на каждом ходу» бьёт по кошельку напрямую и ощутимо, поэтому привычки из этого гайда там особенно важны. На подписке ты упираешься скорее в лимиты, чем в счёт, но раздутый контекст всё равно сжигает твою квоту и роняет качество.

Что выгоднее — зависит от того, как и сколько ты работаешь. Конкретные цифры, тарифы и условия я тут называть не буду намеренно: они меняются, и единственный честный источник — сайт провайдера. Зайди и проверь актуальное перед выбором.

Чеклист привычек

  • Новая задача — /clear. Не тащи несвязанное в один разговор.
  • Длинная задача распухла — /compact. Сожми, сохрани суть, скинь вес.
  • Наводи точно. Называй файлы и папки, а не «весь репозиторий».
  • Модель под задачу. Мощную — на сложное, лёгкую — на простое.
  • Вынеси постоянное в CLAUDE.md. Не повторяй контекст руками каждый раз.
  • Следи за расходом. Раздулся контекст — это сигнал, а не фон.
  • Условия оплаты — на сайте провайдера. Не верь цифрам из чужих пересказов.

Освоишь эти привычки — и Claude Code из «дорогой непредсказуемой штуки» превращается в инструмент, который ты держишь под контролем и по деньгам, и по качеству. Контекст чистый, наводка точная, модель по размеру — вот и вся экономика.

Дальше — про то, как расширять руки агента: инструменты и MCP. Когда контекст под контролем, самое время дать агенту доступ к внешнему миру — базам, API, браузеру — и научить его не просто говорить, а действовать. Об этом в следующей теме.