Как заставить ИИ-агентов накапливать опыт: лучшая привычка

Лучшая привычка при работе с нейронками — заставлять их накапливать опыт

Как это работает

Вот как человек работает сам:

Взял задачу
Почитал что-то о ней, отложил в памяти
Попробовал сделать, обосрался, получил опыт
С этим опытом попробовал по-другому, получилось, получил еще опыт

К каждой новой задаче человек приступает все более подготовленным, умелым и эффективным, чем был в прошлый раз

Ровно тот же подход надо использовать в работе с нейронками. Сами по себе агенты пока не умеют накапливать опыт. Они что-то сделали и забыли. Новая сессия — новый электронный болванчик.

Поэтому наша задача как «руководителей ИИ» — следить за тем, чтобы накопленный опыт сохранялся, а не улетучивался.

Придумали, как правильно вести документацию, написали инструкцию → начали по ней работать → агент что-то заполнил неправильно → тут же попросили агента исправить инструкцию, чтобы в следующий раз эту ошибку не допустить.

Сделали субагента-аудитора кода, запустили, а он пропустил какую-то ошибку, или выдал ответ корявый → тут же пошли и дописали в него новый кусок инструкции, поменяли шаблон ответа, добавили еще один пункт, что надо проверять.

Каждый раз, когда агент где-то лажает, тупит, работает не так, как вам хотелось бы, надо не просто придумать, как разрулить эту ситуацию, но и зафиксировать решение где-то. Не в чате, а во внешней документации, которая не сгорит после завершения сессии.

Как выглядит работа

Лично у меня любая работа идет в 2 окнах.

В одном я работаю над продуктом, делаю какие-то задачи, пилю фичи и вот это все.

А во втором постоянно обновляю, дорабатываю и переделываю инструкции агентов, чтобы в следущие разы эта часть работы шла быстрее и проще.

В итоге не только я накапливаю опыт и учусь работать быстрее и эффективнее, но и мои агенты тоже.

Что это дает

И работа с таким подходом приводит к прикольным результатам, когда агенты начинают реально делать что надо

Вот прям даже ругать их не приходится.

Если я как-то криво сформулировал задачу — агент будет моросить меня уточняющими вопросами, потому что мы месяц долбились с ним над инструкцией, как заставить ленивого и тупого юзера (меня) дать всю нужную для работы информацию

Если я попросил продумать новую фичу — агент сделает подробную документацию, проверит ее, переделает, проверит еще раз — и так пока все «проверяльщики» не будут довольны

А потом можно просто жать кнопку «сделай задачу 1» — и на 5-10 минут отходить от компа. Потому что агент сделает. Нормально.

Потому что он знает, что сначала надо изучить документацию, потом надо написать тесты, потом надо написать код, прогнать тесты, поправить, если что-то упало.

Потом придут агенты-проверяльщики и напихают ему за воротник, что он нарушил какие-то требования безопасности и вообще не по нашим высоким стандартам все сделал.

И он будет переделывать, пока не получится код, к которому нейронка не может придраться.

А у агента-проверяльщика в инструкции прямо написано придираться ко всему.

И вот в конце приходит Паша, читает, что там происходило, кто где косячил, просит агента дописать пару пунктов в инструкцию. С этой инструкцией запускает следующую пачку задач — и уходит трепаться в Телеграмах, смотреть Даню Крастера на Ютубе или еще какой фигней заниматься.

Это все еще ОЧЕНЬ далеко от автоматизации и замены агентами живых людей. Но благодаря всем этим выстраданным скиллам и инструкциям в вайбкодинге становится сильно больше вайба, чем кодинга.

Заставь нейронки накапливать опыт — они перестанут тупить

Как это работает

Как выглядит работа

Что это дает

Молянов