агент покажет, как он думает
Не дашборд, на который никто не смотрит, а собеседник: владелец спрашивает по-человечески — агент идёт в данные, считает и отвечает с цифрой, графиком и причиной. Ниже — реальные прогоны на открытом датасете розничных продаж.
Каждый сценарий — реальный прогон: агент действительно считал ответы по датасету (скрипт analysis.py лежит в репозитории, воспроизводится одной командой; цифры в ответах равны его выводу). Для демо прогоны записаны, чтобы страница работала без сервера.
В продукте то же самое происходит вживую на данных компании: агент получает доступ к витрине/реплике (не к проду), строит запрос, проверяет себя и отвечает в чате. Качество ответов измеряется eval-петлёй — набором проверочных вопросов с известными ответами, который гоняется при каждом изменении.