В статье объясняют, как перейти от линейных пайплайнов к автономному глубокому исследованию с помощью агентов LangGraph, работающих на локальном компьютере. Такие системы не только отвечают на запросы, но и самостоятельно планируют исследование, проверяют релевантность данных и меняют стратегию при необходимости. Запуск на собственном железе даёт свободу выбора моделей, экономию на токенах и возможность хранить найденные материалы в зашифрованной базе для будущего RAG. Главный недостаток — требовательность к видеокарте и объёму видеопамяти, особенно для моделей MoE.
