AI AI Vibe Digest

AI Vibe Digest за 8 июня 2026

Кратко главное

  • Статические промпты (скилы) теряют актуальность — побеждают программируемые ИИ-воркфлоу с обратной связью
  • Nvidia анонсировала чип RTX Spark — ноутбук тянет LLM до 120 млрд параметров локально за 2700 евро
  • Google превращает RAG в многоагентного исследователя — он не бросает задачу, если не нашел ответ с первого раза
  • Персонализация гигантских ИИ-моделей дешевеет — ученые масштабировали крошечные адаптеры для миллиона пользователей

Подробности по блокам

Эволюция агентов и воркфлоу

Love. Death. Transformers. делится наблюдением о сдвиге парадигмы: статичные скилы (инструкции для LLM) устаревают, так как модели уже вобрали все нужные знания из интернета. Работа превращается в проектирование динамических воркфлоу — алгоритмов, которые оркестрируют агентов, дают им обратную связь и перепроверяют результат, пока не добьются цели.

e/acc за выходные собрал 800 публичных динамических воркфлоу и сравнил их со скилами. Вывод: в более чем половине случаев скилы не дают пользы или даже ухудшают результат по сравнению с чистой LLM. Воркфлоу же выигрывает тем, что это не просто промпты, а системы с проверкой действий, написанные алгоритмически.

Локальный запуск моделей

Machinelearning рассказывает об анонсе Nvidia RTX Spark Superchip. Чип для ноутбуков под Windows 11 способен локально тянуть ИИ-модели до 120 млрд параметров при теплопакете всего 80 Вт. Внутри — 20-ядерный Grace CPU и графика уровня RTX 5070 с 128 ГБ памяти. Ноутбуки на Spark появятся осенью по цене от 2700 евро.

Методологии AI и научные прорывы

Анализ данных разбирает Agentic RAG от Google Research. Обычный RAG часто сдается, если ответ разбросан по разным базам, но Google превратила его в слаженный пайплайн: один агент планирует маршруты, другой переписывает запрос, третий проверяет, хватает ли собранных данных для ответа. Прирост точности составил до 34% на сложных корпоративных вопросах, где требуется информация из нескольких источников.

gonzo-обзоры ML статей ревьюит свежую работу о скейлинге PEFT/LoRA. Исследователи из Mind Lab создали инфраструктуру для «подвешивания» миллионов крошечных адаптеров к одной гигантской модели-основе. Это как дать каждому пользователю личного кастомизированного помощника, не переобучая общий ИИ, — и всё радикально дешевле, чем запуск отдельных моделей.

Продолжение

Ещё выпуски