AI AI Vibe Digest

AI Vibe Digest за 9 июня 2026

Кратко главное

  • LEAP от Google формально доказал все 12 задач Putnam-2025 — агентный подход бьёт и чистые LLM, и специализированные пруверы
  • LangChain учит агентов самопроверке — RubricMiddleware заставляет ИИ переделывать работу, пока не выполнит все заданные критерии
  • Учёные не нашли бэкпроп в мозге — градиенты современных нейросетей не совпадают с сигналами обучения живой коры
  • Google выбрала Intel для производства 3 млн TPU к 2028 году — первый реальный шанс Intel Foundry стать альтернативой TSMC в ИИ-чипах

Подробности по блокам

Фундаментальные исследования

Machinelearning разбирает пейпер Google о системе LEAP для автоматического доказательства теорем. ИИ-агент разбивает сложную задачу на части и рекурсивно исправляет ошибки по подсказкам компилятора Lean. На олимпиаде Putnam-2025 LEAP закрыл все 12 задач — ни одна чистая LLM, ни специализированные пруверы не решили ни одной. Попутно система сгенерировала более 5000 строк кода для проверки комбинаторной задачи Дональда Кнута. Код самого LEAP пока не опубликован, но итоговые доказательства доступны для перепроверки.

Data Secrets обращает внимание на свежую статью нобелевского лауреата по физике 2021 года — доказательство получено в диалоге с Claude (Sonet 4.6 и Opus 4.7) и верифицировано авторами. Становится классикой: первооткрыватели используют LLM не как инструмент, а как соавтора.

gonzo-обзоры ML статей пересказывает ключевую работу о том, что сигналы обучения в искусственных нейросетях (градиенты бэкпропа) не соответствуют тому, как учится зрительная кора человека. Представления у мозга и нейросетей похожи, а вот сам механизм обучения — принципиально разный. Мозг, похоже, использует что-то более эффективное, что ИИ ещё предстоит открыть.

Архитектура агентов и воркфлоу

Machinelearning рассказывает о RubricMiddleware от LangChain — компоненте для фреймворка Deep Agents. Разработчик задаёт список формальных критериев приёмки, отдельный агент-грэйдер оценивает результат по каждому пункту и возвращает замечания основному агенту на доработку. Цикл идёт до выполнения всех требований или до лимита итераций. Инструмент решает типичную проблему: агент делает почти всё, но забывает про формат, тесты или обязательные разделы.

AI и грабли делится простым, но рабочим паттерном: отправлять Codex несколько задач в очередь, а не скопом. По наблюдениям автора, на трёх-четырёх последовательно сформулированных задачах агент справляется на порядок лучше — видимо, фокус действительно ключевой фактор. И добавляет, что самое частое сообщение в конец цепочки: «что мы ещё упустили? нужно ли что-то проверить/поправить?» — и это работает.

Инфраструктура и железо

Анализ данных сообщает о планах Google разместить заказ на 3 млн TPU у Intel Foundry в 2028 году. Сейчас TSMC фактически держит горлышко бутылки для всего ИИ-железа, и даже гигантам приходится искать запасные маршруты. Для Intel это не просто крупный заказ, а редкий вход в цепочку поставок на уровне конкурента Nvidia. Если получится — рынок получит ещё одного серьёзного производителя advanced-node чипов.

Анонсы и сообщество

Сиолошная коротко сообщает, что Anthropic планирует публичный выпуск Mythos 10 июня. Модель будут сопровождать жёсткие фильтры, особенно в задачах по кибербезопасности. Это первый открытый релиз столь мощной системы от Anthropic — и он явно будет полон ограничений.

Data Sanity Talks продлевает приём заявок на доклады для лондонского митапа 23 июля до 11 июня. Организаторы обещают запись и продвижение выступлений, а тема — как отличить реальные инсайты об AI-агентах от хайпа.

Продолжение

Ещё выпуски