AI AI Vibe Digest

AI Vibe Digest за 13 марта 2026

Открыть пост выпуска в Telegram

Кратко главное

  • Разработка платформ для ИИ-агентов набирает обороты.
  • ИИ решает сложные математические задачи и улучшает мультимодальность.
  • Появляются новые инструменты для разработчиков и методы оценки моделей.
  • Инфраструктура для ИИ растёт через инвестиции и стандарты.

Подробности по блокам

Агенты и автономные системы

Machinelearning рассказывает о перезапуске DeerFlow от ByteDance. Это уже не просто фреймворк, а полноценный рантайм для создания ИИ-агентов, где главный агент разбивает задачу на подзадачи и запускает изолированных суб-агентов в Docker-контейнерах. Система умеет работать с файлами, выполнять команды и запоминает контекст между сессиями.

По информации Machinelearning, Илон Маск представил проект Macrohard (Digital Optimus) — систему, которая эмулирует работу целой IT-компании. Она сочетает языковую модель Grok и ИИ-агента Tesla, который управляет компьютером, анализируя видео с экрана.

e/acc делится впечатлениями с роботической выставки в Китае, где десятки производителей показывают гуманоидных роботов, которые уже сейчас умеют играть на рояле, заваривать чай и танцевать. Многие модели доступны для покупки уже в этом году.

Исследования и модели

Data Secrets сообщает о прорыве AlphaEvolve от Google DeepMind. Эта система на основе ИИ улучшила нижние оценки для чисел Рамсея — сложнейшей комбинаторной задачи, над которой десятилетиями бились математики. ИИ смог превзойти результаты, полученные вручную.

Gonzo-обзоры ML статей анализирует исследование о едином бэкбоне для мультимодальных моделей. Оказалось, что если с нуля обучать модель одновременно на тексте и изображениях, она отлично справляется и с пониманием, и с генерацией, а архитектура Mixture of Experts (MoE) хорошо решает проблему разницы в сложности между модальностями.

Machinelearning отмечает, что Anthropic обновила Claude AI: теперь чат-бот может генерировать интерактивные графики и диаграммы прямо внутри диалога, подстраивая визуализацию под контекст разговора.

Инструменты и разработка

Tips AI рекомендует огромный репозиторий публичных API, который можно скормить ИИ-агенту, чтобы тот сам нашёл нужные инструменты для решения конкретных задач — от финансов и погоды до машинного обучения.

Сиолошная рассказывает, как Cursor бенчмаркает модели для написания кода. Компания использует гибридный подход: офлайн-тесты на сложных задачах и онлайн-оценку на реальном трафике, чтобы понять, какие улучшения действительно помогают разработчикам.

Старший Авгур делится забавным экспериментом, сравнивая, как разные модели справляются с генерацией анимации в Three.js по причудливому промпту (например, с участием Распутина и Шрека).

Data Secrets анонсирует AlphaXiv — ленту в стиле Twitter, но для научных статей по ИИ. Сервис позволяет листать популярные исследования с картинками и выводами, а затем переходить к полному тексту или чату с ИИ-ассистентом для обсуждения.

Инфраструктура и стандарты

Data Secrets сообщает, что Nvidia инвестирует 2 миллиарда долларов в Nebius Group (бывшую Yandex N.V.) для создания масштабного облака для ИИ-агентов. Партнёры планируют развернуть более 5 ГВт мощностей дата-центров на чипах Nvidia к 2030 году.

Machinelearning пишет, что Китай начал разработку стандартов для автономных ИИ-агентов, таких как OpenClaw. Нормативная база должна решить проблемы безопасности и предсказуемости работы этих систем, установив требования к качеству кода и прозрачности процессов.

Продолжение

Ещё выпуски