AI Vibe Digest за 13 мая 2026
Открыть пост выпуска в TelegramКратко главное
- Независимый бенчмарк кодинг-агентов показал лидеров по соотношению цена-качество — архитектура IDE побеждает нативные терминальные инструменты
- Thinking Machines Lab представил ИИ, который можно перебить голосом или жестом — модель обрабатывает мир непрерывными 200-миллисекундными кадрами
- OpenAI запускает автономного защитника кодовых баз — инициатива Daybreak ищет уязвимости без участия человека
- Google превращает Android в операционную систему для AI-агентов — бронирование поездок и автозаполнение форм перейдут под контроль Gemini Intelligence
Подробности по блокам
Инструменты для кодинг-агентов
Machinelearning сравнил агентов в первом бенчмарке Artificial Analysis: Cursor CLI набрал 61 балл, обогнав OpenAI Codex и Claude Code на 1 пункт. При одинаковой модели Opus 4.7 решение Cursor точнее нативного Claude Code, но дороже: $1.47 и 7.8 минуты на задачу против $1.24 и 5.8 минуты у Anthropic.
Machinelearning рассказывает о дашборде Agent View в Claude Code: он позволяет запускать фоновых агентов для генерации PR или поиска по кодовой базе, не прерывая свою работу. Через функцию Peek можно подсмотреть ответы агента и передать ему промпт без открытия полного лога чата.
Модели с нативной интерактивностью
Machinelearning анонсирует архитектуру Thinking Machines Lab: MoE на 276B параметров с 12B активными обрабатывает аудио, видео и текст как единый поток. Модель распознаёт речь микрошагами по 200 мс и позволяет корректировать генерацию голосом или показывая объекты камере.
AI в кибербезопасности
Machinelearning сообщает об инициативе Daybreak от OpenAI: Codex выступает управляющим каркасом, анализирует незнакомые кодовые базы, выявляет уязвимости и оценивает риски зависимостей. Релиз будут разворачивать поэтапно совместно с госсектором — платформа использует жёсткую верификацию из-за рисков двойного назначения.
AI в операционных системах и промышленности
Machinelearning раскрывает детали Gemini Intelligence для Android: агенты научатся бронировать поездки и переносить списки из заметок в корзину магазина. Gboard получит инструмент Rambler для конвертации мультиязычной речи в форматированный текст, а Chrome — автосводки страниц.
Анализ данных рассказывает о проекте Норникеля и ИОНХ РАН по обучению AI создавать новые материалы. Вместо классической цепочки «лаборатория → результат» ИИ сначала ищет перспективные структуры по датасету из десятков тысяч экспериментов, а учёные проверяют находки — в частности, пытаются заменить золото палладием в микроэлектронике.
Новые модели
Анализ данных сообщает о выходе Ovis2.6-80B-A3B под Apache 2.0: мультимодальная модель на 80B параметров, где активны лишь 3B. Её главная особенность — Think with Image: во время reasoning модель может активно кропать нужные области картинки и пересматривать детали, а не тащить всё изображение пассивным фоном.
Необычные проекты
Machinelearning находит Halupedia — пародию на Википедию, где каждая статья генерируется ИИ в момент открытия. Энциклопедия описывает несуществующую вселенную с такими экспонатами, как «Великая перепись голубей 1887 года» или «Общество по предотвращению ненужных вторников». Бэкенд — open-source репозиторий vibeserver.
Расследования
Machinelearning публикует детали расследования Конгресса США: Сэма Альтмана подозревают в использовании ресурсов OpenAI для раздувания капитализации стартапов с его личной долей. Ключевой эпизод — инвестиция $500 млн в термоядерный Helion, шестикратно увеличившая оценку компании. Конгресс затребовал всю внутреннюю переписку о конфликтах интересов с 2015 года.
Инструменты для сообщества
AI для Всех делится предиктором виральности для Hacker News: инструмент на основе LightGBM обучен на 148 тысячах исторических постов и предсказывает score заголовка по 31 фиче. Модель скомпилирована в чистый JavaScript через m2cgen и работает без ML-рантайма. Автор добавил live calibration ledger, публично фиксирующий ошибки прогнозов каждые 10 минут.