AI AI Vibe Digest

AI Vibe Digest за 13 мая 2026

Открыть пост выпуска в Telegram

Кратко главное

  • Независимый бенчмарк кодинг-агентов показал лидеров по соотношению цена-качество — архитектура IDE побеждает нативные терминальные инструменты
  • Thinking Machines Lab представил ИИ, который можно перебить голосом или жестом — модель обрабатывает мир непрерывными 200-миллисекундными кадрами
  • OpenAI запускает автономного защитника кодовых баз — инициатива Daybreak ищет уязвимости без участия человека
  • Google превращает Android в операционную систему для AI-агентов — бронирование поездок и автозаполнение форм перейдут под контроль Gemini Intelligence

Подробности по блокам

Инструменты для кодинг-агентов

Machinelearning сравнил агентов в первом бенчмарке Artificial Analysis: Cursor CLI набрал 61 балл, обогнав OpenAI Codex и Claude Code на 1 пункт. При одинаковой модели Opus 4.7 решение Cursor точнее нативного Claude Code, но дороже: $1.47 и 7.8 минуты на задачу против $1.24 и 5.8 минуты у Anthropic.

Machinelearning рассказывает о дашборде Agent View в Claude Code: он позволяет запускать фоновых агентов для генерации PR или поиска по кодовой базе, не прерывая свою работу. Через функцию Peek можно подсмотреть ответы агента и передать ему промпт без открытия полного лога чата.

Модели с нативной интерактивностью

Machinelearning анонсирует архитектуру Thinking Machines Lab: MoE на 276B параметров с 12B активными обрабатывает аудио, видео и текст как единый поток. Модель распознаёт речь микрошагами по 200 мс и позволяет корректировать генерацию голосом или показывая объекты камере.

AI в кибербезопасности

Machinelearning сообщает об инициативе Daybreak от OpenAI: Codex выступает управляющим каркасом, анализирует незнакомые кодовые базы, выявляет уязвимости и оценивает риски зависимостей. Релиз будут разворачивать поэтапно совместно с госсектором — платформа использует жёсткую верификацию из-за рисков двойного назначения.

AI в операционных системах и промышленности

Machinelearning раскрывает детали Gemini Intelligence для Android: агенты научатся бронировать поездки и переносить списки из заметок в корзину магазина. Gboard получит инструмент Rambler для конвертации мультиязычной речи в форматированный текст, а Chrome — автосводки страниц.

Анализ данных рассказывает о проекте Норникеля и ИОНХ РАН по обучению AI создавать новые материалы. Вместо классической цепочки «лаборатория → результат» ИИ сначала ищет перспективные структуры по датасету из десятков тысяч экспериментов, а учёные проверяют находки — в частности, пытаются заменить золото палладием в микроэлектронике.

Новые модели

Анализ данных сообщает о выходе Ovis2.6-80B-A3B под Apache 2.0: мультимодальная модель на 80B параметров, где активны лишь 3B. Её главная особенность — Think with Image: во время reasoning модель может активно кропать нужные области картинки и пересматривать детали, а не тащить всё изображение пассивным фоном.

Необычные проекты

Machinelearning находит Halupedia — пародию на Википедию, где каждая статья генерируется ИИ в момент открытия. Энциклопедия описывает несуществующую вселенную с такими экспонатами, как «Великая перепись голубей 1887 года» или «Общество по предотвращению ненужных вторников». Бэкенд — open-source репозиторий vibeserver.

Расследования

Machinelearning публикует детали расследования Конгресса США: Сэма Альтмана подозревают в использовании ресурсов OpenAI для раздувания капитализации стартапов с его личной долей. Ключевой эпизод — инвестиция $500 млн в термоядерный Helion, шестикратно увеличившая оценку компании. Конгресс затребовал всю внутреннюю переписку о конфликтах интересов с 2015 года.

Инструменты для сообщества

AI для Всех делится предиктором виральности для Hacker News: инструмент на основе LightGBM обучен на 148 тысячах исторических постов и предсказывает score заголовка по 31 фиче. Модель скомпилирована в чистый JavaScript через m2cgen и работает без ML-рантайма. Автор добавил live calibration ledger, публично фиксирующий ошибки прогнозов каждые 10 минут.

Продолжение

Ещё выпуски