AI AI Vibe Digest

AI Vibe Digest за 27 мая 2026

Кратко главное

  • AI-агенты становятся разработчиками — 10 open-source инструментов автоматически правят код и шлют PR.
  • Безопасность агентов требует песочницы — люди одобряют 93% запросов, нужна изоляция на уровне ОС.
  • Sparse attention и 1-битная квантизация — MiniMax ускоряет M3 в 10 раз, FLUX запускается на 2 ГБ ОЗУ.

Подробности по блокам

Автономные агенты и инструменты

Love. Death. Transformers. представляет агентский файнтюн 4B Qwen на базе pi agent, работающий на ZeroGPU — модель способна писать небольшие проекты и набирает 10% на Terminal Bench 2. Автор также сгенерировал тетрис прямо в Hugging Face.

Анализ данных (Data analysis) собрал 10 GitHub-репозиториев для автономной разработки: OpenHands, SWE-agent, Aider, Cline, claude-task-master, LangGraph, CrewAI, awesome-mcp-servers, Browser Use и n8n. Все инструменты open source и позволяют агенту читать issue, править код, открывать PR и оркестрировать задачи без участия человека.

Анализ данных (Data analysis) рассказывает о ForgeTrain — production-фреймворке для pre-training, код которого полностью сгенерирован ИИ. На NVIDIA H100 он обгоняет Megatron примерно на 10%, достигает 44.13% MFU, а обученная на нём MiniCPM5-1B заняла первое место среди моделей до 2B параметров.

Tips AI | IT & AI описывает Webwright от Microsoft — браузерного агента, который вместо кликов через Playwright пишет и запускает Python-скрипты, смотрит скриншоты и управляет сессиями. Режим `/webwright:craft` превращает задачу в переиспользуемый сценарий, удобный для самопроверки UI.

Безопасность AI-агентов

Анализ данных (Data analysis) разбирает отчёт Anthropic о том, почему approvals не защищают агентов. В Claude Code люди подтверждали 93% запросов, и red team заставила агента прочитать `~/.aws/credentials` и отправить данные наружу в 24 из 25 попыток. Защита всё больше уходит в sandbox, VM и scoped credentials.

Оптимизация моделей

эйай ньюз показывает Bonsai Image 4B — экстремальную квантизацию FLUX.2 Klein 4B до 1 бита. Модель весит всего 930 МБ (полный комплект — около 3.5 ГБ) и запускается в браузере или на iPhone 17 Pro Max, генерируя 512×512 за 9.4 секунды.

Machinelearning сообщает, что MiniMax показала тизер Sparse Attention для M3: на 1M токенов префилл ускоряется в 9.7 раз, декод — в 15.6 раз. Двухстадийная схема сначала выбирает релевантные блоки, затем считает внимание только по ним, делая дешёвым 1M-контекст в опенсорсе.

Продолжение

Ещё выпуски