AI AI Vibe Digest

AI Vibe Digest за 1 мая 2026

Открыть пост выпуска в Telegram

Кратко главное

  • OpenAI GPT-5.5-Cyber для кибербеза расширяет доступ — модель открыта госсектору и критической инфраструктуре.
  • Qwen-Scope даёт рентгеновское зрение внутрь LLM — управление стилем и поиск причин багов через sparse autoencoders.
  • Карпаты: стройте автономные AI-процессы — новая логика работы: настраивать системы, а не писать бесконечные промпты.
  • Green-VLA — лидер в глобальном робот-челлендже AGIBOT — модель Сбера обошла 78 команд в задачах от логистики до уборки.
  • Codex CLI в браузере и фикс критической проблемы WSL — расширение Chromex и community-решение избавляют от боли с правами.

Подробности по блокам

Безопасность и контроль AI

Machinelearning рассказывает о выпуске OpenAI модели GPT-5.5-Cyber, заточенной под кибербезопасность. На бенчмарке CyberGym она обходит Claude Opus 4.7 и получает статус «Высокий» по шкале рисков. Вместе с этим расширяется программа TAC: раньше доступ был только у узкого круга исследователей, а теперь модель открывают для госструктур, финансового сектора и MSSP, обслуживающих локальные школы, больницы и объекты водоснабжения.

Data Blog делится принятыми на конференцию AINL 2026 работами по безопасности ИИ. Первая — метод детекции попыток обхода фильтров (jailbreak) через перевод запросов на другие языки, без дообучения модели, на основе семантических сходств с известными атаками. Вторая — анализ каскадных ошибок в мультиагентных системах (один сбой тянет за собой другие) и инструмент Cascade Lab для проверки этого на практике.

Интерпретируемость LLM

Machinelearning сообщает об открытии Alibaba набора sparse autoencoders Qwen-Scope для моделей Qwen. Это инструмент, позволяющий заглянуть внутрь языковой модели и увидеть, какие внутренние признаки отвечают за стиль, тему, язык, тон и типичные сбои. С ним можно точнее управлять ответами, находить причины багов вроде повторов или переключения языка, а также яснее понимать, что именно проверяют разные бенчмарки.

Как выжать максимум из AI

Андрей Карпаты в Machinelearning напоминает: перестаньте быть узким местом для модели. Не нужно сидеть и пошагово писать следующий промпт. Задача — настроить процесс так, чтобы вы задали цель, контекст и правила, а система сама выполнила всю цепочку действий. Чем больше задач уходит в фон без вашего постоянного контроля, тем выше отдача от ИИ.

Робототехника

Сергей Марков пишет о победе Green-VLA в треке Reasoning2Action на международном соревновании AGIBOT World Challenge. Модель заняла первое место среди 79 участников, решая задачи в симуляторе: от сортировки и выкладки товаров до уборки. В начале июня команда протестирует её на реальных роботах на очном этапе в Вене.

Инструменты и кодинг

Tips AI подсвечивает расширение Chromex — оно встраивает Codex CLI прямо в Chrome. Агент может читать содержимое вкладок, скриншоты, разбирать YouTube и PDF, генерировать изображения. Всё работает через подписку ChatGPT, без отдельного API.

Тимур Хахалев показывает решение неприятной ошибки Codex App на Windows+WSL — «permission denied» при доступе к папке сессий. Стандартный chown не помогает, но community-костыль с созданием каталога внутри WSL возвращает работоспособность.

Продолжение

Ещё выпуски