AI Vibe Digest за 15 мая 2026
Открыть пост выпуска в TelegramКратко главное
- Perceptron AI выпустил модель Mk1 для видеоанализа — по тестам она сопоставима с топовыми решениями и стоит в разы дешевле.
- Безопасность LLM можно сломать одним нейроном — исследование Apple показало, что отключение одного MLP-нейрона снимает все ограничения.
- Codex теперь доступен на мобильных — официальный Remote и самодельный диспатчер позволяют управлять агентом с телефона.
Подробности по блокам
Анализ видео и пространственное рассуждение
Machinelearning рассказал о выходе Perceptron Mk1 — модели для видеонаблюдения, инспекции оборудования и разметки данных для роботов. Она обрабатывает видео с частотой до 2 кадров/с, отслеживает объекты даже при перекрытиях и выдаёт геометрические примитивы. На EmbSpatialBench модель набрала 85,1 балла против 78,4 у Google Robotics-ER 1.5. Цена через API — 15 центов за миллион входных токенов и $1.50 за выходные.
Уязвимость safety-механизмов
gonzo-обзоры ML статей разобрали исследование Apple: вся защита от вредоносных запросов в современных LLM держится на единичных «нейронах отказа». Подавив один такой нейрон, модель начинает отвечать на 94% опасных промптов, а усилив другой — выдаёт вредоносный контент даже на безобидный ввод. Значит, текущий подход к алайнменту чрезвычайно хрупок и нуждается в пересмотре.
Ускорение байтовых моделей
gonzo-обзоры ML статей описали метод Fast Byte Latent Transformer, который позволяет параллельно генерировать ответы в байтовых архитектурах без токенизатора. Это снижает затраты на пропускную способность памяти до 92% и делает инференс конкурентоспособным с токенизированными моделями — хороший задел для продакшена.
Инструменты для работы с агентами
AI и грабли сообщает, что Codex получил Remote Connections на iOS и Android — теперь можно управлять десктопным агентом прямо с телефона. Плюс появилась возможность подключаться к VPS, превращая Codex в постоянно доступного ассистента без привязки к локальной машине.
AI и грабли выложил Open Source-диспатчер codex-dispatcher, который создаёт туннель к Codex Desktop и позволяет подключаться из любого браузера как к PWA-приложению. Установка одной командой, удобно для коротких сессий из кафе или с телефона.
Анализ данных напомнил о полезном сервисе whatmodelscanirun.com: указываете GPU, VRAM и RAM — получаете список LLM с квантованием, скоростью и размером контекста, которые точно влезут в ваше железо. Больше не придётся вручную гадать, потянет ли компьютер очередную open‑source модель.