AI Vibe Digest за 29 мая 2026
Кратко главное
- Claude Opus 4.8 обновил подход к работе — модель научилась честнее оценивать свои силы и дольше удерживать контекст.
- Anthropic почти триллион — квартальная выручка зашкаливает, а инвесторы больше не ставят на одного победителя.
- Сжатие KV-кэша до 2 бит без потери точности — метод OSCAR в 3 раза ускоряет декодирование на больших контекстах.
- VK Music научилась «разогревать» новинки — новые треки попадают в рекомендации менее чем за полчаса.
Подробности по блокам
Релизы и инструменты
эйай ньюз рассказывает о ключевом апдейте Claude Opus 4.8 помимо сухих цифр бенчмарков — модель стала заметно честнее, реже срезает углы и чаще признаёт, что чего-то не знает. Цена на обычный режим не изменилась, а быстрый понизили в три раза.
e/acc подсвечивает главное в релизе Opus 4.8 — не саму модель, а систему Workflows. Это возможность описывать целый многошаговый процесс: «прочитай это, потом сделай то, потом проверь, сохрани и протестируй», не разбивая его на десятки отдельных промптов.
Анализ данных пишет, что новая Siri на iOS 27 получит выбор модели — можно будет подключить Google Gemini, ChatGPT или Claude. Apple пересобрала ассистента с нуля и в итоге сделала интерфейс-агрегатор лучших сторонних нейросетей.
#TopAIVibe ⭐️ Сиолошная показывает реальный пример того, как выглядит автосгенерированный workflow для Bun. По сути это набор js-файлов, описывающих циклы «для каждого файла запусти агента с таким промптом», проверки и ревью от нескольких агентов.
Сжатие и эффективность
Machinelearning разбирает метод OSCAR от Together AI, который учится сжимать KV-кэш до 2 бит без деградации ответов. Перед квантованием данные поворачивают особым образом, опираясь на статистику внимания, что позволяет на длинных контекстах ускорить декодирование в 2.8–3.1 раза.
Кейсы из индустрии
Machinelearning описывает, как VK решила проблему холодного старта в музыке: новый трек сначала показывают ядру преданных слушателей артиста, быстро собирают первичную статистику и масштабируют показы. Результат — попадание в рекомендации менее чем за 30 минут.
AI для Всех предлагает агента для поиска поломок в воронке продаж. Инструмент сам проходит по сайту как пользователь, находит места, где теряются люди, и генерирует промпт с конкретным фиксом для Cursor или Claude.
e/acc делится связкой из четырёх агентов для автоматизации работы с заявками в акселераторе: поиск контактов под анонс, первичный анализ заявок, ревью с памятью решений и ежедневная подготовка брифов к звонкам. Заявлено, что это экономит более 10 часов в неделю.
Облачные решения и железо
Love. Death. Transformers. сообщает, что Яндекс, Selectel и MetaMentor запустили on-prem AI-as-a-Service. Железо устанавливают прямо в контур заказчика, а софт настраивают под ключ — вся готовая среда для генеративных моделей и агентов появляется за пару недель, при этом данные не покидают периметр.