AI AI Vibe Digest

AI Vibe Digest за 29 мая 2026

Кратко главное

  • Claude Opus 4.8 обновил подход к работе — модель научилась честнее оценивать свои силы и дольше удерживать контекст.
  • Anthropic почти триллион — квартальная выручка зашкаливает, а инвесторы больше не ставят на одного победителя.
  • Сжатие KV-кэша до 2 бит без потери точности — метод OSCAR в 3 раза ускоряет декодирование на больших контекстах.
  • VK Music научилась «разогревать» новинки — новые треки попадают в рекомендации менее чем за полчаса.

Подробности по блокам

Релизы и инструменты

эйай ньюз рассказывает о ключевом апдейте Claude Opus 4.8 помимо сухих цифр бенчмарков — модель стала заметно честнее, реже срезает углы и чаще признаёт, что чего-то не знает. Цена на обычный режим не изменилась, а быстрый понизили в три раза.

e/acc подсвечивает главное в релизе Opus 4.8 — не саму модель, а систему Workflows. Это возможность описывать целый многошаговый процесс: «прочитай это, потом сделай то, потом проверь, сохрани и протестируй», не разбивая его на десятки отдельных промптов.

Анализ данных пишет, что новая Siri на iOS 27 получит выбор модели — можно будет подключить Google Gemini, ChatGPT или Claude. Apple пересобрала ассистента с нуля и в итоге сделала интерфейс-агрегатор лучших сторонних нейросетей.

#TopAIVibe ⭐️ Сиолошная показывает реальный пример того, как выглядит автосгенерированный workflow для Bun. По сути это набор js-файлов, описывающих циклы «для каждого файла запусти агента с таким промптом», проверки и ревью от нескольких агентов.

Сжатие и эффективность

Machinelearning разбирает метод OSCAR от Together AI, который учится сжимать KV-кэш до 2 бит без деградации ответов. Перед квантованием данные поворачивают особым образом, опираясь на статистику внимания, что позволяет на длинных контекстах ускорить декодирование в 2.8–3.1 раза.

Кейсы из индустрии

Machinelearning описывает, как VK решила проблему холодного старта в музыке: новый трек сначала показывают ядру преданных слушателей артиста, быстро собирают первичную статистику и масштабируют показы. Результат — попадание в рекомендации менее чем за 30 минут.

AI для Всех предлагает агента для поиска поломок в воронке продаж. Инструмент сам проходит по сайту как пользователь, находит места, где теряются люди, и генерирует промпт с конкретным фиксом для Cursor или Claude.

e/acc делится связкой из четырёх агентов для автоматизации работы с заявками в акселераторе: поиск контактов под анонс, первичный анализ заявок, ревью с памятью решений и ежедневная подготовка брифов к звонкам. Заявлено, что это экономит более 10 часов в неделю.

Облачные решения и железо

Love. Death. Transformers. сообщает, что Яндекс, Selectel и MetaMentor запустили on-prem AI-as-a-Service. Железо устанавливают прямо в контур заказчика, а софт настраивают под ключ — вся готовая среда для генеративных моделей и агентов появляется за пару недель, при этом данные не покидают периметр.

Продолжение

Ещё выпуски