Долгожданная запись доклада Дмитрия Шатнёва наконец доступна! На конференции AsterConf2025 выступление вызвало настоящий ажиотаж – зал был полон, а вопросы после секции не прекращались еще долго.
Тема доклада – «Речевая аналитика дома: как обогнать коммерческие API и не разориться» – оказалась близка многим разработчикам и исследователям. Дмитрий рассказал, как построить собственный ML-конвейер для диаризации и речевой аналитики, который превосходит Google Cloud и AWS по качеству на 2–5%, работает в 40 раз быстрее реального времени и при этом полностью разворачивается внутри вашей инфраструктуры – без передачи данных во внешние сервисы.
В основе решения – архитектура на базе FunASR VAD, SimAM-ResNet100 и VBx-кластеризации, упакованная в легкий и удобный FastAPI-сервис. Отдельное внимание уделено метрикам DER и JER, а также тому, как адаптировать систему под конкретные сценарии – от колл-центров до анализа совещаний и интервью.
Доклад собрал множество откликов: участников особенно заинтересовали практические детали обучения моделей и подход к оптимизации вычислений. Мы рады, что подход Инвентос к локальной речевой аналитике нашёл отклик в профессиональном сообществе!
Смотрите запись выступления прямо сейчас!