Повышение точности субтитров в художественных фильмах: технологии и опыт
Наш доклад на конференции по видеотехнологиям VideoTech 2024 — уже доступен для просмотра!
В этом видео вы узнаете: - Почему в тексте голосового сообщения Telegram часто упоминается «DimaTorzok», - Как обучить ИИ понимать Тарантино и Нолана, - О философии параметроэффективного файн-тюнинга и многое другое.
Ключевые моменты доклада:
00:00 Вводим в курс дела 03:37 Есть ли разница между художественным кино и видео с котиками? 07:00 Первый блин комом: пробуем тривиальное решение 10:37 Как измерить качество распознавания? 16:00 Борьба с шумом и поиск голоса 19:44 Заменили движок и стали быстрее, пара слов про переход на CTranslate2 21:43 Fine-tuning: учим модель понимать киноязык 27:56 Данные — новая нефть, тоже дорогие и тоже надо чистить 30:35 Адаптируем формат субтитров под человеческое восприятие 35:06 Подводим итоги 37:20 Вопросы и ответы: о потоковом режиме работы 41:00 Вопросы и ответы: о поддержке различных языков
Мы рады представить первый релиз Transcriber от команды Inventos AI. Попробовать Транскрайбер можно на видеоплатформе Вебкастер, с помощью веб-интерфейса или интегрироваться по API.
Для доступа к сервису свяжитесь с вашим менеджером или пишите в Telegram.