Блог. Инвентос

Повышение точности субтитров в художественных фильмах: технологии и опыт

Наш доклад на конференции по видеотехнологиям VideoTech 2024 — уже доступен для просмотра!

В этом видео вы узнаете:
- Почему в тексте голосового сообщения Telegram часто упоминается «DimaTorzok»,
- Как обучить ИИ понимать Тарантино и Нолана,
- О философии параметроэффективного файн-тюнинга и многое другое.

Ключевые моменты доклада:

00:00 Вводим в курс дела
03:37 Есть ли разница между художественным кино и видео с котиками?
07:00 Первый блин комом: пробуем тривиальное решение
10:37 Как измерить качество распознавания?
16:00 Борьба с шумом и поиск голоса
19:44 Заменили движок и стали быстрее, пара слов про переход на CTranslate2
21:43 Fine-tuning: учим модель понимать киноязык
27:56 Данные — новая нефть, тоже дорогие и тоже надо чистить
30:35 Адаптируем формат субтитров под человеческое восприятие
35:06 Подводим итоги
37:20 Вопросы и ответы: о потоковом режиме работы
41:00 Вопросы и ответы: о поддержке различных языков

Мы рады представить первый релиз Transcriber от команды Inventos AI. Попробовать Транскрайбер можно на видеоплатформе Вебкастер, с помощью веб-интерфейса или интегрироваться по API.

Для доступа к сервису свяжитесь с вашим менеджером или пишите в Telegram.



Inventos AI