Подборка сервисов для расшифровки аудио в текст

Что такое транскрибация

Интересно, что в Википедии вы об этом понятии ничего не найдете. Зато в свободном Интернете ему даются весьма простые определения, поскольку услуга действительно пользуется спросом и широко известна среди фрилансеров.

Несмотря на популярность и доступность медиа, текстовый формат удобен для детального анализа и изучения. Представители многих профессий обращаются за расшифровкой различных аудио и видео в текст.

Вот далеко не полный перечень файлов, содержание которых чаще всего просят транскрибировать:

  • записи семинаров, круглых столов и конференций;
  • вебинары, коучинги, онлайн-уроки, занятия с репетитором;
  • запись работы фокус-группы;
  • проповеди, лекции, речь перед публикой;
  • запись радиотрансляций, телепередач;
  • видеоролики и аудиозаписи различного содержания;
  • записи с прослушивающих устройств;
  • записи судебных заседаний;
  • записи телефонных разговоров;
  • различные надиктовки.

Мастер транскрибации работает с файлами различного формата и выполняет работу любой сложности. Это зависит от объема, типа расшифровки, качества исходника и т.п.

Таблица: виды транскрибации

Формат исходника Цель
  • Аудиофайлы
  • Видеофайлы
  • Личное пользование
  • Профессиональное пользование
  • Коммерческое пользование
Язык оригинала Глубина обработки
  • Требует перевода
  • Не требует перевода
  • Дословная расшифровка
  • Редактирование
  • Рерайт
  • Перевод на иностранный язык
Сложность информации Качество исходника
  • Требует спец. знаний
  • Доступно всем
  • Хорошее
  • Плохое
  • Подлежит предварительной обработке
Сложность восприятия Дополнительные условия
  • Один голос
  • Диалог
  • Много голосов
  • Расстановка тайм-кодов
  • Идентификация говорящих
  • Расшифровка действий, эмоций

2 лучших плеера для транскрибатора

Если не брать в расчет сервисы распознавания речи, у которых пока скорее больше минусов, чем плюсов для специалиста-транскрибатора, можно значительно оптимизировать свою работу, используя удобные программы.

При переводе голоса в текстовый формат нужны удобный плеер и текстовый редактор.

Если с текстовыми редакторами все более-менее очевидно – Word и его бесплатные аналоги пока вне конкуренции, то с плеерами вопрос открыт.

Бесплатные плееры можно скачать в сети и опытным путем решить, с каким работать удобнее. Остановимся на функциях плеера, которые значительно упростят работу транскрибатора.

  • Поддержка разнообразных видео- и аудиоформатов. Заказчики присылают файлы во всех возможных существующих форматах. Удобно, когда не нужно колдовать над ними, переводя в тот, который поддерживает ваш плеер.
  • Эквалайзер. Может пригодиться для выделения того звукового сигнала, с которым вы работаете, ослабляя шумы, посторонние звуки и проч.
  • Регулировка скорости воспроизведения. Очень полезная функция. Если качество исходного материала хорошее, а ваша скорость печати высокая, то уменьшив скорость воспроизведения, можно набирать текст практически синхронно с говорящим.
  • Настройка глобальных горячих клавиш. Это незаменимая функция для транскрибатора. Такие клавиши работают независимо от того, какое приложение активно, вам не нужно переключаться между текстовым редактором и плеером, чтобы нажать паузу, отмотать назад или сделать погромче.

Среди дешифровщиков популярен плеер, созданный русскоговорящими транскрибаторами для своей работы. Автор этого продукта – Дмитрий Дворкин. Очень рекомендую его сайт dvorkin.by, на котором можно узнать много полезных примочек профессионального транскрибатора.

LossPlay

Плеер для расшифровки голоса. Удобный инструмент, в котором собраны все нужные функции для транскрибации, он обладает уникальной и очень полезной фишкой – автоматической вставкой тайм-кода (цифрового сигнала с указанием точного времени записи).

Среди преимуществ этого плеера целый ряд возможностей:

  • поддержка многих форматов аудио- и видеозаписей;
  • возможность индивидуальной настройки глобальных горячих клавиш;
  • 4 отдельных плейлиста с закладками и возможностью переключения между ними;
  • замедление и ускорение записи, при этом звук не ухудшается;
  • управление плеером без выхода из текстового редактора;
  • плеер создавался под работу в текстовом редакторе Word, поэтому корректно работает с ним в связке.

Конечно, это не все преимущества программы – она мало весит, быстро запускается на компьютере и при всех своих достоинствах еще и бесплатна. Авторы предусмотрели возможность добровольного пожертвования, но это на усмотрение пользователя.

Бесплатно скачать плеер LossPlay можно на сайте автора https://dvorkin.by/LossPlay/

Программа популярна, поэтому по работе в ней много уроков, инструкций и мастер-классов в интернете.

Express Scribe

Еще одна программа, наиболее часто используемая транскрибаторами.

Это плеер, совмещенный с текстовым редактором Word, так авторы решили проблему лишних движений при переключении между программами, раскрытыми в разных окнах. Правда, проверка грамотности здесь не работает.

Если вам необходима эта функция, то придется скопировать текст в полноценный Word и там уже использовать привычный инструмент.

Внимание! Если вы случайно удалите текст в плеере, то он нигде не сохранится. Это может стать причиной сильного нервного потрясения

Будьте бдительны!

Плеер создан иностранными специалистами и не имеет русскоязычного интерфейса, но разобраться в настройках легко, рабочее пространство программы интуитивно понятно даже новичку.

Преимущества Express Scribe:

  • возможность набирать текст непосредственно в плеере;
  • настройка горячих клавиш воспроизведения, перемотки и остановки записи, по умолчанию работают клавиши:
  • возможность проставлять закладки в нужных местах аудиофайла;
  • мини-формат Scribe Mini, с которым можно работать прямо в Word;
  • помощь в улучшении качества звука – снижение фонового шума, увеличение громкости голоса, фильтрация высоких частот;
  • для решивших профессионально заниматься транскрибацией программа совместима со специальным оборудованием – ножной педалью.

Из-за популярности программы к ней составлена масса инструкций и видеоуроков, которые легко найти в интернете.

Сам плеер можно бесплатно скачать на сайте разработчика https://www.nch.com.au/scribe/

Бесплатная версия не поддерживает видеофайлы. Перед работой вам придется извлечь звуковую дорожку с помощью специальных программ, например Freemake Video Converter.

Что такое транскрибация текста простыми словами

В первую очередь для отчетливого понимания профессии необходимо разобраться, что такое транскрибация и как заработать на транскрибации текста.

Итак, транскрибация – это удаленная работа по расшифровке аудио и видео в текст. Соответственно, транскрибер (или транскрибатор) – это человек, который выполняет работу по расшифровке аудиодорожек из аудио- и видеофайлов в текст.

Если говорить более простыми словами, то вы будете слушать аудио файл, либо смотреть видеоролик, и параллельно записывать все услышанное содержание в текстовый файл. Затем он отправляется заказчику, тот его проверяет, и в результате вы получаете заслуженную оплату за качественно выполненную работу.

Кто может зарабатывать на транскрибации? Данная работа подходит абсолютно всем интернет-пользователям, которые обладают хорошим слухом и умеют грамотно набирать текст. Часто заработок на транскрибации используют даже школьники и студенты, которые ранее совершенно нигде не работали.

А теперь предлагаю разобрать, какие преимущества и недостатки имеются у заработка в интернете на транскрибации текстов. Это позволит понять, подойдет вам данная сфера деятельности или нет.

Плюсы и минусы удаленной работы транскрибатором

Начнем с положительных моментов и рассмотрим главные плюсы работы транскрибатором:

  • в первую очередь, вы сможете работать на себя без строгого графика, начальства, посторонних сотрудников, дресс-кода и других деталей, которые присущи реальной работе;
  • вы сможете работать транскрибатором удаленно – дома, на даче или любом другом комфортном для себя месте;
  • работа по транскрибации текста развивает многие навыки – вы научитесь быстрее печатать (или даже сможете делать это вслепую), развиваете память, усидчивость, грамотность и т.д.;
  • транскрибировать аудио и видео достаточно просто, поэтому такая сфера деятельности подойдет практически любому желающему.

Но работу на дому по транскрибации текста нельзя назвать идеальной. У нее есть 3 недостатка, о которых вам непременно стоит знать:

  • вам потребуется самостоятельно находить заказы на транскрибацию, а за счет высокой конкуренции, вы не всегда будете при работе;
  • транскрибация аудио и видео в текст является довольно рутинной, скучной и однообразной сферой деятельности. С этим придется только смириться;
  • поскольку работа является очень простой и имеет немалую конкуренцию, стоимость транскрибации текста незначительная. Но опять же, все зависит только от полученного объема работы и скорости вашей печати.

Если вы все же решились попробовать себя в переводе видео- и аудиозаписей в текст, т.е. транскрибации, тогда давайте я расскажу еще о нескольких важных деталях, которые требуются для работы.

Плюсы и минусы транскрибации

Плюсы транскрибации

1. Учитесь быстро печатать. С каждым набранным текстом, ваша скорость печати будет только расти. А учитывая, что доход напрямую зависит от этой самой скорости, то это вполне неплохой плюс.

2. Повышаете эрудированность. Аудио и видео бывают разными. Одни скучны и неинтересны, а другие увлекательны и познавательны (например. транскрибация платного контента — в стиле «инвестиции за N шагов»). Но, если быть более реалистичным, то немало времени придется потратить в поисковых системах, пытаясь уточнить значения слов, что в любом случае повысит вашу эрудированность. 

3. Повышается усидчивость. Перевод звука в текст — это долго и хлопотно. Поэтому, тут либо вы займетесь чем-то иным, либо у вас станет больше терпения.

4. Фриланс. Многие из подобных задач не требуют личного присутствия (один из плюсов фриланса), кроме того клиентов можно найти в различных биржах. Как говорится, без суматохи, в уютном кресле и с чашечкой чая.

5. Более четкий слух. Тут как со скоростью печати. Часто в записях будут шумы, «смазанности» и тому подобное. А это практика (по сути, тренировка). Поэтому, с каждым таким роликом, постепенно станете лучше различать звуки.

Минусы транскрибации

1. Немалая конкуренция. Это как с копирайтом или рерайтом. Задачи далеко не всегда подразумевают высокую сложность, поэтому они привлекают массу интереса у людей. Соответственно, стоит сразу понимать, что конкуренция в этой области немалая.

2. Монотонность и рутина. Транскрибация подразумевает большое количество монотонных и рутинных задач. Если говорить упрощенно, то схема примерно следующая. Послушали несколько секунд аудио, остановили, записали текст, дальше прослушали еще несколько секунд, снова остановили и записали текст. И так в течение всей записи.

В дополнение к этому, может возникать необходимость узнать значения слов в интернете, повторно слушать по нескольку раз один и тот же фрагмент (чтобы разобраться в том, что говорили люди) и тому подобное.

3. Небольшой доход. Цены в данной области небольшие, поэтому рассчитывать, что транскрибация принесет вам огромные деньги — это верх оптимизма. Справедливости ради, отмечу, что могут быть дорогие заказы, но и требования к ним обычно немалые, включая опыт.

4. Повторяемость заказов. Как уже говорилось, транскрибация монотонна. Но, если бы только этим ограничивалось. Нередко и сами заказы будут повторяться (или будут скучными и однотипными). Тут как с шутками: в первые несколько раз смешно, а дальше нет.

Справедливости ради, всякое в жизни бывает. Например, может нашли такой поток заказов, где материал каждый раз увлекательный и познавательный.

5. Занимает много времени. Рассмотрим гипотетический утрированный пример. Допустим, в 1 минуту люди говорят 1000 символов. Ваша скорость печати, с учетом нюансов транскрибации, 200 символов в минуту. Это означает, что перевести в текст 10 минутный ролик у вас займет, как минимум, 50 минут ( 10 * 1 000 / 200 = 50). Добавьте еще необходимость форматирования и проверки текста. И это уже 1,5-2 часа.

Стоит отметить, что существуют различные нюансы, поэтому не используйте данный пример как ориентир.

ОБЩИЕ ПОНЯТИЯ О ТРАНСКРИБАЦИИ

Рассказать о ней в
«двух словах» проще «пареной репы», но результата от такого рассказа вы не
получите. Поэтому, я расскажу о транскрибации много, но, по существу.

Транскрибация — это
перевод аудио или видео форматов в текст. Чем-то отдалённо напоминает
стенографию. В настоящее время услуга очень востребована.

Транскрибация делится
на три вида:

Первый – это просто
голос.

Например, журналист
наговаривает себе на диктофон запись или студент записывает на диктофон лекцию,
которую впоследствии нужно будет перевести в текст.

Если есть возможность
подключить к микрофону программу для автоматической транскрибации, то тогда она
будет сразу же переводить голос в текст, который после небольшой правки будет
полностью готов к дальнейшему использованию.

Но если такой
возможности нет, то тогда используют сначала диктофон, а потом с диктофона
через микрофон наговаривают текст с использованием программы. Используется этот
вид довольно редко и у заказчиков особой популярностью не пользуется.

Второй – аудиофайлы.

Они позволяют
производить расшифровку полностью или частично, в зависимости от качества
аудиозаписи. После некоторой правки результат можно сразу отправлять заказчику.

Огромный плюс этого
вида — все программы по автоматической или полуавтоматической транскрибации
имеют широкий набор типов аудиофайлов и расширений.

Но имеются и минусы:
не видно действий, места, времени, количество участников, событий. Совершенно
непонятна суть происходящего.

Если запись чёткая, то
ещё полбеды, а если плохая, да к тому с несколькими участниками, то над
переводом придётся изрядно попотеть.

Третий – видеофайлы.

Начну сразу с плюсов.
При плохой записи звука, можно без труда догадаться о сути происходящих
событий, по артикуляции и жестикуляции действий героев.

Но один серьёзный
недостаток сразу портит всю картину — не все программы для автоматической
транскрибации имеют возможность принимать видеофайлы.

В большинстве случаев
требуется разделять файлы на два отдельных формата: аудио и видео, т.е.
разделять дорожки, а это уже дополнительная проблема, так как для этого
требуется дополнительное время.

От того, в каком
формате получен первоначальный файл от заказчика и в каком виде его нужно
предоставить ему обратно зависит:

  1. Объём выполняемой работы.
  2. Время, потраченное на его выполнение.
  3. Уровень сложности.
  4. Требование к корректуре.
  5. Ваше итоговое вознаграждение.

Иногда, корректировка
текста может занимать гораздо больше времени, чем непосредственная расшифровка
самой записи.

Рассмотрим три
основных формата корректировки:

Без корректуры, т.е. сразу после расшифровки файла программой текст «один в
один» передаётся заказчику. Этот вид считается самым простым, поэтому и
оплачивается очень дёшево.

Для примера, возьмём
первый попавшийся ролик на Ютуб.

Помимо видео просмотра
в любой момент можно посмотреть текст. Для этого достаточно нажать на (1),
далее на (2) и тут же открывается сам текст (3).

Базовая корректировка, т.е. требуется привести текст к читабельному виду:
строчки должны быть расположены на всю ширину листа и проставлены все
необходимые знаки препинания. Для выполнений такой корректировки нужно
потратить n-е количество времени, следовательно, оплата уже идёт выше, чем за
«голую» расшифровку.

Улучшенная корректировка, т.е. требуется добавить форматирование. Какое
именно, заказчик указывает сам. Это могут быть заголовки, шрифты, таблицы,
абзацы и т.д. Соответственно и стоимость за этот формат самая высокая.

Называться эти форматы
могут, абсолютно, по-разному, поэтому очень важно уточнять у заказчика
скрупулёзно все детали, вплоть до самых незначительных мелочей. Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков»

Ведь,
исходя из объёма и сложности работы, зависит окончательная цена

Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков». Ведь,
исходя из объёма и сложности работы, зависит окончательная цена.

Очень часто заказчики
пытаются обмануть своих исполнителей, не договаривая того, что они хотят
получить в итоге, а потом просто не оплачивают работу до тех пор, пока не
выполнишь все их требования.

Например, вы в «общих
чертах» договорились с заказчиком о базовой корректировки текста, а он стал
требовать от вас, за те же деньги, с форматированием. И так бывает «часто и
густо».

Так что будьте
внимательны.

Как выполнить транскрибацию?

Как сделать транскрибацию? Самый время затратный способ – сделать все самостоятельно. Для этого необходимо включить звук, запомнить фразу, поставить аудио на паузу и напечатать услышанное в текстовом документе. Причем часто звук уступает по качеству и с первого раза понять речь может не получаться. Тогда приходиться прослушивать одно и то же дважды, а то и трижды и при этом каждый раз переходить из одной программы в другую.

Значительно облегчить процесс можно с помощью специальных программ для транскрибации:

Express Scribe Transcription Software – подходит для операционных систем Mac OS X и Windows. Есть как бесплатная, так и платная версия, но обе они на английском языке. Функции: замедляет скорость воспроизведения звука, поддерживает формат файлов и видео и аудио, работает с Microsoft Word, что дает возможность не тратить время на переключение между программами, так как все будет находиться на одном экране.

LossPlay – простой, бесплатный и русскоязычный плейер для новичков в сфере транскрибации с минимальным количеством настроек, подходящий только для операционной системы Windows. Он поддерживает все популярные форматы аудио, регулирует скорость воспроизведения и работает с Microsoft Word.

Speechpad – это голосовой блокнот, позволяющий конвертировать звук аудио в текст. Устанавливать на компьютер его не нужно, он работает онлайн. Для того, чтобы им воспользоваться потребуется Google Chrome и микрофон. После включения микрофона нужно начинать надиктовывать текст. Программа автоматически все расшифрует и отобразит в текстовом документе. Для конвертирования видео в текст необходимо в строку вставить ссылку с Ютуба и нажать на кнопку запись.

Transcriber-pro – приложение для Windows на русском языке, с помощью которой можно и прослушивать аудио и просматривать видео. С помощью встроенного текстового редактора проставляются временные метки и имена участников диалога. Из готового текста можно делать «интерактивные стенограммы». Воспользоваться этим приложением можно только при годовой подписке, стоимость которой составляет 689 рублей.

RSplayer V1.4 – несложная программа, позволяющая обрабатывать и расшифровывать аудиофайлы с поддержкой горячих клавиш. Работает совместно с Microsoft Word. Скачать ее можно бесплатно и подойдет она только для Windows. Однако, на новых версиях отмечено, что она иногда тормозит.

Voco – профессиональное приложение для операционной системы Windows, позволяющее преобразовывать речь в текстовый формат, а также предоставляет возможность голосового набора в любом тестовом браузере. Для распознавании речи подключение к интернету не требуется и в ней есть большая коллекция тематических словарей. Еще можно купить две расширенные версии: Voco.Professional и Voco.Enterprise. Они работают с уже готовыми аудио файлам. Единственный минус их – высокий ценник.

Dragon Dictation – это приложение для современного мобильного телефона (смартфона), которое распознает надиктованную речь. Причем распознает оно не только русский язык, но и еще 39 иностранных всех разновидностей. Набранный текст можно редактировать, пересылать электронным письмом и в аккаунты социальных сетей или копировать в буфер обмена.

RealSpeaker – это самое уникальное приложение, которое умеет не просто распознавать аудио формат речи, но и живую, которая наговаривается на камеру. Встроенное видеорасширение RealSpeaker позволяет даже считывать движение губ, что положительно сказывается на распознавании речи (увеличивает качество на 30-40%). Также приложение, кроме русского поддерживает еще 10 языков. Воспользоваться приложением можно бесплатно, но это условно на определенный период времени, бессрочная версия обойдется в 2 тыс. руб.

И последний вариант выполнения транскрибации – воспользоваться помощью профессионала, который этим занимается уже давно. Но в таком случае нужно учитывать конечную стоимость работы и во сколько обойдутся услуги исполнителя.

Для кого подойдет такая работа?

Можно встретить вакансии без опыта для тех, кто делает транскрибацию удаленно на авито или фриланс-биржах. А о том, кто такой фрилансер, много говорится в специальной статье на gq-blog.com. Заниматься работой можно удаленно, набирая заказы из предложенных на текущий момент, или сотрудничая с автором напрямую. Главное помнить о качестве работы, соблюдении сроков. Изначально сложно привыкнуть к скорости произношения, особенностям речи, но со временем задача упрощается. Еще один плюс, если вы учите иностранный язык, например, китайский, то сможете легко транскрибировать контент и при этом усовершенствовать навыки владения.

ИСПОЛЬЗОВАНИЕ ОНЛАЙН-СЕРВИСОВ

Это российская
разработка изначально создавалась для распознавания речи и её перевода в
текстовый формат, т.е. достаточно говорить в микрофон, а текст будет набираться
самостоятельно.

Качество, конечно, «не
ахти какое», так как много получается ошибок.

Сервис также частенько
«любит глючить», в этом случае нужно зайти в «Поддержку» и сделать интеграцию
программы.

Если не получится
сделать её самостоятельно, тогда придётся обращаться к специалистам.

В панель для
транскрибации можно залить аудио
или видеофайлы, но желательно хорошего
качества, иначе это не сработает.

Также для
транскрибирования аудио необходимо установить виртуальный кабель. Как это
правильно сделать, подробно показано в видео уроках на сайте.

Онлайн сервис dietation.io.    

Это зарубежный сервис,
поддерживающий, помимо русского, ещё 30 языков. Никакие аудио и видеофайлы
заливать нельзя. Используется только микрофон и голос, но зато распознаёт
сервис практически без ошибок.

Функций для
форматирования текста здесь немного, так что лучше пользоваться текстовыми
редакторами.

Google Docs.

Гугл Документы –
популярный сервис от Google. Он бесплатный.

Здесь имеется функция
«голосовой ввод», которым любят пользоваться некоторые транскрибаторы для
упрощения работы.

Принцип действий
простейший – слушаешь в наушниках запись, потом надиктовываешь в микрофон. А
сервис уже сам и речь расшифрует, и текст наберёт.

Правда результат здесь
непредсказуем — «фифти-фифти». Иной раз отменный, а иногда ошибок столько, что
быстрее было бы набрать вручную.

Для работы:

— Заходим на страницу Google Docs через свой аккаунт.

— Создаём новый документ (1).

— Подключаем голосовой ввод. Нажимаем «Инструменты» (2) – «Голосовой ввод»
или же «Ctrl+Shift+S».

— Появляется кнопка записи (3). Если её активировать она станет красной.

Внимание! Нельзя, ни в ком случае, переходить на другие вкладки во время
записи, иначе сервис перестаёт работать. Плюсы сервиса:

Плюсы сервиса:

Автоматическое сохранение набранного текста, при любом раскладе, даже при
внезапном отключении электричества.

Редактирование полученного текста можно осуществлять прямо на сервисе, так
как для этого имеется весь набор функций.

Есть, конечно, и
другие программы, но особой необходимости, как дополнение к вышеперечисленным,
в них нет. В общем, это уже «чисто на любителя».

Перечислю только
названия, так как практических навыков работы с ними не имею:

  1. Онлайн-сервис RealSpeaker.
    На нём можно до 1,5 минут транскрибировать бесплатно. Только для аудиофайлов.
  2.   Профессиональная программа Transcriber-pro. По отзывам очень интересная и с широкими возможностями. Демо версии нет. Для её приобретения нужно обращаться в техподдержку и решать вопрос с ними лично.  
  3.    Программа RSplayer. Очень многие её хвалят. Плеер бесплатный и поддерживает очень многие аудио и видео форматы. Он прост, эффективен и понятен в использовании.  
  4.   Программа Windows-VOCO. Тоже классная программа, которая позволяет подключать словари. Чтобы получить пробную версию, нужно также предварительно отправить запрос разработчикам.  

Способ 4. RealSpeaker

Простой и удобный, но платный онлайн сервис. Стоимость — 8 рублей/минута, до 1,5 минут — бесплатно. Если объем файла для транскрибации небольшой по времени, есть смысл им воспользоваться.

Достоинства RealSpeaker:

  • работает с загруженными медиафайлами
  • воспринимает 37 языков мира
  • указывает расчетное время транскрибации

Недостатки сервиса:

  • платный
  • готовый текст после транскрибации доступен всем пользователям.

Рассмотрим бесплатный вариант.

Шаг 1. Заходим на сайт RealSpeaker. Сервис предложит выбрать язык речи, используемый в нашем медиа — выбираем. Нажимаем кнопку «Продолжить».

Шаг 2. Выбираем медиа файл, который необходимо транскрибировать.

Шаг 3. Проверяем, какой файл загрузился, и смотрим, сколько времени займет транскрибация. Нажимаем «Перейти в Мои медиа».

Шаг 4. Нажимаем кнопку «Транскрибировать», которая находится в таблице «Мои медиа» напротив загруженного медиа файла.

Шаг 5. По завершению транскрибации напротив файла появится кнопка «Текст». Нажимаем на неё.

Шаг 6. Откроется окно с текстом и небольшая панель инструментов для редактирования.

Получившийся текст копируем себе в документ и при необходимости исправляем ошибки.

Что такое транскрибация и кто такой транскрибер

Транскрибация — перевод информации голосового формата в текстовый формат. При выполнении транскрибации голосовые данные прослушиваются или обрабатываются программным обеспечением, а потом отображаются в виде текста. Транскрибацию можно выполнять как с помощью специализированных приложений, так и классическим методом, когда прослушивает аудиозапись и переводит в текст человек.

Если упростить до предела, то транскрибация — расшифровка аудио в текст.

Транскрибер — это специалист, который проводит транскрибацию. Иногда данных специалистов называют транскрибаторами. Они посредством технических средств или в процессе самостоятельного прослушивания аудио переводят голосовые данные в текстовые.

Ни в коем случае не путайте транскрибацию со стенографией. Несмотря на то что направления во многом похожи, стенография применяется, как правило, в режиме реального времени.

Стенограф должен быстро переводить голос сразу на бумагу, причём не отставая от говорящего. Для этих задач у стенографов даже был специальный алфавит, который позволял писать быстрее в 2-4 раза, чем с использованием классических букв. Например, такой:

С появлением средств для ведения качественной звукозаписи, стенография потеряла свою актуальность, что сделало данную профессию невостребованной. Да и клавиатура тоже заметно снизила надобность в стенографистах, ибо печатать можно намного быстрее, чем писать от руки.

А транскрибация с появлением таких средств, наоборот, стала востребованной даже в большей степени, ведь разговоры, записанные на диктофон, камеру, в общем, на любое техническое средство, частенько приходится переводить в текстовый формат.

Где нужна транскрибация

На самом деле сейчас транскрибация очень нужна. Интернет стал мощным инструментом для получения прибыли, соответственно, в него потекли потоки денег. И транскриберы могут отщипнуть кусочек от этого пирога.

Но давайте объективно, транскрибация сейчас применяется не только во Всемирной паутине, но и многих других сферах. Например, во многих сферах бизнеса процессы переговоров, а также совещания переводятся в текстовый формат. Фактически, формируется протокол собрания, который потом заверяется и превращается в нормативный документ.

Судебные заседания, частенько, тоже переводятся в письменный формат. Иногда транскрибаторы могут работать в компаниях, где какой-нибудь «генератор идей» в виде креативного менеджера постоянно что-то говорит, пишет на диктофон, а потом транскрибер это переводит в текстовый формат.

Но в интернете важность транскрибации наиболее очевидна. Давайте банальный пример: видео на YouTube

Например, автоматически сгенерированные субтитры к видео будут выглядеть примерно так:

Бессвязная ерунда

Как видите, точность автоматического распознавания достаточно низка, что превращает субтитры в бесполезный хлам, который не будет сочетаться с видео абсолютно.

Да, в данном случае субтитры выглядят странно, ибо это исходный формат. Соответственно, в них прописаны не только слова, но и таймкоды, порядок отображения слов. И опытные транскриберы должны не только уверенно переводить аудио в текст, но и проставлять таймкоды, а также формировать порядок отображения субтитров.

Конечно, данная фишка выглядит сложно, но только для новичков, через несколько дней практики даже новичок сможет уверенно управляться с vtt-файлами субтитров, там нет ничего сложного.

Так что это только выглядит сложным и очень трудоёмким процессом, просто нужно будет привыкнуть к такого рода работе.

Итак, давайте ознакомимся с чем предстоит работать транскриберу:

  1. Подготовка субтитров для разного рода видео. Да, транскрибер может работать даже на каком-нибудь Pornhub, готовя субтитры для местных «шедевров».

  2. Перевод аудио или видео в текст, например, если владелец канала на YouTube хочет сделать текстовый блог с предоставленной в видео информацией.

  3. Подготовка документации. Например, транскрибация и последующая подготовка протоколов заседаний, переговоров.

Ну и ещё куча мелочей, в списке перечислил наиболее серьёзные направления в транскрибации, но проскакивать в этой сфере могут любые задания. На биржах видел даже задачи перевести голосовые сообщения из WhatsApp в текст.

Что приходится расшифровывать

Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.

Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.

Вид транскрибации
Уровень сложности
Характеристика
Надиктовка
* тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**
тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**
тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**
тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**
тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и выше
тайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» — бальзам на транскрибаторскую душу.
Простой вебинар
**
тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше
тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше
тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше
тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку

Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
*****
тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
*****
тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего

При этом качество звучания, как правило, оставляет желать лучшего.

Вид транскрибации

Уровень сложности

Характеристика

Субтитры

** тайм-код обязательно

Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики.

Простой монтажный лист

***
тайм-код обязательно

Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды.

Полный монтажный лист

*****
тайм-код обязательно

Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре.

Что такое транскрибация

Транскрибация – это умение преобразовывать голосовую информацию в текстовую.

Например. Вам дали аудио или видео запись, где человек что-то рассказывает. Ваша задача состоит в том, чтобы перевести голос в текст.

На первый взгляд, кажется, что ничего сложного в этом нет. Включил звук, запомнил пару предложений и записал в текстовый редактор.

В лучшем случае вам повезет, если выступающий говорит без разных: «бе», «ме» и других слов-паразитов. Как показывает практика, таких людей немного. Транскрибатор должен вырезать такие стоп – слова без потери смысла.

Но, иногда в диалоге участвуют два и более человек. Тогда задача усложняется. Нужно понять и не запутаться, кто и о чем говорит.

Случается и такое, что вам могут дать рабочий материал с плохим качеством звука. Тогда придется по несколько раз прослушивать одно и то же предложение, чтобы понять о чем идет речь.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector