Подборка сервисов для расшифровки аудио в текст
Содержание:
- Что такое транскрибация
- 2 лучших плеера для транскрибатора
- Что такое транскрибация текста простыми словами
- Плюсы и минусы транскрибации
- ОБЩИЕ ПОНЯТИЯ О ТРАНСКРИБАЦИИ
- Как выполнить транскрибацию?
- Для кого подойдет такая работа?
- ИСПОЛЬЗОВАНИЕ ОНЛАЙН-СЕРВИСОВ
- Способ 4. RealSpeaker
- Что такое транскрибация и кто такой транскрибер
- Что приходится расшифровывать
- Что такое транскрибация
Что такое транскрибация
Интересно, что в Википедии вы об этом понятии ничего не найдете. Зато в свободном Интернете ему даются весьма простые определения, поскольку услуга действительно пользуется спросом и широко известна среди фрилансеров.
Несмотря на популярность и доступность медиа, текстовый формат удобен для детального анализа и изучения. Представители многих профессий обращаются за расшифровкой различных аудио и видео в текст.
Вот далеко не полный перечень файлов, содержание которых чаще всего просят транскрибировать:
- записи семинаров, круглых столов и конференций;
- вебинары, коучинги, онлайн-уроки, занятия с репетитором;
- запись работы фокус-группы;
- проповеди, лекции, речь перед публикой;
- запись радиотрансляций, телепередач;
- видеоролики и аудиозаписи различного содержания;
- записи с прослушивающих устройств;
- записи судебных заседаний;
- записи телефонных разговоров;
- различные надиктовки.
Мастер транскрибации работает с файлами различного формата и выполняет работу любой сложности. Это зависит от объема, типа расшифровки, качества исходника и т.п.
Таблица: виды транскрибации
Формат исходника | Цель |
|
|
Язык оригинала | Глубина обработки |
|
|
Сложность информации | Качество исходника |
|
|
Сложность восприятия | Дополнительные условия |
|
|
2 лучших плеера для транскрибатора
Если не брать в расчет сервисы распознавания речи, у которых пока скорее больше минусов, чем плюсов для специалиста-транскрибатора, можно значительно оптимизировать свою работу, используя удобные программы.
При переводе голоса в текстовый формат нужны удобный плеер и текстовый редактор.
Если с текстовыми редакторами все более-менее очевидно – Word и его бесплатные аналоги пока вне конкуренции, то с плеерами вопрос открыт.
Бесплатные плееры можно скачать в сети и опытным путем решить, с каким работать удобнее. Остановимся на функциях плеера, которые значительно упростят работу транскрибатора.
- Поддержка разнообразных видео- и аудиоформатов. Заказчики присылают файлы во всех возможных существующих форматах. Удобно, когда не нужно колдовать над ними, переводя в тот, который поддерживает ваш плеер.
- Эквалайзер. Может пригодиться для выделения того звукового сигнала, с которым вы работаете, ослабляя шумы, посторонние звуки и проч.
- Регулировка скорости воспроизведения. Очень полезная функция. Если качество исходного материала хорошее, а ваша скорость печати высокая, то уменьшив скорость воспроизведения, можно набирать текст практически синхронно с говорящим.
- Настройка глобальных горячих клавиш. Это незаменимая функция для транскрибатора. Такие клавиши работают независимо от того, какое приложение активно, вам не нужно переключаться между текстовым редактором и плеером, чтобы нажать паузу, отмотать назад или сделать погромче.
Среди дешифровщиков популярен плеер, созданный русскоговорящими транскрибаторами для своей работы. Автор этого продукта – Дмитрий Дворкин. Очень рекомендую его сайт dvorkin.by, на котором можно узнать много полезных примочек профессионального транскрибатора.
LossPlay
Плеер для расшифровки голоса. Удобный инструмент, в котором собраны все нужные функции для транскрибации, он обладает уникальной и очень полезной фишкой – автоматической вставкой тайм-кода (цифрового сигнала с указанием точного времени записи).
Среди преимуществ этого плеера целый ряд возможностей:
- поддержка многих форматов аудио- и видеозаписей;
- возможность индивидуальной настройки глобальных горячих клавиш;
- 4 отдельных плейлиста с закладками и возможностью переключения между ними;
- замедление и ускорение записи, при этом звук не ухудшается;
- управление плеером без выхода из текстового редактора;
- плеер создавался под работу в текстовом редакторе Word, поэтому корректно работает с ним в связке.
Конечно, это не все преимущества программы – она мало весит, быстро запускается на компьютере и при всех своих достоинствах еще и бесплатна. Авторы предусмотрели возможность добровольного пожертвования, но это на усмотрение пользователя.
Бесплатно скачать плеер LossPlay можно на сайте автора https://dvorkin.by/LossPlay/
Программа популярна, поэтому по работе в ней много уроков, инструкций и мастер-классов в интернете.
Express Scribe
Еще одна программа, наиболее часто используемая транскрибаторами.
Это плеер, совмещенный с текстовым редактором Word, так авторы решили проблему лишних движений при переключении между программами, раскрытыми в разных окнах. Правда, проверка грамотности здесь не работает.
Если вам необходима эта функция, то придется скопировать текст в полноценный Word и там уже использовать привычный инструмент.
Внимание! Если вы случайно удалите текст в плеере, то он нигде не сохранится. Это может стать причиной сильного нервного потрясения
Будьте бдительны!
Плеер создан иностранными специалистами и не имеет русскоязычного интерфейса, но разобраться в настройках легко, рабочее пространство программы интуитивно понятно даже новичку.
Преимущества Express Scribe:
- возможность набирать текст непосредственно в плеере;
- настройка горячих клавиш воспроизведения, перемотки и остановки записи, по умолчанию работают клавиши:
- возможность проставлять закладки в нужных местах аудиофайла;
- мини-формат Scribe Mini, с которым можно работать прямо в Word;
- помощь в улучшении качества звука – снижение фонового шума, увеличение громкости голоса, фильтрация высоких частот;
- для решивших профессионально заниматься транскрибацией программа совместима со специальным оборудованием – ножной педалью.
Из-за популярности программы к ней составлена масса инструкций и видеоуроков, которые легко найти в интернете.
Сам плеер можно бесплатно скачать на сайте разработчика https://www.nch.com.au/scribe/
Бесплатная версия не поддерживает видеофайлы. Перед работой вам придется извлечь звуковую дорожку с помощью специальных программ, например Freemake Video Converter.
Что такое транскрибация текста простыми словами
В первую очередь для отчетливого понимания профессии необходимо разобраться, что такое транскрибация и как заработать на транскрибации текста.
Итак, транскрибация – это удаленная работа по расшифровке аудио и видео в текст. Соответственно, транскрибер (или транскрибатор) – это человек, который выполняет работу по расшифровке аудиодорожек из аудио- и видеофайлов в текст.
Если говорить более простыми словами, то вы будете слушать аудио файл, либо смотреть видеоролик, и параллельно записывать все услышанное содержание в текстовый файл. Затем он отправляется заказчику, тот его проверяет, и в результате вы получаете заслуженную оплату за качественно выполненную работу.
Кто может зарабатывать на транскрибации? Данная работа подходит абсолютно всем интернет-пользователям, которые обладают хорошим слухом и умеют грамотно набирать текст. Часто заработок на транскрибации используют даже школьники и студенты, которые ранее совершенно нигде не работали.
А теперь предлагаю разобрать, какие преимущества и недостатки имеются у заработка в интернете на транскрибации текстов. Это позволит понять, подойдет вам данная сфера деятельности или нет.
Плюсы и минусы удаленной работы транскрибатором
Начнем с положительных моментов и рассмотрим главные плюсы работы транскрибатором:
- в первую очередь, вы сможете работать на себя без строгого графика, начальства, посторонних сотрудников, дресс-кода и других деталей, которые присущи реальной работе;
- вы сможете работать транскрибатором удаленно – дома, на даче или любом другом комфортном для себя месте;
- работа по транскрибации текста развивает многие навыки – вы научитесь быстрее печатать (или даже сможете делать это вслепую), развиваете память, усидчивость, грамотность и т.д.;
- транскрибировать аудио и видео достаточно просто, поэтому такая сфера деятельности подойдет практически любому желающему.
Но работу на дому по транскрибации текста нельзя назвать идеальной. У нее есть 3 недостатка, о которых вам непременно стоит знать:
- вам потребуется самостоятельно находить заказы на транскрибацию, а за счет высокой конкуренции, вы не всегда будете при работе;
- транскрибация аудио и видео в текст является довольно рутинной, скучной и однообразной сферой деятельности. С этим придется только смириться;
- поскольку работа является очень простой и имеет немалую конкуренцию, стоимость транскрибации текста незначительная. Но опять же, все зависит только от полученного объема работы и скорости вашей печати.
Если вы все же решились попробовать себя в переводе видео- и аудиозаписей в текст, т.е. транскрибации, тогда давайте я расскажу еще о нескольких важных деталях, которые требуются для работы.
Плюсы и минусы транскрибации
Плюсы транскрибации
1. Учитесь быстро печатать. С каждым набранным текстом, ваша скорость печати будет только расти. А учитывая, что доход напрямую зависит от этой самой скорости, то это вполне неплохой плюс.
2. Повышаете эрудированность. Аудио и видео бывают разными. Одни скучны и неинтересны, а другие увлекательны и познавательны (например. транскрибация платного контента — в стиле «инвестиции за N шагов»). Но, если быть более реалистичным, то немало времени придется потратить в поисковых системах, пытаясь уточнить значения слов, что в любом случае повысит вашу эрудированность.
3. Повышается усидчивость. Перевод звука в текст — это долго и хлопотно. Поэтому, тут либо вы займетесь чем-то иным, либо у вас станет больше терпения.
4. Фриланс. Многие из подобных задач не требуют личного присутствия (один из плюсов фриланса), кроме того клиентов можно найти в различных биржах. Как говорится, без суматохи, в уютном кресле и с чашечкой чая.
5. Более четкий слух. Тут как со скоростью печати. Часто в записях будут шумы, «смазанности» и тому подобное. А это практика (по сути, тренировка). Поэтому, с каждым таким роликом, постепенно станете лучше различать звуки.
Минусы транскрибации
1. Немалая конкуренция. Это как с копирайтом или рерайтом. Задачи далеко не всегда подразумевают высокую сложность, поэтому они привлекают массу интереса у людей. Соответственно, стоит сразу понимать, что конкуренция в этой области немалая.
2. Монотонность и рутина. Транскрибация подразумевает большое количество монотонных и рутинных задач. Если говорить упрощенно, то схема примерно следующая. Послушали несколько секунд аудио, остановили, записали текст, дальше прослушали еще несколько секунд, снова остановили и записали текст. И так в течение всей записи.
В дополнение к этому, может возникать необходимость узнать значения слов в интернете, повторно слушать по нескольку раз один и тот же фрагмент (чтобы разобраться в том, что говорили люди) и тому подобное.
3. Небольшой доход. Цены в данной области небольшие, поэтому рассчитывать, что транскрибация принесет вам огромные деньги — это верх оптимизма. Справедливости ради, отмечу, что могут быть дорогие заказы, но и требования к ним обычно немалые, включая опыт.
4. Повторяемость заказов. Как уже говорилось, транскрибация монотонна. Но, если бы только этим ограничивалось. Нередко и сами заказы будут повторяться (или будут скучными и однотипными). Тут как с шутками: в первые несколько раз смешно, а дальше нет.
Справедливости ради, всякое в жизни бывает. Например, может нашли такой поток заказов, где материал каждый раз увлекательный и познавательный.
5. Занимает много времени. Рассмотрим гипотетический утрированный пример. Допустим, в 1 минуту люди говорят 1000 символов. Ваша скорость печати, с учетом нюансов транскрибации, 200 символов в минуту. Это означает, что перевести в текст 10 минутный ролик у вас займет, как минимум, 50 минут ( 10 * 1 000 / 200 = 50). Добавьте еще необходимость форматирования и проверки текста. И это уже 1,5-2 часа.
Стоит отметить, что существуют различные нюансы, поэтому не используйте данный пример как ориентир.
ОБЩИЕ ПОНЯТИЯ О ТРАНСКРИБАЦИИ
Рассказать о ней в
«двух словах» проще «пареной репы», но результата от такого рассказа вы не
получите. Поэтому, я расскажу о транскрибации много, но, по существу.
Транскрибация — это
перевод аудио или видео форматов в текст. Чем-то отдалённо напоминает
стенографию. В настоящее время услуга очень востребована.
Транскрибация делится
на три вида:
Первый – это просто
голос.
Например, журналист
наговаривает себе на диктофон запись или студент записывает на диктофон лекцию,
которую впоследствии нужно будет перевести в текст.
Если есть возможность
подключить к микрофону программу для автоматической транскрибации, то тогда она
будет сразу же переводить голос в текст, который после небольшой правки будет
полностью готов к дальнейшему использованию.
Но если такой
возможности нет, то тогда используют сначала диктофон, а потом с диктофона
через микрофон наговаривают текст с использованием программы. Используется этот
вид довольно редко и у заказчиков особой популярностью не пользуется.
Второй – аудиофайлы.
Они позволяют
производить расшифровку полностью или частично, в зависимости от качества
аудиозаписи. После некоторой правки результат можно сразу отправлять заказчику.
Огромный плюс этого
вида — все программы по автоматической или полуавтоматической транскрибации
имеют широкий набор типов аудиофайлов и расширений.
Но имеются и минусы:
не видно действий, места, времени, количество участников, событий. Совершенно
непонятна суть происходящего.
Если запись чёткая, то
ещё полбеды, а если плохая, да к тому с несколькими участниками, то над
переводом придётся изрядно попотеть.
Третий – видеофайлы.
Начну сразу с плюсов.
При плохой записи звука, можно без труда догадаться о сути происходящих
событий, по артикуляции и жестикуляции действий героев.
Но один серьёзный
недостаток сразу портит всю картину — не все программы для автоматической
транскрибации имеют возможность принимать видеофайлы.
В большинстве случаев
требуется разделять файлы на два отдельных формата: аудио и видео, т.е.
разделять дорожки, а это уже дополнительная проблема, так как для этого
требуется дополнительное время.
От того, в каком
формате получен первоначальный файл от заказчика и в каком виде его нужно
предоставить ему обратно зависит:
- Объём выполняемой работы.
- Время, потраченное на его выполнение.
- Уровень сложности.
- Требование к корректуре.
- Ваше итоговое вознаграждение.
Иногда, корректировка
текста может занимать гораздо больше времени, чем непосредственная расшифровка
самой записи.
Рассмотрим три
основных формата корректировки:
Без корректуры, т.е. сразу после расшифровки файла программой текст «один в
один» передаётся заказчику. Этот вид считается самым простым, поэтому и
оплачивается очень дёшево.
Для примера, возьмём
первый попавшийся ролик на Ютуб.
Помимо видео просмотра
в любой момент можно посмотреть текст. Для этого достаточно нажать на (1),
далее на (2) и тут же открывается сам текст (3).
Базовая корректировка, т.е. требуется привести текст к читабельному виду:
строчки должны быть расположены на всю ширину листа и проставлены все
необходимые знаки препинания. Для выполнений такой корректировки нужно
потратить n-е количество времени, следовательно, оплата уже идёт выше, чем за
«голую» расшифровку.
Улучшенная корректировка, т.е. требуется добавить форматирование. Какое
именно, заказчик указывает сам. Это могут быть заголовки, шрифты, таблицы,
абзацы и т.д. Соответственно и стоимость за этот формат самая высокая.
Называться эти форматы
могут, абсолютно, по-разному, поэтому очень важно уточнять у заказчика
скрупулёзно все детали, вплоть до самых незначительных мелочей. Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков»
Ведь,
исходя из объёма и сложности работы, зависит окончательная цена
Если изначально упустить этот
момент из виду, то придётся переделывать работу до «колючих ёжиков». Ведь,
исходя из объёма и сложности работы, зависит окончательная цена.
Очень часто заказчики
пытаются обмануть своих исполнителей, не договаривая того, что они хотят
получить в итоге, а потом просто не оплачивают работу до тех пор, пока не
выполнишь все их требования.
Например, вы в «общих
чертах» договорились с заказчиком о базовой корректировки текста, а он стал
требовать от вас, за те же деньги, с форматированием. И так бывает «часто и
густо».
Так что будьте
внимательны.
Как выполнить транскрибацию?
Как сделать транскрибацию? Самый время затратный способ – сделать все самостоятельно. Для этого необходимо включить звук, запомнить фразу, поставить аудио на паузу и напечатать услышанное в текстовом документе. Причем часто звук уступает по качеству и с первого раза понять речь может не получаться. Тогда приходиться прослушивать одно и то же дважды, а то и трижды и при этом каждый раз переходить из одной программы в другую.
Значительно облегчить процесс можно с помощью специальных программ для транскрибации:
Express Scribe Transcription Software – подходит для операционных систем Mac OS X и Windows. Есть как бесплатная, так и платная версия, но обе они на английском языке. Функции: замедляет скорость воспроизведения звука, поддерживает формат файлов и видео и аудио, работает с Microsoft Word, что дает возможность не тратить время на переключение между программами, так как все будет находиться на одном экране.
LossPlay – простой, бесплатный и русскоязычный плейер для новичков в сфере транскрибации с минимальным количеством настроек, подходящий только для операционной системы Windows. Он поддерживает все популярные форматы аудио, регулирует скорость воспроизведения и работает с Microsoft Word.
Speechpad – это голосовой блокнот, позволяющий конвертировать звук аудио в текст. Устанавливать на компьютер его не нужно, он работает онлайн. Для того, чтобы им воспользоваться потребуется Google Chrome и микрофон. После включения микрофона нужно начинать надиктовывать текст. Программа автоматически все расшифрует и отобразит в текстовом документе. Для конвертирования видео в текст необходимо в строку вставить ссылку с Ютуба и нажать на кнопку запись.
Transcriber-pro – приложение для Windows на русском языке, с помощью которой можно и прослушивать аудио и просматривать видео. С помощью встроенного текстового редактора проставляются временные метки и имена участников диалога. Из готового текста можно делать «интерактивные стенограммы». Воспользоваться этим приложением можно только при годовой подписке, стоимость которой составляет 689 рублей.
RSplayer V1.4 – несложная программа, позволяющая обрабатывать и расшифровывать аудиофайлы с поддержкой горячих клавиш. Работает совместно с Microsoft Word. Скачать ее можно бесплатно и подойдет она только для Windows. Однако, на новых версиях отмечено, что она иногда тормозит.
Voco – профессиональное приложение для операционной системы Windows, позволяющее преобразовывать речь в текстовый формат, а также предоставляет возможность голосового набора в любом тестовом браузере. Для распознавании речи подключение к интернету не требуется и в ней есть большая коллекция тематических словарей. Еще можно купить две расширенные версии: Voco.Professional и Voco.Enterprise. Они работают с уже готовыми аудио файлам. Единственный минус их – высокий ценник.
Dragon Dictation – это приложение для современного мобильного телефона (смартфона), которое распознает надиктованную речь. Причем распознает оно не только русский язык, но и еще 39 иностранных всех разновидностей. Набранный текст можно редактировать, пересылать электронным письмом и в аккаунты социальных сетей или копировать в буфер обмена.
RealSpeaker – это самое уникальное приложение, которое умеет не просто распознавать аудио формат речи, но и живую, которая наговаривается на камеру. Встроенное видеорасширение RealSpeaker позволяет даже считывать движение губ, что положительно сказывается на распознавании речи (увеличивает качество на 30-40%). Также приложение, кроме русского поддерживает еще 10 языков. Воспользоваться приложением можно бесплатно, но это условно на определенный период времени, бессрочная версия обойдется в 2 тыс. руб.
И последний вариант выполнения транскрибации – воспользоваться помощью профессионала, который этим занимается уже давно. Но в таком случае нужно учитывать конечную стоимость работы и во сколько обойдутся услуги исполнителя.
Для кого подойдет такая работа?
Можно встретить вакансии без опыта для тех, кто делает транскрибацию удаленно на авито или фриланс-биржах. А о том, кто такой фрилансер, много говорится в специальной статье на gq-blog.com. Заниматься работой можно удаленно, набирая заказы из предложенных на текущий момент, или сотрудничая с автором напрямую. Главное помнить о качестве работы, соблюдении сроков. Изначально сложно привыкнуть к скорости произношения, особенностям речи, но со временем задача упрощается. Еще один плюс, если вы учите иностранный язык, например, китайский, то сможете легко транскрибировать контент и при этом усовершенствовать навыки владения.
ИСПОЛЬЗОВАНИЕ ОНЛАЙН-СЕРВИСОВ
Это российская
разработка изначально создавалась для распознавания речи и её перевода в
текстовый формат, т.е. достаточно говорить в микрофон, а текст будет набираться
самостоятельно.
Качество, конечно, «не
ахти какое», так как много получается ошибок.
Сервис также частенько
«любит глючить», в этом случае нужно зайти в «Поддержку» и сделать интеграцию
программы.
Если не получится
сделать её самостоятельно, тогда придётся обращаться к специалистам.
В панель для
транскрибации можно залить аудио или видеофайлы, но желательно хорошего
качества, иначе это не сработает.
Также для
транскрибирования аудио необходимо установить виртуальный кабель. Как это
правильно сделать, подробно показано в видео уроках на сайте.
Онлайн сервис dietation.io.
Это зарубежный сервис,
поддерживающий, помимо русского, ещё 30 языков. Никакие аудио и видеофайлы
заливать нельзя. Используется только микрофон и голос, но зато распознаёт
сервис практически без ошибок.
Функций для
форматирования текста здесь немного, так что лучше пользоваться текстовыми
редакторами.
Google Docs.
Гугл Документы –
популярный сервис от Google. Он бесплатный.
Здесь имеется функция
«голосовой ввод», которым любят пользоваться некоторые транскрибаторы для
упрощения работы.
Принцип действий
простейший – слушаешь в наушниках запись, потом надиктовываешь в микрофон. А
сервис уже сам и речь расшифрует, и текст наберёт.
Правда результат здесь
непредсказуем — «фифти-фифти». Иной раз отменный, а иногда ошибок столько, что
быстрее было бы набрать вручную.
Для работы:
— Заходим на страницу Google Docs через свой аккаунт.
— Создаём новый документ (1).
— Подключаем голосовой ввод. Нажимаем «Инструменты» (2) – «Голосовой ввод»
или же «Ctrl+Shift+S».
— Появляется кнопка записи (3). Если её активировать она станет красной.
Внимание! Нельзя, ни в ком случае, переходить на другие вкладки во время
записи, иначе сервис перестаёт работать. Плюсы сервиса:
Плюсы сервиса:
Автоматическое сохранение набранного текста, при любом раскладе, даже при
внезапном отключении электричества.
Редактирование полученного текста можно осуществлять прямо на сервисе, так
как для этого имеется весь набор функций.
Есть, конечно, и
другие программы, но особой необходимости, как дополнение к вышеперечисленным,
в них нет. В общем, это уже «чисто на любителя».
Перечислю только
названия, так как практических навыков работы с ними не имею:
- Онлайн-сервис RealSpeaker.
На нём можно до 1,5 минут транскрибировать бесплатно. Только для аудиофайлов. - Профессиональная программа Transcriber-pro. По отзывам очень интересная и с широкими возможностями. Демо версии нет. Для её приобретения нужно обращаться в техподдержку и решать вопрос с ними лично.
- Программа RSplayer. Очень многие её хвалят. Плеер бесплатный и поддерживает очень многие аудио и видео форматы. Он прост, эффективен и понятен в использовании.
- Программа Windows-VOCO. Тоже классная программа, которая позволяет подключать словари. Чтобы получить пробную версию, нужно также предварительно отправить запрос разработчикам.
Способ 4. RealSpeaker
Простой и удобный, но платный онлайн сервис. Стоимость — 8 рублей/минута, до 1,5 минут — бесплатно. Если объем файла для транскрибации небольшой по времени, есть смысл им воспользоваться.
Достоинства RealSpeaker:
- работает с загруженными медиафайлами
- воспринимает 37 языков мира
- указывает расчетное время транскрибации
Недостатки сервиса:
- платный
- готовый текст после транскрибации доступен всем пользователям.
Рассмотрим бесплатный вариант.
Шаг 1. Заходим на сайт RealSpeaker. Сервис предложит выбрать язык речи, используемый в нашем медиа — выбираем. Нажимаем кнопку «Продолжить».
Шаг 2. Выбираем медиа файл, который необходимо транскрибировать.
Шаг 3. Проверяем, какой файл загрузился, и смотрим, сколько времени займет транскрибация. Нажимаем «Перейти в Мои медиа».
Шаг 4. Нажимаем кнопку «Транскрибировать», которая находится в таблице «Мои медиа» напротив загруженного медиа файла.
Шаг 5. По завершению транскрибации напротив файла появится кнопка «Текст». Нажимаем на неё.
Шаг 6. Откроется окно с текстом и небольшая панель инструментов для редактирования.
Получившийся текст копируем себе в документ и при необходимости исправляем ошибки.
Что такое транскрибация и кто такой транскрибер
Транскрибация — перевод информации голосового формата в текстовый формат. При выполнении транскрибации голосовые данные прослушиваются или обрабатываются программным обеспечением, а потом отображаются в виде текста. Транскрибацию можно выполнять как с помощью специализированных приложений, так и классическим методом, когда прослушивает аудиозапись и переводит в текст человек.
Если упростить до предела, то транскрибация — расшифровка аудио в текст.
Транскрибер — это специалист, который проводит транскрибацию. Иногда данных специалистов называют транскрибаторами. Они посредством технических средств или в процессе самостоятельного прослушивания аудио переводят голосовые данные в текстовые.
Ни в коем случае не путайте транскрибацию со стенографией. Несмотря на то что направления во многом похожи, стенография применяется, как правило, в режиме реального времени.
Стенограф должен быстро переводить голос сразу на бумагу, причём не отставая от говорящего. Для этих задач у стенографов даже был специальный алфавит, который позволял писать быстрее в 2-4 раза, чем с использованием классических букв. Например, такой:
С появлением средств для ведения качественной звукозаписи, стенография потеряла свою актуальность, что сделало данную профессию невостребованной. Да и клавиатура тоже заметно снизила надобность в стенографистах, ибо печатать можно намного быстрее, чем писать от руки.
А транскрибация с появлением таких средств, наоборот, стала востребованной даже в большей степени, ведь разговоры, записанные на диктофон, камеру, в общем, на любое техническое средство, частенько приходится переводить в текстовый формат.
Где нужна транскрибация
На самом деле сейчас транскрибация очень нужна. Интернет стал мощным инструментом для получения прибыли, соответственно, в него потекли потоки денег. И транскриберы могут отщипнуть кусочек от этого пирога.
Но давайте объективно, транскрибация сейчас применяется не только во Всемирной паутине, но и многих других сферах. Например, во многих сферах бизнеса процессы переговоров, а также совещания переводятся в текстовый формат. Фактически, формируется протокол собрания, который потом заверяется и превращается в нормативный документ.
Судебные заседания, частенько, тоже переводятся в письменный формат. Иногда транскрибаторы могут работать в компаниях, где какой-нибудь «генератор идей» в виде креативного менеджера постоянно что-то говорит, пишет на диктофон, а потом транскрибер это переводит в текстовый формат.
Но в интернете важность транскрибации наиболее очевидна. Давайте банальный пример: видео на YouTube
Например, автоматически сгенерированные субтитры к видео будут выглядеть примерно так:
Бессвязная ерунда
Как видите, точность автоматического распознавания достаточно низка, что превращает субтитры в бесполезный хлам, который не будет сочетаться с видео абсолютно.
Да, в данном случае субтитры выглядят странно, ибо это исходный формат. Соответственно, в них прописаны не только слова, но и таймкоды, порядок отображения слов. И опытные транскриберы должны не только уверенно переводить аудио в текст, но и проставлять таймкоды, а также формировать порядок отображения субтитров.
Конечно, данная фишка выглядит сложно, но только для новичков, через несколько дней практики даже новичок сможет уверенно управляться с vtt-файлами субтитров, там нет ничего сложного.
Так что это только выглядит сложным и очень трудоёмким процессом, просто нужно будет привыкнуть к такого рода работе.
Итак, давайте ознакомимся с чем предстоит работать транскриберу:
-
Подготовка субтитров для разного рода видео. Да, транскрибер может работать даже на каком-нибудь Pornhub, готовя субтитры для местных «шедевров».
-
Перевод аудио или видео в текст, например, если владелец канала на YouTube хочет сделать текстовый блог с предоставленной в видео информацией.
-
Подготовка документации. Например, транскрибация и последующая подготовка протоколов заседаний, переговоров.
Ну и ещё куча мелочей, в списке перечислил наиболее серьёзные направления в транскрибации, но проскакивать в этой сфере могут любые задания. На биржах видел даже задачи перевести голосовые сообщения из WhatsApp в текст.
Что приходится расшифровывать
Сколько заказчиков, столько и требований к транскрибатору. Цели у ваших клиентов могут быть разными – от полного дословного перевода с оставленными словами-паразитами и прочим мусором до краткой выжимки самой сути выступления.
Что же приходится транскрибировать? Обозначим наиболее часто встречающиеся виды работ.
Вид транскрибации
Уровень сложности
Характеристика
Надиктовка
* тайм-код не нужен
Автор читает в расчете на последующую транскрибацию – медленно, четко, с выражением.
Лекция
**
тайм-код не нужен
Автор читает в Темп речи выше, чем в надиктовке. Часто встречаются незнакомые термины, названия, имена.
Интервью
**
тайм-код иногда
В основном хорошее качество записи, что упрощает работу, темп речи невысокий, обычно жесткая дословность не нужна.
Синхрон («говорящая голова»)
**
тайм-код нужен
Схож с интервью, часто приходится набирать слова-паразиты и прочий речевой мусор, т.к. большинство людей не способны четко выражать свои мысли.
Подкасты
**
тайм-код иногда
Подкасты напоминают радиопередачи – выходят регулярно, освещают какую-либо тему. Их расшифровка не сопряжена с какими-то большими сложностями, т.к. речь там обычно грамотная, без большого количества мусора, качество звучания на высоте.
Телевизионные передачи
** и выше
тайм-код иногда
Сложность транскрибации телепередач зависит от их направленности. Если это балаган типа «Пусть говорят» или «Время покажет», то нервные клетки транскрибатора будут массово гибнуть на поле боя, а неспешные интервью с телеканала «Культура» — бальзам на транскрибаторскую душу.
Простой вебинар
**
тайм-код иногда
Та же лекция. Один спикер, обучающий интернет аудиторию. Требуется расшифровка только его речи, иногда приходится вставлять реплики из чата.
Сложный вебинар
*** и выше
тайм-код иногда
Несколько участников, сложность вырастает пропорционально количеству говорящих.
Фокус-группа
*** и выше
тайм-код иногда
По форме похожа на сложный вебинар. Несколько говорящих ведут обсуждение по теме. В созыве фокус-группы обычно нуждается социологический опрос или маркетинговое исследование. Если сначала все высказываются по очереди, то ближе к концу обычно неразбериха, все говорят одновременно, перебивают друг друга.
Конференции, заседания любых видов комиссий, администраций, правительств, круглые столы и т.п.
*** и выше
тайм-код иногда
Когда на заседании есть председатель, ведущий дискуссию, работа транскрибатора упрощается. Без председателя все гораздо хуже – спикеры стремятся перебить друг друга, что усложняет расшифровку
Обычно не требуется полная дословность, важно близко к оригиналу передать основную мысль говорящего, убрав словесный мусор.
Прослушка, телефонные разговоры
*****
тайм-код иногда, в местах не подлежащих расшифровке
Высокий уровень сложности обусловлен крайне низким качеством записи, расшифровка прослушек занимает много времени.
Суд
*****
тайм-код иногда
Крайне тяжелая работа. Требует полного воспроизведения любого звука с идентификацией говорящего
При этом качество звучания, как правило, оставляет желать лучшего.
Вид транскрибации |
Уровень сложности |
Характеристика |
Субтитры |
** тайм-код обязательно |
Не слишком сложная работа, но ее специфика в том, что субтитры необходимо четко маркировать тайм-кодом в начале и в конце реплики. |
Простой монтажный лист |
*** |
Перевод в текст реплик героев с их идентификацией, технические комментарии, обязательные тайм-коды. |
Полный монтажный лист |
***** |
Усложненная и развернутая версия простого монтажного листа. Обычно это таблица, где описывается практически каждый кадр, здесь нужен не только перевод речи в текст, но и описание того, что происходит в кадре. |
Что такое транскрибация
Транскрибация – это умение преобразовывать голосовую информацию в текстовую.
Например. Вам дали аудио или видео запись, где человек что-то рассказывает. Ваша задача состоит в том, чтобы перевести голос в текст.
На первый взгляд, кажется, что ничего сложного в этом нет. Включил звук, запомнил пару предложений и записал в текстовый редактор.
В лучшем случае вам повезет, если выступающий говорит без разных: «бе», «ме» и других слов-паразитов. Как показывает практика, таких людей немного. Транскрибатор должен вырезать такие стоп – слова без потери смысла.
Но, иногда в диалоге участвуют два и более человек. Тогда задача усложняется. Нужно понять и не запутаться, кто и о чем говорит.
Случается и такое, что вам могут дать рабочий материал с плохим качеством звука. Тогда придется по несколько раз прослушивать одно и то же предложение, чтобы понять о чем идет речь.