Транскрибация аудио в текст

Содержание:

Основные навыки и инструменты транскрибатора

Специальных знаний и умений для выполнения транскрибации не требуется. Однако минимальный набор навыков всё же необходим.

Навык работы в текстовом редакторе. На начальном уровне желательно иметь представление о редакторе Word. Со временем лучше освоить Google Docs — онлайн-офис, работающий в рамках веб-браузера без установки на компьютер. Это очень удобно, так как пользоваться им можно с любого устройства, подключенного к интернету. Кроме того, офис позволяет работать офлайн и предоставлять доступ другим пользователям, например, заказчикам. 

Навык быстрой печати. Лучше освоить печать вслепую, ведь в таком случае производительность труда будет на порядок выше.  

Из инструментов для выполнения транскрибации понадобятся наушники и микрофон. Если работа выполняется на ноутбуке, можно пользоваться встроенным микрофоном. Но удобнее всего работать, когда он расположен прямо на наушниках. Комплект наушников с микрофоном надо купить и подсоединить в специально предусмотренный для этого разъем на компьютере. 

 Для работы в некоторых сервисах может потребоваться стерео микшер . Этот инструмент находится в настройках звука компьютера. 

Где искать заказы?

Поиск заказов – головная боль фрилансера. Вы можете быть мега-крутым спецом, но без навыков самопрезентации так и продолжите утопать в болоте низких заработков. Поэтому ниже рассмотрим, куда новичку стоит податься и как при этом действовать.

Рекомендую прочитать также:

Заработок на комментариях в интернете — где искать заказы? ТОП-7 площадок

Новичкам трудно найти хорошую работу в Интернете. За простые задания платят копейки, а фриланс требует профессиональных навыков в узкой

Биржи фриланса

Если честно, биржи фриланса для транскрибатора – это дно. Но если вы никогда раньше не работали на удалёнке, то такие площадки выручат на первых порах. Вам не придётся виртуозно описывать свои конкурентные преимущества и вкладывать последние сбережения в рекламу. Просто активно подавайте заявки на самые дешёвые проекты. Кто-нибудь обязательно скинет вам заказ. Поработаете за миску супа, поднимете рейтинг, соберёте портфолио и положительные отзывы. А когда повысите ЧСВ, уйдёте в свободное плавание.

Только не пишите в заявках банальщину вроде «Выполню качественно и в срок». Иначе у потенциального клиента начнёт дёргаться глаз.

Вот список популярных бирж фриланса, где есть заработок на транскрибации:

  • Weblancer;
  • Fl;
  • Freelancehunt;
  • Work-Zilla;
  • Freelance.youdo.

Заработок на бирже Work-Zilla Также советуем заглянуть на сайт Kwork. Тут можно самостоятельно создать объявление с описанием услуги и назначить цену. Тарифы выше средних по рынку, хотя начинающим транскрибаторам нелегко привлечь клиентов.

Социальные площадки

Расценки чаще радуют, чем огорчают. Например, заказчики из telegram-каналов нередко платят исполнителям от 20 рублей за расшифровку 1 минуты записи или предлагают работу по договору подряда со стабильным окладом (15-30 тысяч рублей в месяц).

Вакансия для транскрибатора в Telegram

Порталы трудоустройства

Этот канал редко задействуют специалисты, которые работают на удалёнке. Поэтому в случае обнаружения привлекательной вакансии вы с высокой вероятностью получите огромный пул заказов. Как правило, работодатели с порталов предлагают заключить договор подряда. Это очень удобно, если вы не хотите самостоятельно возиться с оформлением деятельности и уплатой налогов.

Советуем обратить внимание на три площадки:

  • HH;
  • Суперджоб;
  • Trud.

Рекомендую прочитать также:

Как создать и продвинуть телеграм-канал: 6 методик, которые реально работают

Мобильное приложение Telegram появилось в 2013 году. Сегодня его аудитория насчитывает более 400 млн человек и продолжает расти в

На остальных сайтах размещается слишком мало вакансий для транскрибаторов, поэтому вы просто потратите время впустую. При поиске заработков используйте запросы «расшифровка», «аудио», «видео», «набор текста», «стенографист». Подходящая вам вакансия может иметь совершенно разные названия, поэтому обязательно просматривайте список обязанностей.

Вакансия для транскрибатора на сайте HH

Собственные площадки

Это вариант на перспективу. Когда вы почувствуете себя настоящим профи, соберёте внушительное портфолио и отзывы. Суть в том, чтобы создать сайт-визитку (или даже профессиональную группу в социальной сети), настроить рекламу и начать брать дорогие заказы.

Некоторые транскрибаторы даже нанимают помощников с целью масштабировать бизнес. Такой подход к делу способен приносить заработок от 1000$ в месяц.

Агентство, оказывающее услугу транскрибации

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.

А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!

Программа «Laitis»

Бесплатная русскоязычная программа для распознавания голоса «Laitis» обладает хорошим качеством понимания речи, и, по мнению её создателей, способна практически полностью заменить пользователю привычную клавиатуру. Программа хорошо работает и с голосовыми командами, позволяя с их помощью выполнять множество действий по управлению компьютером.

Для своей работы программа требует обязательного наличия на ПК скоростного интернета (в работе программы используются сетевые сервисы распознавания голоса от «Google» и «Yandex»). Возможности программы позволяют, также, управлять с помощью голосовых команд и вашим браузером, для чего необходима установка на веб-навигатор специального расширения от «Laitis» (Chrome, Mozilla, Opera).

Для чего нужно переводить аудио в текст

Для начала поговорим, для чего вообще может понадобиться транскрибация. Тут на самом деле очень много вариантов.

  • Достаточно часто требуется расшифровка аудио какого-нибудь семинара очередного “гуру”. Он вещает час-два и его записывают на видео. А потом нужно все это дело издать в виде методички или книги. Это транскрибация так называемого вебинара. Кстати, вебинары расшифровывать немного легче, так как в случае невнятного звука можно иногда догадаться о чем речь по жестам и поведению спикера.
  • Иногда обращаются журналисты. Они могут надиктовывать себе заметки на диктофон в течение выполнения какого-нибудь журналисткого расследования. И потом все аудио это нужно перевести в текст.
  • Достаточно редкие “клиенты” транскрибатора это “настоящие писатели”. Они тоже сейчас часто любят надиктовывать книги в аудиофайл, а потом переносить на бумагу.

  • Часто нужно транскрибировать аудиоподкасты. Кстати, что такое аудиоподкаст? Если по русски- это устное сообщение владельца сайта или блога своим подписчикам.
  • Расшифровка аудио в текст разного рода интервью. Тут Вы понимаете, что нужно журналистам и всякого рода блоггерам.
  • Иногда нужна расшифровка телефонных переговоров. Чаще всего такие работы заказывают фирмы для фиксации внутрикорпоративных переговоров.
  • Еще бывает транскрибация совещаний. Но эту работу часто выполняют сами секретари и не отдают на аутсорсинг. Кстати, если Вы секретарь, то возьмите мои советы себе на вооружение.

Я перечислил только малую часть тех задач по транскрибации, для решения которых может понадобиться профессиональный транскрибатор. Этих задач может быть намного больше. Так что работа для “аудиопереводчика” всегда найдется.

«Gboard» — мобильное приложение преобразователь записи в текст

Мобильное приложение «Gboard» является популярным приложением для Android и iOS, позволяя осуществлять длительный голосовой ввод с дальнейшей трансформацией сказанного в стандартный текст (конвертация голоса в текст). Для задействования режима голосового ввода достаточно нажать и удерживать сенсорную клавишу пробела (Space) на клавиатуре, после чего вы сможете говорить так долго как захотите — всё сказанное вами будет переведено программой в текст.

Для активации голосового ввода в «Gboard» достаточно нажать и удерживать пробел

Приложение абсолютно бесплатно, поддерживает несколько десятков языков, среди которых и русский.

«Voco» — программа быстро переведёт голос в текстовый документ

Ещё один преобразователь голоса в текст – это платный цифровой продукт «Voco», цена «домашней» версии которого ныне составляет около 1700 рублей. Более продвинутые и дорогие варианты данной программы – «Voco.Professional» и «Voco.Enterprise» имеют ряд дополнительных возможностей, одной из которых является распознавание речи из имеющихся у пользователя аудиозаписей.

Среди особенностей «Voco» отмечу возможность дополнения словарного запаса программы (ныне словарный запас программы включает более 85 тысяч слов), а также её автономную работу от сети, позволяющую не зависеть от вашего подключения к Интернету.

Приложение включается довольно просто — достаточно дважды нажать на клавишу «Ctrl».

Speechlogger

Увеличить

Speechlogger – приложение для мобильных устройств под управлением Android, которое можно бесплатно скачать в Google Play. Во время диктовки, программа самостоятельно редактирует текст и расставляет знаки препинания, что позволяет на выходе получить очень достойный результат.

Помимо указанных, существует еще немалое количество программ для ПК и мобильных устройств, а также онлайн-сервисов, позволяющих работать прямо в браузере, которые помогают расшифровывать аудиофайлы в текст, и даже частично автоматизируют этот процесс. Но какому бы софту вы не отдали предпочтение, необходимо быть готовым к тому, что полученный результат будет требовать проверки, исправления ошибок и внесения коррективов. Полностью автоматизировать процесс транскрибации не получится.

Трудовые будни транскрибатора

Транскрибация – это перевод аудио или видеозаписи в текстовый документ. Транскрибатор надевает наушники, воспроизводит файл с помощью специального проигрывателя и перепечатывает услышанное в Word.

Плохое качество записи

Не всегда аудио записывают с помощью профессиональной техники или обычного диктофона. Иногда используют программку на дешёвом мобильнике. При прослушивании голос говорящего кажется тихим, присутствуют посторонние звуки, шум. Порой один и то же фрагмент приходится переслушивать по 3-5 раз, чтобы понять суть разговора.

Наличие нескольких говорящих

В большинстве случаев исполнителю приходится транскрибировать диалоги двух, трёх и более лиц. Часто говорящие перебивают или даже перекрикивают друг друга. А ведь в итоговом документе отражаются понятные и последовательные диалоги.

Присутствие в записи неизвестных терминов и словечек

Транскрибатор должен знать хотя бы крылатые фразы, экономические и юридические термины. Многие исполнители даже ленятся пользоваться Google во время работы. Буквально пишут то, что услышали (например, «сволочем-билетом», и не «с волчьим билетом»).

Рутинный характер работы

Труд транскрибатора монотонный, нудный и напряжённый. Приходится часами делать одно и то же: слушать и печатать, слушать и печатать.

Таким образом, хорошим транскрибатором станет человек, который обладает следующими навыками и личностными качествами:

  • высокой скоростью печати;
  • хорошим слухом;
  • эрудицией;
  • внимательностью;
  • усидчивостью;
  • ответственностью.

Сколько времени занимает перед аудио или видео в текст? Зависит от качества записи, количества говорящих, требований заказчика к оформлению. В любом случае умножайте время на «3». Например, на расшифровку аудио продолжительностью 60 минут вам понадобится не менее 3 часов.

Усовершенствовать ручную расшифровку

Можно пойти другим путем — не автоматизировать, но упростить работу и транскрибировать без кошмара, описанного в самом начале статьи. Вам все равно придется слушать и записывать, но это будет удобно делать внутри хорошо обустроенного сервиса.

oTranscribe

Бесплатный веб-сервис для ручной транскрибации текста. Работает как с аудио, так и с видео, в том числе YouTube-роликами. Открывает десятки форматов: wav, mp3, mpeg, webm и др.

Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.

Интерфейс oTranscribeИнтерфейс oTranscribe

Express Scribe

Условно-бесплатное десктопное ПО для Windows/Mac. Позволяет загружать аудио и видеофайлы с самых разных источников: дисков, FTP-серверов, электронных писем и др. Поддержка форматов зависит от версии: например, mp3 и wav открываются в любом случае, а wmv, mp4 или 3gp — только в Pro.

Гибкие настройки воспроизведения: управляйте горячими клавишами, меняйте скорость, переключайтесь на определенный таймкод. Можно добавлять заметки к файлам, подключать к работе ножную педаль — специальное устройство, USB-переключатель для геймеров и транскрибаторов.

Удобно, что все записи добавляются в список и между ними легко переключаться — не нужно каждый раз заново их загружать. Неудобно, что нет текстового редактора (зато есть интеграция с MS Word, Corel Wordperfect, Lotus Wordpro ​​и другими текстовыми процессорами под Windows).

Неограниченная лицензия PRO стоит от 25 $, но для личного использования вполне хватит бесплатной версии.

Так выглядит окно Express Scribe

Transcriber Pro

Тоже десктопный инструмент для ускорения ручной расшифровки (правда, только аудио в текст и только для Windows). Функциональность похожа на аналогичные решения: есть управление горячими клавишами, создание заметок (тегов), автозамена текста, настройка «прыжка» после паузы и др.

В числе преимуществ Transcriber Pro также указали командную работу — возможность разбивать проект на подзадачи, выгружать их и пересылать, потом объединять результаты в один файл. Участники команды будут работать в офлайне, но результат потом соберется в одно целое.

Платная лицензия стоит 640 руб. в год, но ее нет смысла покупать ради такой функции, как экспорт в интерактивные стенограммы. Этот формат похож на обычные субтитры, которые, например, выгружаются с YouTube.

Видеообзор программы.

LossPlay

Это десктопный плеер для Windows в помощь расшифровщикам аудио/видео. Открывает mp3, wav, mp4 и др. (разработчики отмечают, что есть также «интеллектуальная поддержка недокументированных форматов», что бы это ни значило). Парит поверх всех окон, поэтому позволяет работать в любом текстовом редакторе.

Hot keys настраиваются не только для управления воспроизведением, но и для вставки шаблонных текстовых фрагментов. Если не нравится стандартный дизайн, в настройках можно задать элементам другие цвета.

Придется по душе тем, кто ностальгирует или до сих пор пользуется Winamp.

Такой вот внешний вид у LossPlay

Универсальное решение: wreally.com

Альтернатива всем вышеперечисленным инструментам — Transcribe (wreally.com). Этот онлайн-сервис позволяет транскрибировать текст обоими способами: вручную (как в oTranscribe) и автоматически (создатели указывают точность 90%). Открывает десятки видов файлов: webm, mp3, mp4, 3gp, wmv и др. Есть автосохранение, работа без доступа к интернету, интеграция ножной педали, настройка горячих клавиш, экспорт видеосубтитров. В отличие от RealSpeaker, гарантируется безопасность и приватность.

Бесплатно можно получить только 1 минуту автоматической расшифровки. Далее — 6$ в час. Ручная транскрибация тоже стоит денег, но совсем небольших — 20$ в год.

Так выглядит инструмент для ручной транскрибации

Пример работы авторасшифровщика

Google Keyboard (Android)

Gboard – альтернативная клавиатурная оболочка для Андроид, и одна из ее функций – голосовой ввод текста. Клавиатура с голосовым вводом – это удобно: во-первых, вам не нужно отдельное приложение для перевода речи текст. Во-вторых, клавиатура всегда под рукой и она действительно во многом более продуманная, чем штатная Андроид-клавиатура.

Для того, чтобы воспользоваться голосовым вводом, сделайте следующее:

  1. Скачайте клавиатуру Gboard на телефон.
  2. Переключите стандартную клавиатуру на Gboard в настройках Андроид.
  3. Откройте любой текстовый редактор или Заметки.
  4. При появлении клавиатуры нажмите на значок микрофона и продиктуйте текст.

К слову, в Google Keyboard используется стандартный движок распознавания, встроенный в ОС Андроид. В настройках голосового ввода доступны для скачивания языковые пакеты для распознавания речи офлайн. Откройте вкладку “Все” и скачайте необходимые языки.

Регистрация в «Облаке»

Для это­го нам пона­до­бит­ся Яндекс-аккаунт: заве­ди­те новый, если его у вас нет, или вой­ди­те в него под сво­им логином.

Если акка­унт уже есть — пере­хо­дим на стра­ни­цу сер­ви­са cloud.yandex.ru и нажи­ма­ем «Под­клю­чить­ся»:

На сле­ду­ю­щем шаге под­твер­жда­ем согла­сие с усло­ви­я­ми, и мы у цели:

На глав­ной стра­ни­це «Обла­ка» акти­ви­ру­ем проб­ный пери­од, что­бы бес­плат­но исполь­зо­вать все воз­мож­но­сти сер­ви­са, в том чис­ле и SpeechKit:

Един­ствен­ное, что нам оста­лось из фор­маль­но­стей, — запол­нить дан­ные о себе и при­вя­зать бан­ков­скую кар­ту. С неё спи­шут два руб­ля и сра­зу вер­нут их, что­бы убе­дить­ся, что кар­та актив­на. Она нуж­на для того, что­бы поль­зо­вать­ся сер­ви­са­ми после окон­ча­ния проб­но­го пери­о­да. Если вам это будет не нуж­но — про­сто уда­ли­те кар­ту, когда закон­чи­те проект.

Когда под­клю­чи­те кар­ту — нажми­те «Акти­ви­ро­вать».

Когда всё будет гото­во, вы попа­дё­те на глав­ную стра­ни­цу сер­ви­са, где уви­ди­те что-то подобное:

Вме­сто ста­ту­са Active вы уви­ди­те ста­тус «Проб­ный пери­од» и баланс в 3000 ₽ без кре­дит­но­го лимита. 

«Dragon Professional» — расшифровка аудиозаписей в текст

На момент написания данного материала цифровой англоязычный продукт «Dragon Professional Individual» является одним из мировых лидеров по качеству распознаваемых текстов. Программа понимает семь языков (с русским пока работает лишь мобильное приложение «Dragon Anywhere» на Android и iOS), обладает высоким качеством распознавания голоса, умеет выполнять ряд голосовых команд. При этом данный продукт имеет исключительно платный характер (цена за основную программу составляет 300 долларов США, а за «домашнюю» версия продукта «Dragon Home» покупателю придётся выложить 75 американских долларов).

Для своей работы данный продукт от «Nuance Communications» требует создания своего профиля, который призван адаптировать возможности программы под специфику вашего голоса. Кроме непосредственной диктовки текста, вы можете обучить программу выполнять ряд команд, тем самым делая своё взаимодействие с компьютером ещё более конгруэнтным и удобным.

Особенности транскрибации

Спрос на расшифровку и запись в виде текста звуковой информации, записанной на какой-либо носитель, появился вместе с изобретением диктофонов.

Первый в мире фонограф (аппарат звукозаписи) изобрел Томас Эдисон в 1877 году. Эдисон создавал свое устройство, предполагая, что с его помощью будут записываться деловые переговоры.

С тех пор утекло много воды, диктофоны претерпели кардинальные изменения, но потребность в дешифровке аудиоинформации все также актуальна.

5 главных неприятностей

На первый взгляд занятие транскрибацией элементарно. Все писали диктанты на уроках русского, ничего сверхъестественного в этом нет – включаешь проигрыватель и записываешь звучащие предложения. Работа мечты!

Но у транскрибации нет ничего общего с диктантами. В обычной жизни никто, даже профессиональный лектор, не говорит так, как это делал ваш учитель.

Вот только часть неприятностей, с которыми сталкивается любой транскрибатор.

Невнятная речь спикера (т.е. говорящего человека)

Речь людей имеет массу дефектов и недочетов. В моем университете преподавал известнейший профессор, лучший в России специалист по русской литературе XVIII века, его имя настолько известно в кругу филологов, что не будем упоминать его всуе.

Так вот его лекции были настоящим адом на Земле. Никто из нас не понимал ни слова. У маститого ученого были практически все мыслимые проблемы с дикцией, к тому же он не выпускал папиросу изо рта, что не добавляло четкости его речи.

Конечно, не у всех такие грандиозные проблемы с речевым аппаратом, но люди могут говорить слишком тихо, невнятно, проглатывать окончания, жевать слова, сильно картавить или шепелявить, очень распространенная проблема для транскрибатора – чересчур высокий темп речи.

Нечитаемость текста, прямо передающего устную речь

Вы будете удивлены, но устная и письменная речь существуют по разным законам. Не будем углубляться в лингвистические изыскания, но стоит хоть раз написать подстрочник устного выступления, как пропасть между письмом и говорением станет очевидной и даже пугающей.

Некоторые заказчики требуют дословную расшифровку, но большинство хотят получить удобоваримый текст, так что транскрибатор обязательно столкнется с необходимостью редактуры того, что он услышал и набрал.

Чем больше народа участвует в беседе, тем сложнее расшифровка

Когда говорит один человек, к его речи привыкаешь, работа становится ритмичной. Интервью тет-а-тет тоже приятно транскрибировать, один спрашивает, второй отвечает, никто никого не перебивает – счастье!

Но с появлением третьего и последующих собеседников седых волос на голове у транскрибатора прибавляется, а нервных клеток, наоборот, становится меньше. Нет, не обладают наши люди искусством вести беседу, особенно полемическую.

Некачественная запись

Посторонние шумы очень затрудняют работу. К сожалению, качество присылаемых заказчиками записей часто бывает ниже среднего.

Невысокий уровень эрудиции транскрибатора

Вы можете быть прекрасным человеком, но при этом не знать каких-то элементарных и не очень элементарных вещей. Это беда дешифровщиков.

Среди заказов на транскрибацию часто попадаются лекции со специфической терминологией, беседы о предмете или о людях, о которых вы ничего не слышали, тренинги с массой англицизмов, а вы не знакомы с иностранными языками.

Из-за этого возникает масса ошибок, иногда очень смешных и обидных. Так появляется «книга Д.К. Мирона “Бокаччо”», «Трое в лодке, нищета и собака» и прочие ляпы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector