Взял кринжовый видос про озорные поры на носу Бузовой и посмотрел, как с ним справятся лучшие российские транскрибаторы аудио и видео файлов в текст. Сравнил полученный результат по целому списку критериев и составил крутую таблицу. Го смотреть 🚀🚀🚀
Привет, это Писец — транскрибатор, искусственный интеллект и великий освободитель времени. Моё призвание — избавлять людей от мук рукопашной расшифровки. Я всё делаю красиво: делю текст на абзацы и спикеров, расставляю знаки препинания и тайминг.
Всем пользователям дарю час бесплатной расшифровки в месяц на высокой скорости. Хорошо понимаю все эти ваши «ропы», «митапы» и «лпр». И вообще — я клёвый и у меня лапки 🙌
В статье сравниваю между собой сервисы автоматической транскрибации, которые распознают русский язык и принимают оплату с российских банковских карт.
Мои коллеги-транскрибаторы какие-то серьезные все, я решил их кринжатинкой угостить 😝 Предложил им расшифровать видео, где Бузова выпендривается перед журналистом Мезенцевым, а он рассматривает озорные поры у нее на носу 🤣 Ну и сам я расшифровал этот видос тоже, разумеется.
По каким критериям буду сравнивать:
Частота ошибок в словах. На языке маркетинга это называется Word Error Rate или сокращенно — WER. Процент ошибок в распознавании слов от общего числа слов.
Кароч, берем сто слов и считаем, сколько в них ошибок — это и есть процент WER.
Стоимость расшифровки. Кто-то берет оплату за минуты, кто-то за часы, а кто-то и бесплатно расшифровывает — я, например. О каждом сервисе напишу, что именно бесплатно и что платно.
Скорость обработки. Специально выбрал видео чуть меньше минуты, чтобы было видно на небольшом формате — кто тупит, а кто нет.
Знаки препинания — есть ли они вообще и насколько они ок.
Абзацы — есть или нет.
Разбивка текста на спикеров — крайне важная функция если на записи беседуют несколько человек, например, созвон в зуме или конференция.
Ну штош, погнали 🚀
1. Teamlogs
При входе на сайт сервис предлагает зарегистрироваться и дарит 15 бесплатных минут транскрибации. Можно войти через Гугл или Яндекс, чтобы не возиться с паролем и подтверждением. Перетаскиваем файл в окошко загрузки и ждем — текст откроется прямо в интерфейсе.
Что имеем:
- Частота ошибок в словах: 18%.
- Стоимость: бесплатно 15 минут. Потом зависит от количества минут: файл до получаса обойдется 20 руб/мин, до часа 10 руб/мин и так далее. Самая дешевая тарификация — 6 руб/мин будет доступна если купите пакет размером в 5001 минуту за 30 тыщ рублей.
- Скорость: наш видос обработал за 2,5 минуты.
- Знаки препинания: есть, но не все корректные.
- Абзацы: есть.
- Разбивка на спикеров: есть.
Вывод: есть разбивка на спикеров и абзацы — молодец, выдаем леденец 🍭 Ошибок в тексте довольно много, теряет часть реплик, пишет фамилии со строчной буквы, а вот «Белого» почему-то решил писать с заглавной. Если нужно расшифровать часовой видос — заплатите 600 ₽. Ну или покупайте пакеты за десятки тысяч рублей и тогда будет чуть дешевле.
Дороговато, сорян. Краткое содержание перед текстом — вообще песня: «Спикер 0 не хочет идти в Белый, потому что ему постоянно звонит Андрей Аполлонов» 😛
2. Speechtotext
Сервис встречает приглашением пройти регистрацию. Тапнуть в логотип Гугла или ВК не получится, только олдскул: вводим пароль два раза, идем на почту и подтверждаем аккаунт. Теперь загружаем файл и читаем результат прямо на сайте. Ну или скачиваем в формате doc.
Что имеем:
- Частота ошибок в словах: 9%
- Стоимость: бесплатно 10 минут, потом 100 рублей в час.
- Скорость: около 10 секунд.
- Знаки препинания: есть, но много некорректных.
- Абзацы: ну один поставил, рандомный.
- Разбивка на спикеров: нет.
Вывод: ошибок в тексте немного, но они напряжные. Принципиально неправильные слова: «официант Андрюшка Аполлонов». Начало и окончание предложения определены неверно и искажают смысл: «…да, когда он 300. Раз меня все предупредили…» Представьте, если в часовом созвоне будет таких ошибок штук 30? Сорян, канеш, но получится непонятная шляпа.
3. Conspecto
На главной странице написано, что сервис конвертирует в текст «с помощью самой совершенной на сегодняшний день модели искусственного интеллекта». Допустим 😏 Различает 50 языков, поддерживает много форматов и не требует регистрации. Еще у сервиса есть телеграм-бот, но нам его тестить лень и мы сделаем все в браузере.
Что имеем:
- Частота ошибок в словах:1%
- Стоимость: бесплатно одна минута, потом 3 руб/мин за транскрибацию или 4 руб/мин за нее же, но с конспектом.
- Скорость: 20 секунд.
- Знаки препинания: есть, вполне ок.
- Абзацы: нет.
- Разбивка на спикеров: нет.
Вывод: текст чистенький, почти без ошибок. Хорошо, что есть тг-бот. Маловастенько дают бесплатно, всего одну минутку, но хозяин — барин, как грицца. Плохо, что текст сплошняком. Фирменная фишка сервиса — конспект, с ним транскрибация стоит на руб дороже (буквально). Я заказал расшифровку с конспектом, смотрите что получилось:
4. Any2text.ru
На главной странице нас встречает окошко, в которое нужно перетащить файл для транскрибации. Сервис поддерживает много языков и предлагает скачать расшифровку в нескольких форматах на выбор — docx, xlsx, srt или txt. Регистрироваться не нужно, просто загружаете файл, ждете и смотрите результат.
Что имеем:
- Частота ошибок в словах: ошибок нет, маладэц.
- Стоимость: бесплатно 15 минут. Потом 5 руб/мин транскрибации если не регистрируешься. Если зарегистрироваться и пополнить баланс на тыщу рублей — 4 руб/мин.
- Скорость: наше видео обработал за одну минуту.
- Знаки препинания: есть, корректные.
- Абзацы: нет.
- Разбивка на спикеров: нет.
Вывод: шустрый, чистый сервис, переводит без ошибок. Часовой видос обойдется в 300 рублей или в 240 со скидкой после регистрации. На абзацы и спикеров не делит: если у вас многочасовая конфа или созвон в зуме на пять человек, задолбаетесь потом вручную разбивать и въезжать, кто где говорит.
5. WordWoice
При входе сервис предлагает зарегаться по почте или через ВК. После регистрации в личном кошельке оказывается 90 рублей, которые можно потратить на тестовую расшифровку. Под окошком загрузки — чек-бокс для иностранного текста, если его отметить, предлагает сделать перевод.
Что имеем:
- Частота ошибок в словах: 2%.
- Стоимость: 5 руб/мин, при регистрации дарят 90 рублей.
- Скорость: 40 секунд.
- Знаки препинания: есть.
- Абзацы: нет.
- Разбивка на спикеров: нет.
Вывод: хороший, чистенький перевод и стильный интерфейс. Разбивает текст на таймкоды, ставит их даже посреди предложения. Удобно, что можно тыкнуть в тайм-код и прослушать этот момент в аудиозаписи. В скачанном файле транскрибации таймкодов нет — просто текст сплошняком. Расшифровка часового созвона обойдется в 300 рублей.
6. Apihost
Apihost — солидный набор сервисов по работе с аудио и текстами. Он умеет в озвучку, изменение голоса и еще кучу всего. В том числе есть и транскрибатор. Чтобы загрузить файл, нужно зарегистрироваться. После регистрации в личном кабинете было написано, что у меня баланс ноль рублей — про бесплатные минуты я нигде ничего не нашел. Но я рискнул загрузить наш видос. И…
Что имеем:
- Частота ошибок в словах: 18%
- Стоимость: 2,4 руб/мин
- Скорость: 25 секунд.
- Знаки препинания: есть, какие попало.
- Абзацы: нет.
- Разбивка на спикеров: нет.
Вывод: ну, такое. Что матом ругается — полбеды. Что имена пишет со строчной — вообще хрен бы с ним. Но блин, неправильно определяет начало и конец предложения, сливает очевидно разные предложения в одно — длинное и бессмысленное. Получается эталонное нечитаемоеполотнотекста. За час текста — 144 рубля, пополнять можно минимум на 500 р. Максимальный размер файлов для загрузки — 200 мб, маловато.
7. Писец
И на сладенькое — я, Писец 🍬🍬🍬 Защитник обиженных и угнетенных, Робин-Гуд мира копирайтеров 🏹 …так, ладно у нас тут обзор и я к себе буду объективен. У меня всё просто: регистрироваться не надо, заходим на сайт грузим файл, указываем почту и выбираем количество спикеров — от одного до пяти. После этого можно закрыть браузер и идти пить кофе — текст я пришлю на почту ☕
Что имеем:
- Частота ошибок в словах: 2%
- Стоимость: бесплатно один час в месяц на высокой скорости. Потом тоже бесплатно, но медленнее.
- Скорость: 40 секунд.
- Знаки препинания: есть.
- Абзацы: есть.
- Разбивка на спикеров: есть.
Вывод: как видите, я к себе объективен. В этом видосе я недослышал одно слово в первой реплике и один раз пропустил слово «какой». При этом я крайне хорош в том, чтобы определять реплики спикеров и назначать им таймкоды.
Расшифровываю бесплатно на высокой скорости один час в месяц, а потом — тоже бесплатно, но медленнее.
А если хотите быстрее — можно купить пакет минут по оооочень демократичной стоимости:
990 ₽ за 10 часов (1.65 ₽/мин)
1620 ₽ за 20 часов (1,35 ₽/мин)
1980 ₽ за 30 часов (1,1 ₽/мин) с постобработкой в ChatGPT.
Пакеты минут не ограничены во времени использования — можете за месяц потратить или на несколько лет растянуть.
Так, ну и теперь сравнительная табличка
Ну и вот: думайте сами, решайте сами — Писец или не Писец 🎸🎶
Я — Писец, несравненный транскрибатор аудио и видеофайлов в текст. И я тут ничего не рекламирую, а просто приглашаю: приносите мне ваши созвончики, конференции, лекции и что там у вас еще есть.
Все расшифрую, с любовью поставлю запятые, разобью текст на абзацы и спикеров, чтобы облегчить вам жизнь и сэкономить драгоценное время.
Всех обнял 🤗