Категория: Windows
Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дело в том, что деньги, которые мы получаем от показа рекламных баннеров, позволяют нам писать статьи и новости, проводить тестирования, разрабатывать методики, закупать специализированное оборудование и поддерживать в рабочем состоянии серверы, чтобы форум и другие проекты работали быстро и без сбоев.
Мы никогда не размещали навязчивую рекламу и не просили вас кликать по баннерам. Вашей посильной помощью сайту может быть отсутствие блокировки рекламы.
Спасибо вам за поддержку!
Компания ABBYY объявляет о выходе приложения ABBYY TextGrabber + Translator для Android. Программа позволяет распознавать тексты и переводить их на другие языки, используя камеру смартфона. Полученную информацию можно отправить друзьям и коллегам по электронной почте или SMS, а также передать в другие приложения: заметки, социальные сети, сервисы хранения файлов – с помощью системной функции Share. Данный продукт уже более года пользуется популярностью среди пользователей iOS, а теперь его аудитория существенно расширится благодаря платформе Android.
ABBYY TextGrabber + Translator автоматически распознает тексты из самых разных печатных источников – достаточно сфотографировать нужный отрывок документа или загрузить изображение из фотоальбома. Приложение использует собственные технологии оптического распознавания текста для мобильных платформ компании ABBYY, и с высокой точностью распознает текст непосредственно на мобильном устройстве без необходимости доступа к сети Интернет. Благодаря этому обрабатывать и редактировать информацию на 60 языках можно в любом месте и в любое время. Помимо этого программа интегрирована с онлайн-сервисом Google Translate, что позволяет получить связный перевод распознанного текста с 42 на 52 языка.
Распознанный и переведенный текст можно передать в другие приложения с помощью Share – системной функции операционной системы Android. Достаточно выделить нужный участок текста на экране устройства, нажать значок Share и из списка доступных приложений выбрать подходящий вариант: от текстовых редакторов и социальных сетей Facebook и Twitter до сервисов хранения как, например, Evernote. Для удобства пользователей приложение сохраняет историю всех распознанных текстов.
Если на устройстве пользователя уже установлен электронный словарь ABBYY Lingvo. то ABBYY TextGrabber + Translator обнаружит его благодаря программному интерфейсу ABBYY Lingvo API. Таким образом, пользователь получит доступ к качественным словарям от ведущих мировых издательств и сможет легко уточнить перевод или значение слов в распознанном или переведенном тексте.
ABBYY TextGrabber + Translator для Android можно приобрести через Google Play (Android Market). Стоимость приложения составляет 2,99 $ (в российском Google Play цена указана в рублях и может изменяться в зависимости от курса USD).
Приложение поддерживает английский и русский языки интерфейса и подходит для устройств с операционной системой Android OS 2.2 и выше.
Встал вопрос распознать и перевести страницу старого учебника по китайскому.
Для начала распознавание. Нормально - никак.
Наиболее удачно распознает ABBYY Finereader 10, в коммерческой версии.
Пробная версия ограничена количество единовременно сохраняемых страниц - 1, всего страниц - 50, дней 15. На раз пойдет.
http://finereaderonline.com не позволяет распознавать с китайского и других иероглифических языках.
Google Docs позволяет распознавать документы при загрузке, будь то изображения или PDF, но качество распознавания оставляет желать лучшего - какая бы там ни была верстка вся поедет, колонки сольются в едино. Плюс нужен хороший источник, выбеленный ровный лист. Тем не менее, сервис бесплатный и неограниченный, для сплошного текста за неимением лучшего вполне подойдет.
Перевод.
Здесь все просто Google Translate достаточно для поверхностного понимания переводит китайский на остальные языки.
Владельцам iPhone / Android повезло, приложение Google Mobile / Google Goggles умеет искать по фотография, вполне в состоянии распознать и найти значение слово. Это если слово было одно, крупное и контрастное. Да и то он не переводит, а ищет совпадение \ толкование онлайн. Но на iPhone есть отличный Google переводчик, где можно копипастой перевести
NotesSpeechlogger Personal - your new personal non-stop speech to text, for Android. For hearing impaired as well as for on-the-go natural-speech transcriptioning.
Нажмите здесь для получения инструкций и просмотра обучающего видео на YouTube
1) Подключите микрофон к компьютеру. Убедитесь, что микрофон подключен и работает правильно.
2) Убедитесь, что вы используете браузер Chrome. Если Вы еще не здесь, откройте приложение (https://speechlogger.appspot.com/)
3) Выберите язык диктовки
4) [Необязательно:] Нажмите "Автопунктуация" и настройте расстановку знаков препинания
5) Нажмите большой значок микрофона в центре приложения.
6) [Только во время первого использования:] Как только вы нажмете на микрофон, браузер запросит разрешение использовать микрофон. Chrome отобразит вопрос в окошке под адресной строкой. Нажмите "Разрешить". Если окошко не появляется, обратите внимание на маленькую иконку камеры в самой адресной строке. Это связано с настройками безопасности.
7) Начинайте диктовать. Начните сначала медленно, чтобы понять темпы работы приложения. Текстовая транскрипция будет появляться на экране в режиме реального времени.
Превратите ваш экран в удивительном заголовка телефона. Это полностью автоматический, без человеческого слуха-машинистки ваши разговоры. Находят бабушки и дедушки трудно услышать семью и друзей по телефону? Включите Speechlogger для них и остановить кричать по телефону. Просто подключите аудиовыход телефона к аудио входу компьютера и запустить Speechlogger. Это также полезно в лицом к лицу взаимодействия.
Автоматическая транскрипцияВы записали интервью? Сохранить некоторое время на переписывание его, с автоматическим речи Google, к тексту, принесла в ваш браузер по Speechlogger. Воспроизведение записанного интервью в микрофон вашего компьютера (или линии) в-и пусть speechlogger сделать транскрипцию. Speechlogger сохраняет транскрипции текст вместе с датой, временем и ваши комментарии. Она также позволяет редактировать текст. Телефонных разговоров могут быть расшифрованы с помощью того же метода. Вы также можете записать аудио-файлы непосредственно с компьютера, как описано ниже.
Автоматический устный и письменный переводчикВстреча с иностранными гостями? Принесите ноутбук (или два) с speechlogger и микрофона. Каждая сторона будет видеть друга произнесенные слова, переведенные на их родном языке в режиме реального времени. Это также полезно на телефонный звонок на иностранном языке, чтобы убедиться, что вы в полной мере понять другую сторону. Подключите аудиовыход вашего телефона, чтобы линейный вход вашего компьютера и начать Speechlogger.
Изучайте иностранные языки и улучшайте навыки произношенияSpeechlogger является отличным инструментом для изучения языков и может быть использован u200b u200Bin несколько способов. Вы можете использовать его, чтобы узнать словарный запас, говоря на вашем родном языке и давая программного обеспечения перевести его. Вы можете учиться и практиковать правильное произношение, разговаривая на иностранном языке и, видя, понимает ли Speechlogger или нет. Если расшифрованы текст в черным шрифтом это означает, что вы произнес это хорошо.
Генерирование субтитров для фильмовSpeechlogger может автоматически записать фильмы или другие звуковые файлы. Затем возьмите файл и автоматически перевести его на любой язык, чтобы произвести международные субтитры.
Диктуйте вместо вводаНаписание письма? Документы? Списки? Резюме? Независимо от того, вам нужно ввести, попробуйте диктовать его Speechlogger вместо этого. Speechlogger будет автоматически сохранять его для вас, и позволит экспортировать его в документ.
Забавная игра :)Вы можете имитировать китайскую динамик? Французский? Что о русском языке? Попробуйте имитировать иностранный язык и увидеть то, что вы только что сказали, с Speechlogger. Используйте синхронный перевод Speechlogger, чтобы понять, что вы только что сказали. Получить удивительные результаты - это очень весело!
Видео на Youtube о том, как превратить ваш браузер в переводчика в режиме реального времени Youtube и инструкции по Автоматически Расшифруйте аудио файловдва возможных решения для переноса аудиофайлов:
a) Solution 1: play the file with an external device into your computer using a line-in cable.
b) Solution 2: Install a "virtual line-in cable" as described in this youtube. While this is more complex than the first solution, it will likely be more successful.
The software we use (not affiliated with us) is VoiceMeeter: http://vb-audio.pagesperso-orange.fr/Voicemeeter/index.htm
Downloadable from: http://vbaudio.jcedeveloppement.com/Download_CABLE/VoicemeeterSetup_v1025.zip
1) After you've installed it, go to your computer's playback devices (how? ) and choose "VoiceMeeter Input" as your default playback device.
2) Open VoiceMeeter and play an audio file or a youtube video just to make sure you hear it well.
3) Refresh Speechlogger (by pressing F5) and click on the app's mic to start.
4) While it is running, go to the Chrome address bar. There, click on the small camera icon.
5) Choose "VoiceMeeter Output" as your mic (and make sure speechlogger is always allowed).
6) Refresh the page (press F5)
7) Click the app's mic to begin and play your audio file. The results will appear on the screen.
8) Optional: export to captions (.srt format).
Поделитесь и получите 10,000 символов!
Click here for today's special offers from Amazon . Brought to you as Speechlogger's users.
Speechlogger is a participant in the Amazon Services LLC Associates Program, an affiliate advertising program designed to provide a means for sites to earn advertising fees by advertising and linking to Amazon . It means that by any purchase on Amazon through these links, you will contribute to Speechlogger.
Диктант Блокнот Text Reader SpeechNinja AAC FAQs Связаться с нами DISCLAIMER: THIS SERVICE MAY CONTAIN TRANSLATIONS AND TRANSCRIPTIONS POWERED BY GOOGLE. GOOGLE AND WE DISCLAIM ALL WARRANTIES RELATED TO THE TRANSLATIONS AND TRANSCRIPTIONS, EXPRESS OR IMPLIED, INCLUDING ANY WARRANTIES OF ACCURACY, RELIABILITY, AND ANY IMPLIED WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. ','ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ И УСЛОВИЯ ИСПОЛЬЗОВАНИЯ')">ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ И УСЛОВИЯ ИСПОЛЬЗОВАНИЯ
Компания ABBYY сообщила об открытии портала ABBYY Online. объединяющего все онлайн-сервисы компании на единой площадке. Портал предлагает большой выбор языковых сервисов, включая обновленный электронный словарь Lingvo Online, услуги профессионального перевода и обучения иностранным языкам от ABBYY Language Services, а также инструмент для переводчиков и лингвистов Aligner Online. Кроме того, на новом портале впервые появился сервис FineReader Online, с помощью которого можно распознавать и преобразовывать изображения и фотоснимки документов в текстовые форматы.
Зарегистрированные посетители портала могут использовать все сервисы ABBYY по единому логину. В будущем планируется разработка возможностей по настройке, оформлению кабинета пользователя, общению и управлению заказами. Кроме того, в планах компании создание на базе ABBYY Online профессионального сообщества для переводчиков, преподавателей, лингвистов и других специалистов в области языка. Портал ABBYY Online доступен на двух языках — русском и английском.
Распознавание документов
ABBYY FineReader Online
ABBYY FineReader Online - это онлайн-сервис, созданный на основе знаменитой программы ABBYY FineReader, мирового лидера среди OCR-систем по точности распознавания текста.
Сервис позволяет быстро и легко распознавать отсканированные изображения документов и конвертировать их в Mircosoft Word, Excel и другие редактируемые форматы. Он поддерживает обработку текстов на 37 языках, включая многоязычные документы. Структура и форматирование оригинального текста при этом сохраняются.
ABBYY FineReader Online работает в режиме бета-версии, любой зарегистрированный пользователь может распознавать и конвертировать до 10 страниц в день бесплатно.
Лингвистические сервисы
ABBYY Lingvo Online
ABBYY Lingvo Online – это интернет-версия самого популярного электронного словаря в России, он доступен бесплатно всем пользователям интернета. Переводите слова и словосочетания с английского, немецкого, французского, испанского и итальянского языков на русский и обратно.
Письменный перевод
Получите быстрый и качественный перевод текста, выполненный профессиональными переводчиками ABBYY Language Services. Вы можете оформить онлайн-заказ прямо сейчас! Теперь у Вас есть возможность самостоятельно определить срок выполнения и цену заказа. Квалифицированные консультанты помогут Вам выбрать именно ту услугу, которая лучше всего отвечает вашим потребностям.
Перевод телефонных переговоров
С помощью услуги «Перевод телефонных переговоров» Вы сможете позвонить иностранным коллегам, партнерам или друзьям и подключить к разговору переводчика. Звоните в любую точку мира и общайтесь с зарубежными собеседниками на их языке! Это эффективно, удобно и доступно.
Обучение языкам
ABBYY Language by Phone – новый эффективный способ изучения иностранного языка по телефону или Skype. В основе обучения – живое общение с преподавателями, в том числе с носителями языков. Обучение нацелено на улучшение разговорных навыков, а также восприятия иностранной речи на слух. Мы предлагаем индивидуальные программы обучения, позволяющие максимально сэкономить и время, и средства.
ABBYY Aligner Online
ABBYY Aligner Online – это специализированный web-сервис для быстрого выравнивания параллельных текстов небольшого объема. Каждый пользователь может сохранить до 50 строк выравненного текста в формат RTF или в базу Translation Memory бесплатно. ABBYY Aligner находит соответствующие по смыслу сегменты в тексте оригинала и в переведенных текстах на 10 европейских языках, включая английский, немецкий, французский, испанский, итальянский, польский, португальский, турецкий, украинский и русский.
Обзор OCR-систем, доступных онлайн:
Для получения фотокопии изображения уже не нужно искать сканер, достаточно просто достать телефон с фотокамерой и «щелкнуть» нужные страницы изображения. А уж если есть под рукой мало-мальски приличная «фотомыльница», то получить изображение нужной четкости и разрешения и вовсе не составляет труда. К слову, это стало настолько очевидно, что многие библиотеки, видимо, не желая терять заработок на услуге ксерокопирования, стали запрещать использование любой фототехники в читальном зале. Так что, прогресс налицо.
В области же оптического распознавания текста, к сожалению, никаких революций за последние пять лет не случилось, хотя определенные изменения все-таки произошли. Например, ощутимо сдвинулся баланс от настольных систем распознавания к применению веб-сервисов. Нельзя сказать, что OCR-рынок ушел в онлайн, но изменение самой концепции использования компьютера, распространение мобильной техники, Интернета, «облачных» сервисов — все это диктует ситуации, когда пользователь оказывается перед фактом, что стационарного компьютера под рукой нет.
Но в случае крайней необходимости можно сфотографировать и попытаться «скормить» фотоснимок одному из OCR-онлайн-сервисов. Вероятнее всего, со временем такой путь будет становиться все популярнее, и поэтому мы решили отправиться на исследование онлайн-просторов в поисках хорошего сервиса распознавания отсканированного текста.
Мы не ставили перед собой задачу найти непременно бесплатный сервис, предполагая, что таких может просто не быть. Однако некоммерческие ресурсы данного типа все-таки нашлись. Имеются также условно бесплатные, в которых можно распознать несколько страниц «на пробу». В любом случае сервис должен поддерживать русский язык и не требовать никакой установки на компьютер: иногда это просто невозможно на служебных машинах.
Для пробы мы приготовили несколько материалов, с которых OCR-сервисам предстояло «вытянуть» текст. Первый файл был получен путем сканирования на недорогом домашнем планшетном сканере с большим разрешением и настройками «по умолчанию». Второй кадр был в виде страницы из PDF-файла с разрешением, близким к экранному. Третий, уже посложнее, был снят с помощью фотоаппарата со штатива при максимально хорошем освещении. И наконец, четвертый файл был снят смартфоном среднего уровня с камерой 3 Мпикс, с применением встроенной вспышки.
Качество последнего файла было плохим как по разрешению, четкости, так и по геометрии изображения, зато ближе всего к полевым условиям. Снимки были сделаны с обычных страниц книги, с делового отчета и содержали кроме текста еще и несложную таблицу. Именно с таким вполне реалистичным набором данных предстояло разобраться испытуемым.
Документы Google»
Первым на старт вышел Google со своими документами (docs.google.com ). Не все знают, что помимо совместной работы над материалом сервис позволяет распознать документ, загруженный в виде изображения или PDF. Никаких особенных действий предпринимать не нужно, все получается автоматически. Однако размер файла ограничен 2 Мбайт, так что полноценный скан страницы книги отправить не удалось. Уменьшив размер, мы смогли «вытащить» редактируемый текст.
«
«Документы Google» легко распознали разворот страницы и справились с текстом. Качество работы можно оценить не выше, чем 4 балла из 5, потому что ни одного абзаца без ошибки не случилось. Однако это все же на порядок быстрее и легче, чем набирать текст с чистого листа.
Со сложными исходными файлами дело пошло хуже: качество распознавания упало до «тройки» по пятибалльной шкале и не вышло распознавание сложного форматирования и таблиц. Тем не менее удовлетворительный результат был зафиксирован, и ресурс вполне стоит взять на вооружение как действенный способ получить текст из PDF или картинки.
Переходим к явному фавориту нашего тестирования. Компания Abbyy уже пару лет предлагает воспользоваться всей мощью своего OCR-механизма через веб-сервис (finereader.abbyyonline.com ). Отличия от настольной версии, конечно, имеются. Прежде всего — в количестве поддерживаемых языков («всего» 49 против почти 200 в профессиональной версии FineReader), а также в отсутствии каких-либо дополнительных возможностей по обработке текста после распознавания.
Входным форматом может быть практически любой популярный графический формат или PDF без пароля, а выходным — DOC, XLS, ODT, TXT и PDF. Загружать можно документы размером до 30 Мбайт.
Как и ожидалось, сервис продемонстрировал отличную работу и очень хорошее качество распознавания на всех исходных изображениях. Даже на самой плохой картинке, снятой мобильным телефоном, FineReader Online узнал и направление текста (самостоятельно повернул картинку), и форматирование абзацев, и даже таблицу! Фактически даже при самом плохом «исходнике» исправить пришлось всего несколько ошибок.
За использование чудо-сервиса, однако, придется заплатить. Возможность сканирования покупается постранично, и за 100 стр. надо будет выложить 7 долларов. Однако качество того стоит — чистые 5 из 5!
На очереди у нас иностранный сервис и проверка того, как он справляется с русским языком. OCRonline (www.ocronline.com ) работает с 14 самыми популярными европейскими языками. Услуга предоставляется не бесплатно, но при регистрации начисляется пять бесплатных «пробных» страниц и, кроме того, каждый понедельник ваш баланс пополняется бесплатно до тех самых пяти страниц. Дополнительные пакеты можно купить по цене от 8 долларов за 100 стр. и дешевле, если заказывать оптом.
Сам процесс распознавания мало чем примечателен. На выходе в вашем распоряжении будет текст в формате DOC, TXT, PDF или RTF. А вот результаты получились любопытные. Качественные изображения с фотоаппарата и со сканера с высоким разрешением были распознаны идеально, фактически без единой ошибки. Твердая пятерка! С картинкой низкого качества сервис также справился на ура, даже таблица никуда не пропала! Но помарок было предостаточно, так что отличным такое распознавание назвать нельзя. Но 4 из 5 — это очень хороший показатель. Обязательно стоит взять этот ресурс на заметку для срочных задач.
Следующий веб-инструмент распознавания текста расположился в русскоязычной доменной зоне по адресу www.onlineocr.ru. Он также не бесплатный, и для получения выходного материала в одном из шести популярных форматов нужно купить «кредиты», за которые и осуществляется распознавание текста. В деморежиме получится увидеть только первую пару абзацев текста и то лишь в виде текста без форматирования. Исходный файл может быть размером до 20 Мбайт.
Пробы показали, что этот сервис очень чувствителен к качеству оригинала. Изображение со сканера в полном разрешении позволило получить очень хороший текст, практически без ошибок. А вот работа со сложным исходником не удалась. Качество текста оставляет желать лучшего, и исправлять опечатки в нем может быть сложнее, чем напечатать текст
Многообещающее слово free в названии сервиса заставило нас обратить внимание на адрес www.free-ocr.com. в котором обитает следующий претендент на звание лучшего онлайн-механизма OCR.
Результат не на высоте, к сожалению. Текст даже с качественного изображения получился малопригодным к использованию — уж очень много ошибок. А фотография с мобильного телефона и вовсе распозналась как набор непонятных малочитаемых символов. Зато бесплатно. Вероятно, для простых текстов этот сайт можно применять, но рекомендовать его язык не поворачивается.
Еще один русскоязычный OCR-сайт вы найдете по адресу www.scanonline.ru. Стартовые условия выглядят заманчиво — файл до 20 Мбайт, поддерживаются все популярные форматы изображений для распознавания, результаты работы будут высланы на указанный адрес электронной почты в виде текста, HTML или RTF. Ресурс владеет шестью языками.
Доступен бесплатный лимит на 5 Мбайт загружаемых изображений в день. Если нужно больше, то можно открыть доступ на сутки с помощью платной SMS по заявленной цене около 20 руб.
Качество распознавания хорошего исходного изображения можно оценить в 4 балла. Ошибок немного, скорость и качество распознавания на достойном уровне. А вот выявление текста на фотографии с телефона оказалось для данного ресурса непосильной задачей. Фактически полученный набор символов был малопригоден к дальнейшей работе. Таким образом, при его использовании нужно учитывать, что этот условно бесплатный сервис очень чувствителен к качеству изображения.
Ресурс New OCR (www.newocr.com ) обещает совершенно бесплатное применение OCR-технологии к нашим отсканированным документам. И надо сказать, с неплохим функционалом — по своим возможностям данный сервис действительно неплох. Судите сами: 58 языков, два разных OCR-алгоритма на выбор, безлимитные загрузки без необходимости регистрации и бесплатно (!), все популярные форматы, в том числе многостраничные документы, и даже загрузки заархивированных файлов.
Для исходных изображений доступен целый букет сервисных функций. Во-первых, можно выбрать область распознаваемого текста, повернуть картинку, повысить контрастность и распознать текст колонками. Распознанный текст можно скачать во всех популярных текстовых форматах, включая ODT, отправить для публикации в «Документы Google» или, например, отправить напрямую в переводчик Google.
А что же с качеством непосредственно OCR? С качественными исходными материалами new OCR справился хорошо. Ошибок минимум, и лишь некоторая неразбериха с форматированием заставляет поставить минус к заслуженной пятерке. Можно попробовать улучшить результат, выбирая между двумя механизмами распознавания.
А вот с некачественным исходным материалом разобраться этому сервису не удалось. По существу, ничего полезного из картинки с низким разрешением и недостаточной четкостью извлечь ему не удалось. Несмотря на это, ресурс нам понравился, и рекомендуем занести его в закладки.
Для полноты картины приведем еще один сайт. Ничего сверхвыдающегося он не обещает, зато бесплатен и имеет красивый интерфейс, в чем вы сможете убедиться сами, заглянув на www.sciweavers.org/free-online-ocr. Поддерживается 33 языка и все популярные графические форматы для исходного файла. Качество распознавания не назовешь выдающимся, но на хорошей фотографии текст определяется с минимумом ошибок и почти не требует корректировки. С плохими изображениями беда, и от получающегося набора символов никакого толка. Зато бесплатно — это раз, и сопровождается целой охапкой других полезных сервисов по решению каждодневных задач конвертирования цифровых данных — это два.
После ознакомления со всеми этими системами можно сделать некоторые выводы. Во-первых, — и это хорошая новость! — онлайн-сервисы по распознаванию текста есть, и они неплохо работают. Многие даже бесплатны, что, признаемся, стало приятным сюрпризом.
Во-вторых, снова подтвердился тезис, что в распознавании текста полдела — это качество снимка. Большинство OCR провалили тест на обработку изображения, сделанного мобильным телефоном. При этом материалы со сканера или качественный фотоснимок были обработаны неплохо. Значит, в «полевых» условиях необходимо обеспечить максимум света и разрешения при съемке, что обычно все-таки недоступно смартфонам даже выше среднего уровня.
Некоторые сервисы тем не менее справились и с «трудными» случаями, так что именно их мы уверенно ставим в лидеры обзора. Прежде всего это FineReader Оnline. Из бесплатных же онлайн-распознавателей лучше других себя показал New OCR. Поэтому именно этим двум сервисам мы присудили значок «Hard’n’Soft рекомендует».
Распознать и перевести!
В современном открытом мире часто бывает, что необходимо срочно понять, о чем идет речь на листе бумаги или в PDF-документе. Проблема в том, что он может быть на иностранном языке. Значит, в пару к OCR-ресурсу нужно найти онлайн-переводчик.
Рассмотренный нами в обзоре бесплатный сайт New OCR сразу после распознавания предлагает передать документ в Google Translate (translate.google.com). Это один из самых известных онлайн-переводчиков, который оперирует десятками языковых пар, при этом обладает простым интерфейсом и не содержит строгих ограничений на длину переводимого текста, так что отсканированный документ удастся прочитать сразу.
От автоматического перевода чудес в части совершенства ждать не приходится, тем не менее качество перевода Google Translate считается хорошим, и обычно именно этот сайт используют в первую очередь.
Альтернативное решение — это онлайн-сервис www.trans-late.ru отечественной компании ПРОМТ. Но здесь установлен лимит в 3 тыс. символов для единовременного перевода. Так что разворот книги пришлось переводить в два приема.
Используя эти или другие сервисы онлайн-переводов после оптического распознавания, проблема восприятия содержания материала на незнакомом языке должна просто сойти на нет. Еще бы объединить все самые лучшие достижения, да в одном интерфейсе, да бесплатно…
Источник
Автор: Роман Поликарпов
Добавить комментарий Отменить ответДля того, чтобы распознать речь и перевести её из аудио или видео в текст, существуют программы и расширения (плагины) бля браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны. Большое число установленных в браузере плагинов сильно тормозит его работу и скорость серфинга в интернет. А сервисы, о которых сегодня пойдет речь, полностью бесплатны и не требуют установки – зашел, попользовался и ушел!
В этой статье мы рассмотрим два сервиса перевода речи в текст онлайн. Оба они работают по схожему принципу: Вы запускаете запись (разрешаете браузеру доступ к микрофону на время пользования сервисом), говорите в микрофон (диктуете), а на выходе получаете текст, который можно скопировать в любой документ на компьютере.
Русскоязычный онлайн сервис распознавания речи. Имеет подробную инструкцию по работе на русском языке.
Среди основных функций «Голосового блокнота» (так сам автор называет свой сервис) следует выделить:
Второй онлайн сервис перевода речи в текст. Иностранный сервис, который между тем, прекрасно работает с русским языком, что крайне удивительно. По качеству распознавания речи не уступает Speechpad, но об этом чуть позже.
Основной функционал сервиса:
В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?
Сравнительный тест сервисовДля теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты. Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.
Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):
Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!
Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Красное солнце пустыни»):
Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой! Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов ). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!
Кстати вот как он выполнил синхронный перевод фрагмента поэмы Некрасова на английский язык:
Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:
Процесс обработки FineReader Сканирование (сканер, цифровой фотоаппарат, цифровая видеокамера).Сегментация - выделение блоков на изображении.Распознавание – неоднозначно опознанные символы выделяются цветом. Проверка ошибок- можно провести проверку грамматики.Сохранение результатов в виде отформатированного или неотформатированного документа, или прямой передачи в другое приложение - WORD, Excel в буфер обмена Windows.
Система оптического распознавания символов Если исходный документ имеет типографическое качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном.При распознавании документов с низким качеством печати (машинописный текст, факс и т.д.) используется метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов.
Система оптического распознавания форм Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено место для переменной. Сложность состоит в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей. Кроме того система должна определить, к какому полю относится распознаваемый текст.
Система оптического распознавания форм Для обработки бланков предназначено специальное приложение FineReader Forms.Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Сервис/ ШаблоныШаблон используют на этапе сегментации. Сегментация в данном случае состоит в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещён бланк при сканировании.Заключительный этап состоит в распознавании содержимого бланка.
Система распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.