Распознавание текста с картинки онлайн
Сервис поможет преобразовать онлайн картинки формата: jpg, jpeg, png, bmp, pbm в текст. Это упростит работу с текстом: позволит скопировать его в удобный файл любого формата, проверить орфографию или провести SEO анализ. Конвертация изображений доступна на 30+ языках (список внизу страницы), проверка орфографии доступна на большинстве из них
Как это работает?
OCR – это оптическое распознавание изображений, которое работает онлайн на tesseract.js. Технология идентифицирует и преобразует отсканированные печатные символы в электронный формат. Он легче распознается компьютером и другими программами. Грубо говоря, технология распознает текст, изучая его и переводя символы в код для последующей обработки данных. То есть физический документ становится машиночитаемым.
Программа OCR преобразует ваш документ в ч/б или двухцветную версию. Растровое изображение затем анализируется на наличие темных областей (текста) и светлых (фона). Далее темные области оцениваются как символы, которые следующим этапом распознаются технологией на предмет цифр или букв.
Для чего может использоваться программа?
Сервис полезен для тех, кому нужно перенести текст со сканера в электронный вид или
распознать текст на фото, и получить его в виде текстового документа. Технологию часто используют специалисты, работающие с большим количеством литературы и физических документов. Набрать такой текст вручную бывает невозможно.
Отсканированный текст пользователь может редактировать и форматировать в обычном редакторе. Это упрощает обработку больших объемов текста, существующих изначально вне электронного формата.
Какой текст распознается лучше всего?
Чтобы сервис распознал текст без ошибок, он должен соответствовать таким требованиям:
- отсканированная копия или четкое фото текста на камеру телефона;
- все символы ровные;
- контраст между фоном и буквами;
- текст хорошо читается;
- фон текста однотонный.
Сервис не распознает рукописный текст, капчу, а также текст с неоднотонным или зашумленным фоном.
Как оптимизировать фото, скриншот, изображение для лучшего качества преобразования?
Руководствуйтесь предыдущим пунктом и постарайтесь сделать максимальный контраст между фоном и символами, при этом фон должен быть максимально однотонным.
Как пользоваться сервисом?
Для вас технология работает просто:
- Сфотографируйте телефоном/фотоаппаратом или отсканируйте текст, который надо распознать. Поддерживаются форматы: jpg, jpeg, png, bmp, pbm.
- Жмите кнопку «Загрузить файл».
- Выберите файл на своем компьютере.
- Подождите, пока ваш документ обработается – занимает не больше 1 минуты.
- Скопируйте текст, и сохраните результат в удобном для себя формате:
- Чистый текст (txt)
- Adobe Acrobat (pdf)
- Microsoft Word (docx)
- OpenOffice (odf)
- и др.
Скачивание с сайта файлов в готовом/выбранном формате будет реализовано позже.
Вы можете распознавать бесплатно любое количество файлов. Регистрация или оплата не нужны.
Что можно делать с распознанным текстом?
Теперь у вас есть большой выбор манипуляций с готовым текстом:
- копируйте;
- проверяйте орфографию;
- редактируйте;
- делайте SEO-анализ текста, чтобы посчитать слова и символы;
- сохраняйте в файл для дальнейшей работы с ним на своем устройстве.
Преимущества сервиса
- В несколько кликов вы получите текст с картинки, готовый для редактирования и обработки.
- Все строго конфиденциально и защищено сертификатом SSL+.
- Ваши файлы и распознанные тексты не хранятся в сервисе и никак не оцениваются.
- Максимум 1 минута на распознавание любого файла.
- Пользуйтесь сервисом без регистрации.
- Не требуется установка на компьютер, вся работа выполняется в любом браузере онлайн.
Перевод текста на другие языки
Если вам нужны переводы большого количества обработанных текстов пишите нам на почту(contactistio@gmail.com), мы добавим эту функцию.
Список языков для конвертации
Aфрикаанс, Азербайджанский, Албанский, Английский, Английский (Старый), Арабский, Баскский язык, Белорусский, Бенгальский, Болгарский, Венгерский, Вьетнамский, Галисийский, Голландский, Греческий, Датский, Древнегреческий, Иврит, Индонезийский, Интернет-мем, Исландский, Испанский, Итальянский, Итальянский (Старый), Каннада, Каталанский, Китайский, Корейский, Латышский, Литовский, Македонский, Малайский, Малаялам, Мальтийский, Математика, Немецкий, Норвежский, Польский, Португальский, Румынский, Русский, Сербский (латиница), Словацкий, Словенский, Старый испанский, Суахили, Тагальский, Тайский, Тамильский, Телугу, Традиционный китайский, Турецкий, Украинский, Финский, Франкский, Французский, Французский (Старый), Хинди, Хорватский, Чероки, Чешский, Шведский, Эсперанто, Эсперанто альтернативный, Эстонский, Японский