在线识别图片上的文字
本服务可帮助您在线转换以下格式的图片为文字:jpg, jpeg, png, bmp, pbm。这将简化文本工作:允许您将其复制到任何格式的方便文件,进行拼写检查或进行SEO分析。图像转换支持30多种语言(页面底部有语言列表),大多数语言都支持拼写检查
它是如何工作的?
OCR 是在线上通过 tesseract.js 运行的光学字符识别技术。这项技术能够识别并将扫描的打印字符转化为电子格式,使其更容易被计算机和其他软件识别。简而言之,该技术通过研究并将字符转化为代码来识别文本,以进行后续的数据处理。这意味着实体文件变得可被机器读取。
OCR 软件会将您的文档转换为黑白或双色版本。位图随后会被分析以识别出深色区域(文本)和浅色区域(背景)。接着,深色区域会被视为字符,并在下一步被技术识别为数字或字母。
这个程序可以用来做什么?
该服务对于需要将扫描仪上的文本转移到电子格式的人很有用,或者需要识别照片上的文本并将其转化为文本文档的人。处理大量文献和实体文件的专家经常使用这项技术。手工输入这样的文本几乎是不可能的。
用户可以在常规编辑器中编辑和格式化扫描后的文本。这简化了处理最初不在电子格式中的大量文本。
哪种文本的识别效果最好?
为了确保服务无误地识别文本,它必须满足以下条件:
- 扫描的副本或用手机摄像头拍摄的清晰文本照片;
- 所有字符均匀;
- 背景和字母之间有对比;
- 文本可清晰阅读;
- 文本背景是单色的。
服务无法识别手写文本、验证码,以及具有非单色或噪音背景的文本。
如何优化照片、截图、图像以获得更好的转换质量?
请遵循上一节的指导,并尽量在背景和字符之间制造最大的对比,同时确保背景尽可能是单色的。
如何使用该服务?
对您来说,这项技术的操作非常简单:
- 使用手机/相机拍摄或扫描需要识别的文本。支持的格式有:jpg, jpeg, png, bmp, pbm。
- 点击“上传文件”按钮。
- 在您的计算机上选择文件。
- 等待您的文档被处理 - 不超过1分钟。
- 复制文本,并按您所需的格式保存结果:
- 纯文本(txt)
- Adobe Acrobat(pdf)
- Microsoft Word(docx)
- OpenOffice(odf)
- 等等。
网站上文件的下载功能将在之后实现。
您可以免费识别任意数量的文件。无需注册或支付。
我可以如何使用识别出的文本?
现在您可以自由地处理这些已识别的文本:
- 复制;
- 检查拼写;
- 编辑;
- 进行文本的SEO分析,计算字数和字符;
- 保存为文件,以便在您的设备上继续工作。
服务的优点
- 几次点击后,您将从图片中获得可编辑和处理的文本。
- 一切都是严格保密的,并受到SSL+证书的保护。
- 您的文件和识别出的文本不会被存储在我们的服务中,并且不会被任何方式评估。
- 任何文件的识别时间最多1分钟。
- 无需注册即可使用该服务。
- 无需在计算机上安装任何软件,所有操作都可以在任何在线浏览器上完成。
将文本翻译成其他语言
如果您需要大量文本的翻译,请通过电子邮件(contactistio@gmail.com)联系我们,我们将添加此功能。
转换的语言列表
布尔语,阿塞拜疆语,阿尔巴尼亚语,英语,古英语,阿拉伯语,巴斯克语,白俄罗斯语,孟加拉语,保加利亚语,匈牙利语,越南语,加利西亚语,荷兰语,希腊语,丹麦语,古希腊语,希伯来语,印尼语,互联网模因,冰岛语,西班牙语,意大利语,古意大利语,卡纳达语,加泰罗尼亚语,中文,韩语,拉脱维亚语,立陶宛语,马其顿语,马来语,马拉雅拉姆语,马耳他语,数学,德语,挪威语,波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语(拉丁字母),斯洛伐克语,斯洛文尼亚语,古西班牙语,斯瓦希里语,他加禄语,泰语,泰米尔语,泰卢固语,繁体中文,土耳其语,乌克兰语,芬兰语,法兰克语,法语,古法语,印地语,克罗地亚语,切罗基语,捷克语,瑞典语,世界语,替代世界语,爱沙尼亚语,日语