Text Extractor mac版怎么用?Text Extractor for Mac使用教程
时间:2019-05-17 浏览次数:38 编辑:user02
Text Extractor mac版是一款很实用的mac文本提取器,Text Extractor for Mac支持Mac上从PDF和图像中提取文本,你可以快速从扫描的纸质文档和图像文件中提取文本内容,下面为大家带来Text Extractor for Mac使用教程,有兴趣的朋友可以来了解一下哦!
1.启动应用程序并打开文件
打开Finder>应用程序,然后单击“文本提取器”图标。界面出现后,单击“打开文件”按钮。然后,您可以从下拉查找器窗口中选择要执行提取的文件。
支持的输入文件格式:
PDF文件(.pdf)
图像格式:png,jpeg,jpg,tif,tiff,bmp,gif。
2.选择输出和OCR选项
如果导入的文件不是扫描的文件或图像,则无需启用OCR选项并选择文档语言。
如果导入图像文件或扫描的PDF文件,请启用OCR,选择正确的文档语言。
您可以选择转换所有页面或当前页面。
3.开始提取
点击“提取”按钮,转换将开始。
4.使用提取的文本内容
提取过程完成后,您将看到输出区域中的文本内容可用。您可以直接在输出区域内编辑内容,将文本内容复制到剪贴板,或将其作为纯文本文件(.txt)提取。
提高转换质量和生产力的高级步骤:
1.提高转换质量
(1)提高图像分辨率
OCR转换的准确性取决于原始PDF的质量。可能无法准确识别文档图像质量差和文档偏斜。
图像应至少为300 dpi,对于字体较小的文档,建议使用600 dpi。或者文本将粘在一起,OCR很难准确识别这些文本。
OCR可以更好地处理具有白色背景和黑色文本内容的文档。
(2)将页面旋转到正确的方向
PDF文档或图像必须正面朝上。
(3)选择正确的文档语言
选择正确的文档语言非常重要,例如,如果您的PDF文件是俄语,但您选择英语作为识别语言,结果将无法正确。
(4)指出图片区域
如果您不想从图片区域或导入文件的任何特定区域中提取文本,请拖动以指出这些区域。
2.运行拼写检查以快速修复错误识别
OCR不是一件容易的事,一些相似的字符,例如'e'和'c','l','i'和'!' 可能无法正确识别。运行拼写检查可以快速找到这些错误并快速纠正。
右键单击输出区域,选择“Spelling and Grammar” - >“Show Spelling and Grammar”。
将弹出一个窗口。例如,'技能'被错误地识别为'Skil!',运行拼写检查以快速发现此错误,从推荐中选择正确的一个并单击“更改”按钮。
小编点评
以上就是关于“Text Extractor mac版怎么用?Text Extractor for Mac使用教程”的全部内容了,希望能对你有所帮助。