word转换enc格式 enc格式转换 - 电脑|办公 - 电脑办公-杀毒安全-网络-V3学习网
微商网
 
 
导航:首页 |电脑|办公|正文

word转换enc格式 enc格式转换

时间:2021-07-06 09:41:25
word的文档点样转成enc的文档的 CAJ格式转换成WORD的方法 现在网上许多资料都是以CAJ、PDF等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率
作者:

word转换enc格式

word的文档点样转成enc的文档的

CAJ格式转换成WORD的方法 现在网上许多资料都是以CAJ、PDF等文件格式提供的,其中的文本不能被直接编辑。

网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。

本文所述利用微软提供的OCR识别技术从CAJ、PDF等文件中提取全部文本的方法,简便快捷,效率很高。

从不同格式的文件中提取文本前需要做好以下准备工作,安装CAJViewe5.5浏览器软件和acoat 5 专业版浏览器软件安装Office2003,并完全安装Of?鄄fice工具Micosoft Office Document Imaging,然后在打印机里面会增加Micosoft Office Document Image Wite打印机。

Micosoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格。

一、CAJ文件的识别 (一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。

(二)然后,启动CAJViewe浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。

浏览文件到最后一页后,不要关闭CAJ浏览器程序。

(三)在CAJ浏览器程序窗口中,选择“文件”→“打印”,并选择打印机为Micosoft Office Document Image Wite打印机,勾选打印到文件选项和确定打印页数。

(四)保存打印文件(*.pn)到适当位置。

等待打印完成后,Micosoft Office Document Image 自动打开刚才保存的打印文件。

(五)在Micosoft Office Document Image窗口中,选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用OCR识别文本”提取文本。

(六)选择“工具”下的 “将文本发送到wod”,最后将把整个CAJ文件识别输出到wod文件中。

二、PDF文件的识别 (一)以文本形式保存的PDF文件,用acoat 5 专业版,识别整个文件。

直接打开从网上下载的PDF格式文件另存为RTF文件,或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到Wod中即可。

(二)以图片形式保存的PDF文件,将PDF文件打印到Micosoft Office Document Image Wite打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Micosoft Office Document Image打开此文件,然后在Micosoft Office Document Im?鄄age中选择“工具”菜单中的“使用OCR识别文本”,识别完成后,在选择“工具”下的,“将文本发送到wod”,最后将把整个PDF文件识别输出到wod文件中。

(三)加密的PDF文件先下载解密软件,解密后在参照上述步骤1),2) 进行。

(四)繁体PDF文件用上述步骤2)的方法识别到wod后,用wod中的“工具”→“语言”→“中文繁简转换” 三、超星文件的识别 (一)全文件识别打印到Micosoft Office Document Image Wite打印机,然后按上述PDF文件的识别步骤中第二点操作,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到Wod中,再合并到一起。

打印时要填入打印页码从1到最后一页,不要选择打印全部。

在打印选项中,要将页面比例设成真实大小,而不是整宽。

注意识别速度比其他格式要慢很多,请保持耐心。

一般一本200多页的书,识别需要几分钟的时间。

(二)超星文件识别相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的PDF文件,然后再用上述识别PDF文件的方法转成Wod。

四、后记 经过试验,发现Micosoft Office Document Image 存在一些不稳定的问题,如在用CAJ打印到Micosoft Office Document Image Wite时,发现用CAJ5.5版本比较快,而CAJ5.0有时出现假死机。

页面显示大时,转化的识别率较高。

如果页数多的文件,包括超星,可以分多次转化。

由于虚拟打印到Micosoft Office Document Image Wite 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度、C盘和内存空间。

建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在任务栏中会出现打印机图标,可以双击,看到打印任务的进度,避免误以为死机。

转化完成后请删除c:\windows\temp目录下的虚拟打印文件,否则C盘很快会被用光

word转换器能转换什么格式的文件

Word 转换器是一个易用和强大的转换器软件,它能在多种格式之间相互转换。

其中的 MicroSoft Word 2007 (*.DOCX), MicroSoft Word 97-2003(*.DOC), 网页文件(Htm,Html) .文本文件(TXT), RTF, CSS, XML, BMP, JPG, JPEG, PNG, GIF, WMF 和 TIF 转换成 DOCX, DOC, Adobe PDF File (*.PDF), Htm, Html, TXT, RTF, CSS, XML. 如果转换成PDF格式,你可以设置转换后PDF打开密码。

设置转换后页面的位置。

并且该软件支持多种语言,含有中文,英文,法语,德语,意大利语,日语。

同时软件的界面友好,转换格式快速等功能。

下面是详细的格式支持。

支持以下格式转换成PDFWord 转换成 PDF, Word 2007 转换成 PDF, Html 转换成 PDF, Htm 转换成 PDF, TXT 转换成 PDF, RTF 转换成 PDF, CSS 转换成 PDF, XML 转换成 PDF, BMP 转换成 PDF, JPG 转换成 PDF, JPEG 转换成 PDF, PNG 转换成 PDF, GIF 转换成 PDF, WMF 转换成 PDF, TIF 转换成 PDF, DOC 转换成 PDF, DOCX 转换成 PDF支持以下格式转换成Word 2007 ( DOCX )Word 转换成 DOCX, Word 2007 转换成 DOCX, Html 转换成 DOCX, Htm 转换成 DOCX, TXT 转换成 DOCX, RTF 转换成 DOCX, CSS 转换成 DOCX, XML 转换成 DOCX, BMP 转换成 DOCX, JPG 转换成 DOCX, JPEG 转换成 DOCX, PNG 转换成 DOCX, GIF 转换成 DOCX, WMF 转换成 DOCX, TIF 转换成 DOCX, DOC 转换成 DOCX, DOCX 转换成 DOCX支持以下格式转换成Word 97-2003 ( DOC )Word 转换成 DOC, Word 2007 转换成 DOC, Html 转换成 DOC, Htm 转换成 DOC, TXT 转换成 DOC, RTF 转换成 DOC, CSS 转换成 DOC, XML 转换成 DOC, BMP 转换成 DOC, JPG 转换成 DOC, JPEG 转换成 DOC, PNG 转换成 DOC, GIF 转换成 DOC, WMF 转换成 DOC, TIF 转换成 DOC, DOC 转换成 DOC, DOCX 转换成 DOC支持以下格式转换成网页文件 ( htm 或 html )Word 转换成 Htm Html, Word 2007 转换成 Htm Html, Html 转换成 Htm Html, Htm 转换成 Htm Html, TXT 转换成 Htm Html, RTF 转换成 Htm Html, CSS 转换成 Htm Html, XML 转换成 Htm Html, BMP 转换成 Htm Html, JPG 转换成 Htm Html, JPEG 转换成 Htm Html, PNG 转换成 Htm Html, GIF 转换成 Htm Html, WMF 转换成 Htm Html, TIF 转换成 Htm Html, DOC 转换成 Htm Html, DOCX 转换成 Htm Html还有支持文件转换成RTF,Word 转换成 RTF, Word 2007 转换成 RTF, Html 转换成 RTF, Htm 转换成 RTF, TXT 转换成 RTF, RTF 转换成 RTF, CSS 转换成 RTF, XML 转换成 RTF, BMP 转换成 RTF, JPG 转换成 RTF

急!!!怎样将word文件转换为txt格式文件?我用word整理

Adoe Acoat制作PDF文档 PDF(Potale Document Fomat,便携文档格式)格式是Adoe公司在其PostScipt语言的基础上创建的一种主要应用于电子出版的文件规范系统。

PDF文件可以将文字、字型、格式、颜色及与设备和分辨率独立的图形图像等封装在一个文件中,该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。

由于PDF文件可以不依赖操作系统的语言和字体以及显示设备,就能“逼真地”将文件原貌展现给每一个阅读者,因此越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件等开始使用PDF格式文件。

目前已成为电子文档发行和数字化信息传播事实上的一个标准。

制作PDF文件的“官方”软件为Adoe公司的Adoe Acoat,注意,不是我们通常使用的Adoe Acoat Reade(这个软件只是pdf文件的阅读软件)。

Adoe Acoat是一个商业软件,本文操作基于Adoe Acoat 4.0,其他版本流程类似。

软件安装要点 首先是安装软件,不要觉得安装很简单,如果安装得不当是不能输出含有中文PDF文件的。

安装时需注意的地方在于看到如图1的对话框时,选择“Custom(用户定制)”方式,点Next继续,出现组件对话框,把滚动条拉到最末端,点中“Asian Language Suppot(支持亚洲语言)”,然后点“Change”按钮,在弹出的对话框里选择“Simplified Chinese Language Files(简体中文语言包)”和“Distille Asian Language PDF Geneation(Distille亚洲语言PDF生成器)”,点“Continue”继续。

再点“Next”,只要输入个人信息和序列号,再一路Next就可以了,在拷贝完成后忽略电子注册,然后按照提示重新启动计算机就完成安装了。

这时候你打开Wod就会发现多了两个图标,这可能是Acoat的一个ug,我们先删去一个图标,右键点击工具栏,选择“自定义”,然后在“工具栏”标签中选中一个“PDFMake 4.0”,点“删除”按钮即可。

在这里PDFMake是一个宏按钮,是特别为Micosoft Wod设计的,用来在Wod中方便地生成PDF文件。

自动生成PDF文件 现在我们就可以来制作第一个PDF文件了。

首先,用Wod打开一个文件,然后点击工具栏中的图标,会出现图2这样的对话框,使用系统的默认值就单击“Ceate”按钮,这样PDFMake就开始自动生成PDF文件了。

它会自动扫描Wod文档中的有关信息,比如链接、目录之类,把它们和PDF格式的链接、目录等相对应,在生成的PDF文件中的所有可视信息都和原来的文件相同。

还要说明一点,PDFMake生成的PDF文件存放的路径与原来的DOC文件相同。

到这里,你已经做好了第一个PDF文件!这是最简单的一种方法,但不是最好的。

为什么呢?因为这样做出来的PDF文件尺寸非常大,比如原来的DOC文件只有25K,用上面这种方法做出来的文件有153K之巨!根本不符合网上传输的要求!可能你会问为什么会这样呢? 解释这个问题就要从PDF文件的内部制作过程讲起。

转换成PDF文件的过程非常特殊,在安装完Acoat后,去查看打印机,会发现多了两个打印机设置Acoat Distille和Acoat PDFWite,这是Acoat自动设置的虚拟打印机,这对制作PDF文件来说是必须的。

因为PDF文件的格式规范是创建在PostScipt语言基础上的,而PostScipt语言是一种精确的页面描述语言,应用在电子出版上来生成复杂的版面,PostScipt与打印机的硬件无关,只要求打印机支持这种页面描述就可以了。

在这里Acoat Distille和Acoat PDFWite就是两个虚拟的PostScipt打印机,而宏PDFMake就是把DOC文档进行虚拟打印,得到中间文件س.PS(PostScipt)文件,然后再调用Acoat Distille来产生PDF文件。

Acoat为了适应亚洲语言的特点,对亚洲语言设计了特殊的生成器和语言包,但是它是通过“嵌入字体(Emed Fonts)”的方法来解决的。

这样做对于直接打印是很优化的,但是如果是用来生成PDF文件,带来的负面效应就是大大增加了文件的尺寸。

大家还关注
    
阅读排行
推荐阅读