poi读word表格图像 poi读取word表格

时间：2021-04-27 15:01:44

怎么使用JAVA,POI读写word文档如何使用JAVA、POI读写word文档？？能不能将一个word的内容完全读过来，放到一个新生成的word文件中去，要求能将word中的表格、图片等保留，格式

作者:

poi读word表格图像

怎么使用JAVA,POI读写word文档

如何使用JAVA、POI读写word文档？？能不能将一个word的内容完全读过来，放到一个新生成的word文件中去，要求能将word中的表格、图片等保留，格式不变。

最好能给个例子？网上多是很早以前的那个解决方法如下：，只能读文本内容，且新生成的word文件打开时总是要提示选择编码，不太好用，希望能有新的解决方案？？！！poi操作word1.1 添加poi支持：包下载地址1.2 POI对Excel文件的读取操作比较方便，POI还提供对Word的DOC格式文件的读取。

但在它的发行版本中没有发布对Word支持的模块，需要另外下载一个POI的扩展的Jar包。

下载地址为；下载extractors-0.4_zip这个文件2、提取Doc文件内容 public static String readDoc(String doc) throws Exception {// 创建输入流读取DOC文件 FileInputStream in = new FileInputStream(new File(doc)); WordExtractor extractor = null; String text = null；// 创建WordExtractor extractor = new WordExtractor（)；// 对DOC文件进行提取 text = extractor.extractText(in); return text; } public static void main(String[] args) { try{ String text = WordReader.readDoc(＂c:/test.doc＂); System.out.println(text); }catch(Exception e){ e.printStackTrace(); } }3、写入Doc文档 import java.io.ByteArrayInputStream; import java.io.FileOutputStream; import java.io.IOException; import org.apache.poi.poifs.filesystem.DirectoryEntry; import org.apache.poi.poifs.filesystem.DocumentEntry; import org.apache.poi.poifs.filesystem.POIFSFileSystem; public class WordWriter { public static boolean writeDoc(String path, String content) { boolean w = false; try { // byte b[] = content.getBytes(＂ISO-8859-1＂); byte b[] = content.getBytes(); ByteArrayInputStream bais = new ByteArrayInputStream(b); POIFSFileSystem fs = new POIFSFileSystem(); DirectoryEntry directory = fs.getRoot(); DocumentEntry de = directory.createDocument(＂WordDocument＂, bais); FileOutputStream ostream = new FileOutputStream(path); fs.writeFilesystem(ostream); bais.close(); ostream.close(); } catch (IOException e) { e.printStackTrace(); } return w; } public static void main(String[] args) throws Exception{ String wr=WordReader.readDoc(＂D:\\test.doc＂); boolean b = writeDoc(＂D:\\result.doc＂,wr);

poi word 图片设置位置

1. 读取word 2003及word 2007需要的jar包2. 读取 2003 版本（.doc）的word文件相对来说比较简单，只需要 poi-3.5-beta6-.jar 和 poi-scratchpad-3.5-beta6-.jar 两个 jar 包即可，而 2007 版本（.docx）就麻烦多，我说的这个麻烦不是我们写代码的时候麻烦，是要导入的 jar 包比较的多，有如下 7 个之多：3. 1. openxml4j-bin-beta.jar4. 2. poi-3.5-beta6-.jar5. 3. poi-ooxml-3.5-beta6-.jar6. 4 .dom4j-1.6.1.jar7. 5. geronimo-stax-api_1.0_spec-1.0.jar8. 6. ooxml-schemas-1.0.jar9. 7. xmlbeans-2.3.0.jar10. 其中 4-7 是 poi-ooxml-3.5-beta6-.jar 所依赖的 jar 包（在 poi-bin-3.5-beta6-.tar.gz 中的 ooxml-lib 目录下可以找到）。

11. 2.换行符号12. 硬换行：文件中换行，如果是键盘中使用了＂enter＂的换行。

13. 软换行：文件中一行的字符数容量有限，当字符数量超过一定值时，会自动切到下行显示。

14. 对程序来说，硬换行才是可以识别的、确定的换行，软换行与字体大小、缩进有关。

15. 3.读取的注意事项16. 值得注意的是： POI 在读取不会读取 word 文件中的图片信息；还有就是对于 2007 版的 word(.docx)，如果 word 文件中有表格，所有表格中的数据都会在读取出来的字符串的最后。

17. 4.读取word文本内容代码1 import java.io.File;2 import java.io.FileInputStream;3 import java.io.InputStream;4 5 import org.apache.poi.POIXMLDocument;6 import org.apache.poi.POIXMLTextExtractor;7 import org.apache.poi.hwpf.extractor.WordExtractor;8 import org.apache.poi.openxml4j.opc.OPCPackage;9 import org.apache.poi.xwpf.extractor.XWPFWordExtractor;10 11 public class Test {12 public static void main(String[] args) {13 try {14 InputStream is = new FileInputStream(new File(＂2003.doc＂));15 WordExtractor ex = new WordExtractor(is);16 String text2003 = ex.getText();17 System.out.println(text2003);18 19 OPCPackage opcPackage = POIXMLDocument.openPackage(＂2007.docx＂);20 POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);21 String text2007 = extractor.getText();22 System.out.println(text2007);23 24 } catch (Exception e) {25 e.printStackTrace();26 }27 }28 }

要用Java POI读取Excel文件中的数据,并且实现对数据的格式校验,...

有个最简单，不用使用任何 poi 或其他第三方类库的方法生成 excel ，或 word ,你把一个生成好的 word 例子用文件另存为 xml , docx 之类，然后你再直接用记事本去打开这个 docx ，你就会发现是 xml 格式，这个时候，你在程序里面就直接用普通代码生成这个 xml 就可以了。

poi中怎么读取excel文件

JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法 OFFICE文档使用POI控件，PDF可以使用PDFBOX0.7.3控件，完全支持中文，用XPDF也行，不过感觉PDFBOX比较好，而且作者也在更新。

水平有限，万望各位指正 WORD: import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.poi.hwpf.extractor.WordExtractor; import java.io.File; import java.io.InputStream; import java.io.FileInputStream; import com.search.code.Index; public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException { String bodyText = null; try { WordExtractor ex = new WordExtractor(is);//is是WORD文件的InputStream bodyText = ex.getText(); if(!bodyText.equals(＂＂)){ index.AddIndex(url, title, bodyText); } }catch (DocCenterException e) { throw new DocCenterException（＂无法从该Mocriosoft Word文档中提取内容＂， e）; }catch(Exception e){ e.printStackTrace(); } } return null; } Excel: import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFCell; import java.io.File; import java.io.InputStream; import java.io.FileInputStream; import com.search.code.Index; public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException { StringBuffer content = new StringBuffer(); try{

上一篇：关键字监控软件监控软件
下一篇：安卓aprs软件 aprs手机软件

大家还关注

阅读排行

poi读word表格图像 poi读取word表格

怎么使用JAVA,POI读写word文档

poi word 图片 设置位置

要用Java POI读取Excel文件中的数据,并且实现对数据的格式校验,...

poi中怎么读取excel文件

poi word 图片设置位置