java读取pdf文件,Java如何读取pdf的内容?

这个对于Java开发者来说简直是简单不能再简单的问题,以至于我不知道提问的人为何要提问,在百度一搜一大堆,也可能提问者想到一个最好的回答。下面我来说说怎么读取。3种方法:

1. 开源框架 pdfbox 2. 国产的框架

Spire.PDF

3. iTika

第一步:引入依赖

java读取pdf文件,Java如何读取pdf的内容?

第二步:Junit测试用例

1. pdfBox

java读取pdf文件,Java如何读取pdf的内容?

2. spire

java读取pdf文件,Java如何读取pdf的内容?

3. Tika

java读取pdf文件,Java如何读取pdf的内容?

其实我认为这些api都大同小异,各有各的优势吧,不过个人更倾向于apache的,毕竟大平台。

java读取pdf文件,Java如何读取pdf的内容?

Java如何读取文件?

Java读取文件的方法

代码如下:

import java.io.*;

public class ReadFileDemo {

public static void main(String[] args) {

//读取c盘的file1文件

File file = new File("C://file1.txt");

BufferedInputStream bis = null;

FileInputStream fis= null;

try

{

//第一步 通过文件路径来创建文件实例

fis = new FileInputStream(file);

/*把FileInputStream实例 传递到 BufferedInputStream

目的是能快速读取文件

*/

bis = new BufferedInputStream(fis);

/*available检查是不是读到了文件末尾 */

while( bis.available() > 0 ){

System.out.print((char)bis.read());

}

}catch(FileNotFoundException fnfe)

{

System.out.println("文件不存在" + fnfe);

}

catch(IOException ioe)

{

System.out.println("I/O 错误: " + ioe);

}

finally

{

try{

if(bis != null && fis!=null)

{

fis.close();

bis.close();

}

}catch(IOException ioe)

{

System.out.println("关闭InputStream句柄错误: " + ioe);

}

}

}

}

java读取pdf文件,Java如何读取pdf的内容?

"

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 xxx@163.com 举报,一经查实,本站将立刻删除。

发表评论

登录后才能评论