时间:2019-11-29 13:09:18 | 栏目: | 点击:次
Apache PDFBox 库是一个开源、用于操作 PDF 文档的 Java 工具库。PDFBox 允许创建新的 PDF 文档、操作现有文档,以及从文档中提取内容。本文介绍演示了从现有的 PDF 提取某个页面,另存为 png 的操作。
package com.codeinn.pdf.test;
import java.awt.image.BufferedImage;
import java.io.File;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.ImageType;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.apache.pdfbox.util.ImageIOUtil;
public class PdfBox2ImgEx {
public static void main(String[] args){
try{
PDDocument pdfDocument = PDDocument.load(new File("KELLWOOD01.pdf"));
int iPages = pdfDocument.getNumberOfPages();
PDFRenderer pdfRenderer = new PDFRenderer(pdfDocument);
int dpi = 300;
for(int iPage=0;iPage<iPages;iPage++){
BufferedImage buffImage = pdfRenderer.renderImageWithDPI(iPage, dpi, ImageType.RGB);
ImageIOUtil.writeImage(buffImage, "KELLWOOD01_"+iPage+".png", dpi);
}
pdfDocument.close();
}
catch (Exception e){
}
}
}