如何使用Java读取PPT文本和图片
时间:2020-11-21 15:00:50|栏目:JAVA代码|点击: 次
前言
本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片。
工具:
- Free Spire.Presentation for Java(免费版)
- IntelliJ IDEA
Jar文件获取及导入:
方法1:官网下载jar文件包。下载后,解压文件,并在java程序中导入lib文件夹下的Spire.Presentation.jar文件。
方法2:可通过maven仓库导入到maven项目。
Java代码示例
测试文档:
【示例1】读取PPT中的文本
import com.spire.presentation.IAutoShape; import com.spire.presentation.ISlide; import com.spire.presentation.ParagraphEx; import com.spire.presentation.Presentation; import java.io.FileWriter; public class ExtractText { public static void main(String[]args) throws Exception{ //加载测试文档 Presentation ppt = new Presentation(); ppt.loadFromFile("test.pptx"); StringBuilder buffer = new StringBuilder(); //遍历文档中的幻灯片,提取文本 for (Object slide : ppt.getSlides()) { for (Object shape : ((ISlide) slide).getShapes()) { if (shape instanceof IAutoShape) { for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) { buffer.append(((ParagraphEx) tp).getText()); } } } } //保存到文本文件 FileWriter writer = new FileWriter("ExtractText.txt"); writer.write(buffer.toString()); writer.flush(); writer.close(); } }
文本读取结果:
【示例2】读取PPT中的所有图片
import com.spire.presentation.Presentation; import javax.imageio.ImageIO; import java.awt.image.BufferedImage; import java.io.File; public class ExtractAllImgs { public static void main(String[] args) throws Exception { //加载文档 Presentation ppt = new Presentation(); ppt.loadFromFile("test.pptx"); //提取文档中的所有图片 for (int i = 0; i < ppt.getImages().getCount(); i++) { BufferedImage image = ppt.getImages().get(i).getImage(); ImageIO.write(image, "PNG", new File(String.format("AllImage-%1$s.png", i))); } } }
【示例3】读取指定幻灯片中的图片
import com.spire.presentation.*; import javax.imageio.ImageIO; import java.awt.image.BufferedImage; import java.io.File; public class ExtractImgsInSpecifiedSlide { public static void main(String[]args) throws Exception{ //加载文档 Presentation ppt = new Presentation(); ppt.loadFromFile("test.pptx"); //获取第2张幻灯片 ISlide slide = ppt.getSlides().get(1); //提取图片 for(int i = 0; i< slide.getShapes().getCount(); i++) { IShape shape = slide.getShapes().get(i); if(shape instanceof SlidePicture) { SlidePicture pic = (SlidePicture) shape; BufferedImage image = pic.getPictureFill().getPicture().getEmbedImage().getImage(); ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i))); } if(shape instanceof PictureShape) { PictureShape ps = (PictureShape) shape; BufferedImage image = ps.getEmbedImage().getImage(); ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i))); } } } }
图片读取结果:
上一篇:springboot实现上传并解析Excel过程解析
栏 目:JAVA代码
下一篇:java基础之反射和泛型以及注解
本文标题:如何使用Java读取PPT文本和图片
本文地址:http://www.codeinn.net/misctech/24875.html
阅读排行
- 1Java Swing组件BoxLayout布局用法示例
- 2java中-jar 与nohup的对比
- 3Java邮件发送程序(可以同时发给多个地址、可以带附件)
- 4Caused by: java.lang.ClassNotFoundException: org.objectweb.asm.Type异常
- 5Java中自定义异常详解及实例代码
- 6深入理解Java中的克隆
- 7java读取excel文件的两种方法
- 8解析SpringSecurity+JWT认证流程实现
- 9spring boot里增加表单验证hibernate-validator并在freemarker模板里显示错误信息(推荐)
- 10深入解析java虚拟机