欢迎来到代码驿站!

Linux

当前位置:首页 > 服务器 > Linux

CentOS下使用LibreOffice实现文档格式的转换方式

时间:2020-10-07 14:26:38|栏目:Linux|点击:

项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。

先是试了一下phpoffice/phpword这个包,发现其对doc的转换很不理想,这个包更适合用来根据内容生成文档,而不是转换文档,不是太适合我这种需求。

然后发现了LibreOffice这个开源工具,经过使用,效果很好,分享一下。

服务器是CentOS7,直接使用yum安装LibreOffice,大概需要600MB+ 的磁盘空间:

# 装之前可以先删除一下,防止之前装过
yum remove libreoffice-*
yum install libreoffice

等待安装完成后,确认一下版本啥的,虽然官方已经到6.1版本了,yum里面还是5.3.6的包,不过用起来并没有什么毛病,在这里我还是建议大家使用各自的Linux系统的包管理工具来安装,这样可以省去很多麻烦的。

[root@localhost /]# soffice --version
LibreOffice 5.3.6.1 30(Build:1)

不会用的话可以使用soffice --help看一下帮助,非常多的参数和使用案例,转换格式就很简单:

soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source

以上的命令就是将/opt/upload/source/123.doc文件转换成docx格式,输出到/opt/upload/source文件夹里。

默认情况下:

  1. 会使用源文件名+新的扩展名保存输出文件;
  2. 会覆盖outdir里已经有的同名文件;

转换成功会输出类似这样的:

convert /opt/upload/source/123.doc -> /opt/upload/source/123.docx using filter : MS Word 2007 XML
Overwriting: /opt/upload/source/123.docx

LibreOffice会根据文件格式自动匹配格式过滤器(filter),至于它支持哪些格式,可以参考一下官网。

总结

上一篇:Centos 6和Centos 7下服务启动方法及添加到开机启动项的方法

栏    目:Linux

下一篇:CentOS 7 虚拟机无法开机问题的快速解决方法

本文标题:CentOS下使用LibreOffice实现文档格式的转换方式

本文地址:http://www.codeinn.net/misctech/7971.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有