惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

V
Visual Studio Blog
C
Cisco Blogs
Help Net Security
Help Net Security
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Scott Helme
Scott Helme
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
M
MIT News - Artificial intelligence
L
LINUX DO - 热门话题
I
InfoQ
GbyAI
GbyAI
NISL@THU
NISL@THU
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Engineering at Meta
Engineering at Meta
H
Hackread – Cybersecurity News, Data Breaches, AI and More
TaoSecurity Blog
TaoSecurity Blog
Simon Willison's Weblog
Simon Willison's Weblog
A
About on SuperTechFans
Spread Privacy
Spread Privacy
月光博客
月光博客
W
WeLiveSecurity
AWS News Blog
AWS News Blog
云风的 BLOG
云风的 BLOG
有赞技术团队
有赞技术团队
Security Latest
Security Latest
人人都是产品经理
人人都是产品经理
PCI Perspectives
PCI Perspectives
Recent Commits to openclaw:main
Recent Commits to openclaw:main
Microsoft Azure Blog
Microsoft Azure Blog
Hugging Face - Blog
Hugging Face - Blog
S
SegmentFault 最新的问题
T
Troy Hunt's Blog
Martin Fowler
Martin Fowler
The Hacker News
The Hacker News
T
Tor Project blog
C
CERT Recently Published Vulnerability Notes
Apple Machine Learning Research
Apple Machine Learning Research
Stack Overflow Blog
Stack Overflow Blog
K
Kaspersky official blog
Cloudbric
Cloudbric
H
Help Net Security
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tailwind CSS Blog
D
DataBreaches.Net
Security Archives - TechRepublic
Security Archives - TechRepublic
T
Tenable Blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
博客园 - Franky
L
LINUX DO - 最新话题
MyScale Blog
MyScale Blog

沈唁志

使用 Trusted Publishing 提升 npm 包发布安全性 2025|在代码之外,我学会了旅行、牵手和拥抱 使用 GitHub Actions 自动同步 Docker 镜像到 CNB 怎么申请开具中国税收居民身份证明? HMAC 签名编码的坑:Go 和 PHP 的不同处理方式 Bitwarden Secrets Manager:简化 DevOps 的机密管理 MySQL 字符集与大小写敏感性解析 在命令行中输出带颜色的日志 PHP 中生成带毫秒的时间戳
Linux 服务器实现 Word 转图片方案
沈唁 · 2026-03-12 · via 沈唁志

在很多业务系统中,经常需要对 Word 文档进行在线预览或生成图片。

常见场景包括:

  • 电子函件或通知预览
  • 审批系统附件展示
  • OCR 识别前的文档预处理
  • IM / 消息系统模板截图
  • 文档归档与审计

Word 文档 (.docx) 本身不适合直接渲染为图片,因此通常采用如下转换链路:

DOCX → PDF → PNG

原因:

  • DOCX → PDF:排版最稳定
  • PDF → PNG:渲染简单,兼容性好

本文记录一次完整的服务器环境搭建过程,使用:

  • CentOS/PHP
  • phpword:负责处理 Word 模板中的变量替换
  • LibreOffice:负责 Word 转 PDF
  • ImageMagick:负责 PDF 转 PNG

完整转换流程如下:

PHP (phpword)
  ↓
DOCX
  ↓
LibreOffice (soffice)
  ↓
PDF
  ↓
ImageMagick (convert)
  ↓
PNG

LibreOffice

首先在服务器安装 LibreOffice:

sudo yum install libreoffice

安装完成后可以使用 soffice进行文档转换。

测试是否安装成功:

soffice --version

接下来就可以开始 DOCX 转 PDF 了,使用命令:

# 单文件转换
soffice --headless \
--convert-to pdf \
/tmp/upload_data/letter.docx \
--outdir /tmp/upload_data

执行后会在/tmp/upload_data目录下生成letter.pdf

如果目录中有大量 Word 文件,也可以批量转换:

soffice --headless \
--convert-to pdf \
/tmp/upload_data/1/*.docx \
--outdir /tmp/upload_data/1

执行后会在/tmp/upload_data/1/目录下生成和 docx 文件同名的 pdf 文件。

但是这个时候查看生成好的 PDF 文件,会发现字体和 Word 有区别,在 Linux 服务器上转换 Word 时,经常会遇到:

  • 字体被替换
  • 排版错位
  • 中文显示异常

原因是服务器没有 Windows 上对应的字体。解决方法就是从 Windows 复制字体,放到服务器上。

字体目录:

C:\Windows\Fonts

常用中文字体:

字体 文件
宋体 simsun.ttc
黑体 simhei.ttf
微软雅黑 msyh.ttc
仿宋 simfang.ttf
楷体 simkai.ttf

将这些字体打包为fonts.zip后上传服务器,上传到服务器后执行:

unzip fonts.zip -d /usr/share/fonts/chinese

刷新字体缓存:

fc-cache -fv

查看字体:

fc-list | grep simsun

如果看到输出,说明字体安装成功。

ImageMagick

转为 PDF 以后,就可以使用 ImageMagick 将 PDF 渲染为图片。

安装:

yum install -y ImageMagick ImageMagick-devel

检查版本:

convert -version

基本转换命令:

convert -density 300 letter.pdf letter.png

参数说明:

参数 说明
-density 300 设置 PDF 渲染 DPI
letter.pdf 输入文件
letter.png 输出文件

默认情况下,每页 PDF 都会生成一张图片,多页 PDF 时就会生成letter-0.pngletter-1.png...

如果需要拼接多页为一张图片,生成一张长图:

convert -density 300 letter.pdf -append letter.png

-append表示纵向拼接,+append表示横向拼接。

同时可以加上-background white -alpha remove,防止透明背景。

完整示例命令:

soffice --headless --convert-to pdf letter.docx
convert -density 300 letter.pdf -background white -alpha remove -append letter.png

通过 LibreOffice 与 ImageMagick,可以在 Linux 服务器上实现稳定的文档转换流程。