最近做了一个支持 docx,pptx,xlsx 的生成、解析、模板填充的纯 Typescript 库 - V2EX

V2EX

我用 AI 写代码，但终端管理反而成了累赘——于是我做了 codux - V2EX [调研] 各位在公司都用什么 ide 和 agent 写代码？老运维 share 一个运维平台新电脑 brew install node 之后，一个小设置可以提升对供应链投毒的防御 - V2EX GLM-Coding 调用持续报错： z.ai 的 Lite 套餐几乎无法使用，官方 Pro/Max 是否稳定？ - V2EX 上海漕河泾内推，本组有 2 个 hc，一个后端，一个前端，预算都是 20k 左右，不打卡，氛围好如果 V2EX 上有一组不永久保存聊天记录（比如只保存 7 天或者 24 小时）的聊天室，那么会开启哪些有用或者有趣的可能？ - V2EX gemini cli 貌似挂了，一直返回 403 - V2EX 第一次在自媒体上赚到钱收集了最近在使用的低价 GPT， Gemini，邮箱等 AI 会员的小店合集讨论个大实话：现在企业还在说 AI 编程提效 20%， 30%的，真的太落后，没用懂 AI。因为包括很多前沿公司，已经狂奔到提效 200%-500%的情况 [招聘][远程][币安] 前端/后端/QA/iOS/Android 至少 3 年以上经验目前有大量 HC 欢迎投递 Chatgpt Pro 用量用不完的可以开这些设置面试的时候好像遇到钓鱼了，给各位避个坑 cursor 年续费 22 号到期，自动续费是否还是老的计次套餐呢 - V2EX 被两件破事毁掉的一下午，琐碎的内耗消磨人的精力使用 Planet 存储 Codex 的会话或者重要信息 - V2EX 如果业务部门领导不要你开发功能，而是要求你教会它用 claude code 开发功能，你会怎么做？分享一个 MacOS 接绿联 CM818 USB 转 DP 转接器使用感受 - V2EX 我的 HR 朋友 10 年老 Java ，非全大专，大家帮忙看看简历开源了一个 AI 口语练习工具，音素级发音评分，完全免费可自部署 V2EX 上有哪些你觉得很有趣、印象深刻的妹纸？字节为啥不出个国内版 Vercel？有在大马的朋友吗? 问个运营商问题你们在有领导的公司大群发过的最大胆的消息是什么公司裁员，目前没有工作。想试试摆摊，做一个移动鲜啤打酒车我的硬盘 Memblaze Pblaze 5 Linux 下不识别，给 Linux 内核提交了补丁， AI 说有望被合并 - V2EX 只有我一个人觉得 codex 不好用？做了个 AI + 真人专家监督的广告投放平台 Auxora， 7 个品牌跑出 6x ROAS 如何走出至亲的离世 Claude Web 端貌似 claude-opus-4-7 偷偷上了？现在 Apple 开发者帳號應該是用哪个地区会更好？ - V2EX 用回测筛选因子的一点经验分享给女儿 vibe 了一个故事类的 app，做完发现，这类应用似乎上线难度极大？ - V2EX 手机格式化 bitget 钱包没了，里面开通的银行卡还有机会拿到吗 - V2EX [送码] TransVoice - 我的第一款 App 上架啦！实时转写+翻译+字幕，会议听课好助手！ PictureHub 高清摄影作品的画廊 Planet 的第一个使用 macOS 26 SDK 构建的 Insider 版本 20260416-1 - V2EX 成都二手房是不是在涨价，有点坐不住了 - V2EX claude 生态（skill mcp plugin）等 Studio Display XDR VESA 适配器脱落有在用印度区 applestore 的大哥嘛，请教一下礼品卡去哪里买呢 - V2EX 我好像知道京东家政爆火的原因了 - V2EX 薅了公司的 a 家 api key，用机场 ip 做代理容易被封吗如何在初期就识别 HR 在刷 KPI,没打算招你? [分享]精心打造一个 AI 编程知识库（算法/设计模式/提示词/Skills），助力程序员转型港版 iPhone 在国内支持联通 5GA 吗？在广东用想办港卡 AI 对 it 行业影响太大了我做了个把照片变成 iOS 小组件贴纸的 App ChatGPT Pro 5x 套餐量真的很足！ I have found a method to directly generate advertising video materials using scripts 在小城市开个店，给人写软件，有前途吗 chrome 最新的 147 版直接卡爆炸了 - V2EX 为什么厂家不在 skill/mcp 这类的工具中塞广告呢？这样不是可以大赚嘛？ minimax 真是脸都不要了，工作日下午 14:00 定时开启 529，脸都不要了。训练模型居然占用用户使用时间外资非核心部门 vs 另一家外资的核心部门,该跳吗? iTad 标签扩展加小动作 ? - V2EX 去年 H200 能买，不让买是代替快出来了？ - V2EX AI 赛事通 - 2026 年 4 月中国区新增 AI 竞赛和黑客松汇总 - V2EX V2EX › 登录现在安卓开发都在做啥 - V2EX 浏览器插件沉浸式翻译是不支持自定义模型了吗？ - V2EX Codex 里的 GPT5.4 也能降智？上午让它改两个问题，改了一个小时了， plus 额度用了一半了还是没改好，和前几天用的体感完全不一样。要它改的问题也不复杂。服了。目前有使用 claude code 的收到人脸认证的吗 - V2EX 分享一个自己做的 Nginx 管理工具，实时请求动态预览！（无奈市面上实在找不到好用的，自己撸了个） - V2EX claude code 崩了么？今天在反重力上用 claude 一点都不丝滑，有同样的感受吗？ opencode 消息周知插件今天 claude opus 和前两天比，质的飞跃 - V2EX 999 包月价？ - V2EX 一个版本， 50 项更新：我们几乎重做了整个播放页本地大模型多大显存够用？ GOGDNS 一款简易的私人 DNS 服务器 - V2EX API key (GLM) 怎么使用 claude code desktop ? Claude 这样订阅有问题吗 - V2EX 帮我爸找回了一篇赛博兰亭集序求推荐稳定、高性价比使用 Claude Opus 4.6 的渠道/平台搞个云端 claude code 防止封号 - V2EX 用 Claude 要实名了，内地用户怎么办？ OpenAI Plus 和 Team 都缩水了吗海外 Android 手机有什么好用的国内第三方应用市场推荐吗 - V2EX 把电脑伪装成电视，用 DLNA 投屏拿到视频号直播流地址 - V2EX claude 认证莫慌北京互联网法院有什么攻略么？起诉北京智谱华章科技股份有限公司退款可行么？ - V2EX Claude 开始引入身份验证求 vscode 做笔记软件的插件推荐 - V2EX 讯飞星辰的 Coding Plan 如何？ Anthropic 宣布在 Claude 平台推行身份验证机制科普一下低价 gpt 是怎么来的有没有长期关注 Claude 的朋友，我建了一个 Channel 自动抓取 Claude Team 的推文啃了那篇 54 页的 Agent Harness 综述, 给大伙讲个省流版现在那家的 coding plan 还能买到是不是最近会有什么更聪明的大模型要发布了呀？用多了 AI 后，有没有觉得 AI 生成的文章有很强的既视感？如何实践 Harness 工程？今日份 GPT 5.4 笑话如何建一个自己的号池，让 cursor 真正实现 token 自由写了三个月 Agent Harness，我终于敢让 Claude Code 全自动写代码了

demomacro · 2026-06-18 · via V2EX

因为日常需求，需要将 docx 存储解析为 JSON 格式方便后续处理，并且能进行简单地在线编辑、集成 AI 工具，一开始是写了 Docen 这个库，将 docx 转为了 Tiptap JSON 格式，简单写了一些解析以支持 tiptap 或者说 html 支持的样式，再通过 dolanmiu/docx 这个包进行导出，但是后期随着需要用到的功能越来越多，感觉不管是解析还是生成的方式都越发显得局限，所以另外做了这个库 Office Open。

第一阶段，我先是基于原版 docx 包进行了完善，加入了关于 Chart 、Smartart 、SDT 控件等功能，支持了绝大部分的 wml/pml/sml 元素，默认设置更贴近于 Microsoft Office/WPS Office 的标准，重写了关于 xml 的生成和解析部分，将原本的打包从 jszip 替换为了 fflate ，针对 node 环境使用了 zlib 来实现，以此支持了 docx,pptx,xlsx 的生成。

第二阶段，因为原版是基于 Class 实现的，且中间路径过长，我逐步迁移到了通过字符串拼接的方式用以提高性能，但这个过程中依然遇到了问题，因为我的根本需求是需要通过 JSON 生成和解析，大量的 Class 和 JSON 模式混杂使得维护起来越发困难

第三阶段，我全部剔除了所有 Class 的部分，完全转换为通过 JSON 来生成 docx,pptx,xlsx 文件，并且增加了大量 round-trip 的测试来保持生成和解析的一致性，目前与同类产品（ docx,pptxgenjs,hucre ）进行对比后，单独针对生成的部分进行了 Benchmark 测试，还是有比较明显的优势的。

Large Docx (~100MB) — Mixed Content

500 styled paragraphs + 38 mixed-size images (1-5MB, 100MB total) + 50x10 table.

Scenario	Default sync	Default async	All STORE sync	All STORE async	docx
Mixed (500p+38img+50x10)	9.7 ops/s	8.2 ops/s	5.1 ops/s	4.2 ops/s	0.30 ops/s

Large Pptx (~100MB) — Mixed Content

40 slides x (2 shapes + 2 mixed-size images + 3x3 table).

Scenario	Default sync	Default async	All STORE sync	All STORE async	PptxGenJS DEFLATE	PptxGenJS STORE
40 slides mixed	227 ops/s	124 ops/s	708 ops/s	721 ops/s	0.23 ops/s	0.22 ops/s

Large Xlsx — 100,000 rows × 20 columns (2M cells)

Scenario	Default sync	Default async	All STORE sync	All STORE async	hucre
100k × 20	0.87 ops/s	0.81 ops/s	1.02 ops/s	0.96 ops/s	0.39 ops/s

现在其实我觉得可能陷入了一些瓶颈，比如说让 AI 通过工具输入 JSON 生成对应的文档，因为没有实现完整的 zod 校验，导致错了的话 AI 也没法很好第一时间发现错误，即便是支持通过 MCP 查询文档也经常会遇到一些错误。

当前其实是支持类似如下 JSON 直接去生成一个完整的 docx 文件，可以通过 Office Open Website 这个网站去在线体验

{
    "sections": [
        {
            "children": [
                { "paragraph": { "children": [{ "text": "Hello, World!", "bold": true }] } }
            ]
        }
    ]
}

想征询一下大家的意见，是否应该将类型定义转化为 zod ，以便更好的类型校验，或者生成对应的 JSON Schema ，以及对于当前的类型定义方式是否有更合理的建议

因为后期我是准备在基于Office Open库的基础上实现在线编辑和预览，所以后面会逐步将 Docen 包的解析层替换为当前实现，对于这个的实现我还在尝试，是通过 Tiptap JSON 的形式还是别的什么，以及当前基于 Tiptap 的分页和渲染方案可能都需要另外考虑，我在想是否需要基于 Leaferjs 进行高性能渲染，这会影响后期的维护思路，所以希望和大家有所讨论，能够提供参考意见，感谢~

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

V2EX