📄

Request My Resume

Thank you for your interest! To receive my resume, please reach out to me through any of the following channels:

我把英文PDF翻成中文版以后,才发现AI真正省下的不是翻译费

不只是翻译,是中文资产再生产

我最近又被一个看起来很小的需求折腾了一下。

把一份英文 PDF,做成中文版。

听起来是不是很简单?

把 PDF 丢给翻译工具,导出中文,完事。

如果只是这样,那这篇文章就没什么好写的。真正麻烦的地方在于,很多英文 PDF 根本不是一堆文字,它是一整套视觉资产。里面有版式,有插图,有表格,有字体层级,有留白,有小字说明,有页码,有品牌感。

你把文字抽出来翻译了,只是翻译了“内容”。

但原来那份 PDF 真正值钱的部分,很多时候不止内容,还有它的呈现方式。

这就是我这次做英文 PDF 翻中文 Skill 时,突然想明白的一件事。

AI 时代的资料翻译,省下来的可能不只是翻译费,而是把一份英文资料重新做成中文资产的整条生产链。

前两天我把 Anthropic 的《The Founder’s Playbook: Building an AI-Native Startup》做成了原生中文 PDF。

原版只有 465K,中文版最后有 9.4M,36 页。这个大小变化其实也挺有意思。原来那份文件更像是轻量 PDF,中文版本则变成了整页图像重生成之后重新装订出来的 PDF。

说人话,就是我没有走传统的“抽文字、机器翻译、再塞回去”路线。

我走的是另一条路:先把每一页 PDF 渲染成整页图片,再让图像模型把整页重新生成成中文版本,最后把所有中文页面统一尺寸,重新装订成一个新 PDF。

注意,这里最关键的不是“翻译”两个字。

最关键的是“整页”。

很多 PDF 翻译工具的问题就在这里。它们对文字还挺友好,但对设计很粗暴。翻译完以后,经常出现几种很难受的情况:文字溢出,段落挤压,表格错位,图片和标题的关系散掉,原本很精致的一页突然变成一张临时拼贴。

这就像你请人翻译一本画册,结果他只把文字翻译给你,排版随缘。

能不能看?

能。

有没有原来的味道?

没了。

而很多报告、手册、白皮书,真正影响阅读体验的,恰恰就是那个“味道”。尤其是像 Anthropic、OpenAI、Google、a16z、Redpoint 这类机构出的资料,它们不是简单写字,它们是在用设计传递判断。

如果中文版一出来,像是从旧打印机里吐出来的临时文档,那它的传播价值其实已经打折了。

所以我这次做这个 Skill 的第一个判断是:不要把 PDF 当成文本容器,要把它当成页面作品。

页面作品就不能只翻译文字。

它要保留构图,保留层级,保留颜色,保留图表,保留页码,保留那种“这是一份认真做过的资料”的感觉。

具体流程其实不复杂,但挺考验耐心。

第一步,把 PDF 每一页渲染成高清图片。

这一步不是为了偷懒,而是为了把 PDF 里那些复杂的版式、图片、矢量元素、字体关系,先冻结成一个稳定的视觉目标。

第二步,给每一页生成翻译提示。

这里我会尽量把页面里的文字、品牌名、数字、表格、图注、页码这些东西整理出来,告诉模型哪些要翻译,哪些要保留。比如 Claude、Claude Code、MVP、Launch、Scale 这些词,不能乱翻;数字、引用、URL 也不能瞎动。

第三步,做整页图像重生成。

这一步最像“请一个懂中文的设计师,照着原稿重新排一版中文版”。它不是在原图上涂白块,也不是把中文硬贴上去,而是重新生成整页中文画面。

第四步,把生成出来的页面统一拉回原来的尺寸。

图像模型有时候会改尺寸,这很正常。问题是 PDF 最后要装订,36 页必须大小一致,页边距也要稳。所以需要做尺寸归一化。

第五步,把所有中文页面重新装订成 PDF,再做页数、尺寸、打开效果的检查。

听起来像一堆杂活。

但说实话,这些杂活才是现在很多 AI 工作流真正值钱的地方。

因为模型单点能力已经很强了,翻译也好,识图也好,生成也好,大家都能调用。真正拉开差距的,是你能不能把它变成一个稳定交付的流程。

这也是我越来越喜欢写 Skill 的原因。

Skill 不是一个 prompt。

Prompt 更像一句临时口令,今天这么喊一下,明天换个文件又要重新想一遍。Skill 更像一条可复用的工作流,把“我到底怎么做这件事”沉淀下来。

这次的 PDF 中文化 Skill 里,我把几个原则写得很死。

不要用 pdf2zh 替代整页图像生成。

不要用 Google Translate、DeepLX、Ollama 或乱七八糟的桥接服务去拼一个看起来能用的结果。

不要默认搞区域涂抹,不要在原图上贴白框,也不要把页面弄成打补丁的样子。

先做整页重生成。

如果尺寸不对,就做尺寸归一化。

如果某页文字太密,就重试整页,或者收紧提示词。

只有用户明确同意,才做局部修补。

这个边界很重要。

因为 AI 工作流最容易出问题的地方,不是它不能干活,而是它太容易“差不多就行”。

页面看起来差不多,文字大概对,版式大概还在,文件也能打开。

然后你一发出去,读者一看就知道:哦,这是机器糊出来的。

那就尴尬了。

尤其是做公众号、做资源页、做知识产品的人,其实都很怕这种东西。表面上你省了时间,实际上你把信任感损耗掉了。

这也是我现在对 AI 自动化越来越谨慎的地方。

我当然喜欢自动化。

我也确实越来越多事情交给 Codex、Claude Code、各种 agent 去跑。

但我越来越不相信那种“一键生成完美结果”的叙事。

真正能用的 AI 工作流,通常都不是一键。

它更像一条流水线:前面有准备,中间有模型能力,后面有校验和装订。每一步都不神秘,但每一步都要有边界。

PDF 翻译就是个很好的例子。

如果你只把它理解成翻译,那它很小。

如果你把它理解成英文资料的中文资产再生产,那它就变大了。

很多英文世界的好资料,中文读者不是看不懂,而是不愿意费劲看。不是每个人都有时间打开英文 PDF,一页一页啃。尤其是创业手册、技术白皮书、行业报告这种东西,它们本来就很密。

这个时候,如果有人能把它做成保留原视觉体验的中文版,就不是简单搬运。

它更像是在降低一群人的理解门槛。

当然,这里面也有边界。

不是所有 PDF 都值得这么做。

一份纯文字资料,直接翻译成 Markdown 可能更干净。

一份版权敏感、商业付费、不能公开再分发的资料,也不能随便拿来重制。

一份扫描质量很差、页内文字极密、图表非常复杂的文件,重生成成本也会明显上升。

所以这个 Skill 真正适合的,是那些本身公开、值得精读、视觉表达也有价值的英文 PDF。

比如官方手册、公开报告、研究白皮书、创业指南、产品方法论。

这类资料一旦被做成高质量中文版本,就不只是“我看懂了”。

它还可以变成公众号文章的证据图,变成网站资源页的下载资料,变成私域社群里的学习材料,甚至变成后续课程、视频、演讲和知识库的底层素材。

这才是我觉得有意思的地方。

AI 不是只帮你省半小时翻译时间。

它是在帮你把原来需要翻译、排版、设计、校对、导出、上传的一整条链路,压缩成一个可以反复调用的工作流。

但前提是,你不能只迷信模型。

你得把流程写清楚,把禁止事项写清楚,把质量门槛写清楚,把产物路径写清楚。

否则 AI 越强,交付越像玄学。

今天跑出来像样,明天换个 PDF 就翻车。今天页面还行,明天表格乱掉。今天中文挺顺,明天品牌名翻得面目全非。

这不是模型不行。

这是工作流没被驯服。

我现在越来越觉得,未来很多人的竞争力,不在于“会不会用 AI”,而在于能不能把自己反复做的事情,沉淀成一套靠谱的 Skill。

能复用,能审计,能交付,能让下次少踩坑。

这比临时写一个神奇 prompt,值钱多了。

所以如果你问我,英文 PDF 翻中文这个 Skill 到底解决了什么问题。

我的答案不是“解决翻译问题”。

它解决的是一类更现实的问题:我们怎么把英文世界里真正有价值的资料,变成中文世界里能阅读、能传播、能沉淀的资产。

如果你也想直接试试这套工作流,我把这个 Skill 的下载资源放在这里:PDF 中文图像翻译 Skill

这件事听起来不性感。

但对做内容、做产品、做出海、做知识服务的人来说,挺值钱的。

至少对我来说,它已经不是一个小工具了。

它更像是一个提醒:AI 时代真正值得沉淀的,不是单次产物,而是你把产物做出来的那套方法。

有了方法,才有复利。

没有方法,就只是在一次次撞运气。

今日又是久违的工具复盘。

有所保留地讲到这里。

TuneFab 音乐转换广告图

TuneFab 音乐下载转换器

可将 Spotify、Apple Music、YouTube Music、Amazon Music、Deezer、Pandora、SoundCloud 与 Audible 转成 MP3、WAV 或 FLAC。

  • 覆盖主流流媒体音乐平台与 Audible 有声书。
  • 保留原始音质,并支持 MP3、WAV、FLAC 导出。
  • 适合离线收听、素材整理和统一桌面工作流。
查看 TuneFab

包含联盟推广链接,将在新标签页打开。

Mr. Guo Logo

© 2026 Mr'Guo

Twitter Github WeChat