PDF 中文视觉翻译 Skill | 整页 Imagegen 工作流下载

工具简介

这是一个为 Codex 准备的开源 Skill，用来把英文 PDF 制作成中文视觉版 PDF。它不是传统的“抽取文字后重新排版”，也不是在原图上涂抹覆盖文字，而是采用整页栅格流程：先把 PDF 渲染成逐页图片，再让 imagegen 以整页图片为目标生成中文页面，最后把生成图统一回原始页面尺寸并装订成 PDF。

这个工作流适合保留报告、指南、白皮书、工具手册等 PDF 的原始视觉感，包括封面、插图、表格、颜色、页眉页脚和整体版式。

核心能力

整页 Imagegen 中文化

以渲染后的整页图片作为 imagegen 编辑目标
让中文自然融入原始版式，而不是用色块覆盖局部文字
尽量保留原始图片、图表、页码、Logo 和视觉层级

尺寸矫正与 PDF 装订

内置页面清单 manifest.json
自动把 imagegen 输出图统一回原始渲染尺寸
将多张中文页图合并成一个完整 PDF
提供页数与尺寸审计脚本

明确的工具边界

这个 Skill 明确避免默认调用 pdf2zh、Gemini、DeepLX、Ollama、Google Translate 等外部翻译管线。OCR 或译文支撑优先由 Codex/ChatGPT 的多模态能力完成；如果页面很多，可以让 Codex 子代理分摊看图和译文 brief，但最终页面仍然由整页 imagegen 生成。

包含内容

ZIP 文件中主要包含：

SKILL.md：完整工作流说明与边界规则
scripts/prepare_pdf_pages.py：PDF 页面渲染、文本提取和 prompt 准备
scripts/normalize_page_images.py：把 imagegen 输出图矫正回原始页面尺寸
scripts/merge_page_images_to_pdf.py：将中文页图装订成 PDF
scripts/audit_translation_package.py：检查页数、尺寸和 PDF 输出
scripts/render_pdf_pages_macos.swift：macOS PDFKit 渲染备用脚本
agents/openai.yaml：Codex Skill 元信息

适用场景

英文 PDF 报告中文化
AI 工具指南、白皮书、行业研究资料翻译
需要保留原 PDF 视觉风格的中文交付物
为 Codex 建立可复用的 PDF 翻译自动化流程

使用建议

这个 Skill 更适合“视觉版中文 PDF”，而不是可复制文字的原生 PDF。如果你更在意文字可检索和可复制，可以把它作为视觉交付版本，再单独保留原始英文 PDF 或 Markdown 译稿。

由于最终页面由 imagegen 生成，建议正式交付前抽查标题、表格、数字、专有名词和页码，尤其是长表格和密集小字页面。