PDF 中文视觉翻译 Skill | 整页 Imagegen 工作流下载
一个面向 Codex 的开源 Skill,用整页栅格流程把英文 PDF 转成中文视觉版 PDF:先渲染页面图片,再用 imagegen 整页生成中文页图,最后尺寸矫正并装订成 PDF。
☕ 随意打赏下载
ZIP · 16KB
工具简介
这是一个为 Codex 准备的开源 Skill,用来把英文 PDF 制作成中文视觉版 PDF。它不是传统的“抽取文字后重新排版”,也不是在原图上涂抹覆盖文字,而是采用整页栅格流程:先把 PDF 渲染成逐页图片,再让 imagegen 以整页图片为目标生成中文页面,最后把生成图统一回原始页面尺寸并装订成 PDF。
这个工作流适合保留报告、指南、白皮书、工具手册等 PDF 的原始视觉感,包括封面、插图、表格、颜色、页眉页脚和整体版式。
核心能力
整页 Imagegen 中文化
- 以渲染后的整页图片作为 imagegen 编辑目标
- 让中文自然融入原始版式,而不是用色块覆盖局部文字
- 尽量保留原始图片、图表、页码、Logo 和视觉层级
尺寸矫正与 PDF 装订
- 内置页面清单
manifest.json - 自动把 imagegen 输出图统一回原始渲染尺寸
- 将多张中文页图合并成一个完整 PDF
- 提供页数与尺寸审计脚本
明确的工具边界
这个 Skill 明确避免默认调用 pdf2zh、Gemini、DeepLX、Ollama、Google Translate 等外部翻译管线。OCR 或译文支撑优先由 Codex/ChatGPT 的多模态能力完成;如果页面很多,可以让 Codex 子代理分摊看图和译文 brief,但最终页面仍然由整页 imagegen 生成。
包含内容
ZIP 文件中主要包含:
SKILL.md:完整工作流说明与边界规则scripts/prepare_pdf_pages.py:PDF 页面渲染、文本提取和 prompt 准备scripts/normalize_page_images.py:把 imagegen 输出图矫正回原始页面尺寸scripts/merge_page_images_to_pdf.py:将中文页图装订成 PDFscripts/audit_translation_package.py:检查页数、尺寸和 PDF 输出scripts/render_pdf_pages_macos.swift:macOS PDFKit 渲染备用脚本agents/openai.yaml:Codex Skill 元信息
适用场景
- 英文 PDF 报告中文化
- AI 工具指南、白皮书、行业研究资料翻译
- 需要保留原 PDF 视觉风格的中文交付物
- 为 Codex 建立可复用的 PDF 翻译自动化流程
使用建议
这个 Skill 更适合“视觉版中文 PDF”,而不是可复制文字的原生 PDF。如果你更在意文字可检索和可复制,可以把它作为视觉交付版本,再单独保留原始英文 PDF 或 Markdown 译稿。
由于最终页面由 imagegen 生成,建议正式交付前抽查标题、表格、数字、专有名词和页码,尤其是长表格和密集小字页面。
☕ 觉得有帮助?