📄

Request My Resume

Thank you for your interest! To receive my resume, please reach out to me through any of the following channels:

← 返回资源中心
AI & 开发 随意打赏 📎 ZIP · 16KB

PDF 中文视觉翻译 Skill | 整页 Imagegen 工作流下载

一个面向 Codex 的开源 Skill,用整页栅格流程把英文 PDF 转成中文视觉版 PDF:先渲染页面图片,再用 imagegen 整页生成中文页图,最后尺寸矫正并装订成 PDF。

☕ 随意打赏下载

ZIP · 16KB

工具简介

这是一个为 Codex 准备的开源 Skill,用来把英文 PDF 制作成中文视觉版 PDF。它不是传统的“抽取文字后重新排版”,也不是在原图上涂抹覆盖文字,而是采用整页栅格流程:先把 PDF 渲染成逐页图片,再让 imagegen 以整页图片为目标生成中文页面,最后把生成图统一回原始页面尺寸并装订成 PDF。

这个工作流适合保留报告、指南、白皮书、工具手册等 PDF 的原始视觉感,包括封面、插图、表格、颜色、页眉页脚和整体版式。

核心能力

整页 Imagegen 中文化

  • 以渲染后的整页图片作为 imagegen 编辑目标
  • 让中文自然融入原始版式,而不是用色块覆盖局部文字
  • 尽量保留原始图片、图表、页码、Logo 和视觉层级

尺寸矫正与 PDF 装订

  • 内置页面清单 manifest.json
  • 自动把 imagegen 输出图统一回原始渲染尺寸
  • 将多张中文页图合并成一个完整 PDF
  • 提供页数与尺寸审计脚本

明确的工具边界

这个 Skill 明确避免默认调用 pdf2zh、Gemini、DeepLX、Ollama、Google Translate 等外部翻译管线。OCR 或译文支撑优先由 Codex/ChatGPT 的多模态能力完成;如果页面很多,可以让 Codex 子代理分摊看图和译文 brief,但最终页面仍然由整页 imagegen 生成。

包含内容

ZIP 文件中主要包含:

  • SKILL.md:完整工作流说明与边界规则
  • scripts/prepare_pdf_pages.py:PDF 页面渲染、文本提取和 prompt 准备
  • scripts/normalize_page_images.py:把 imagegen 输出图矫正回原始页面尺寸
  • scripts/merge_page_images_to_pdf.py:将中文页图装订成 PDF
  • scripts/audit_translation_package.py:检查页数、尺寸和 PDF 输出
  • scripts/render_pdf_pages_macos.swift:macOS PDFKit 渲染备用脚本
  • agents/openai.yaml:Codex Skill 元信息

适用场景

  • 英文 PDF 报告中文化
  • AI 工具指南、白皮书、行业研究资料翻译
  • 需要保留原 PDF 视觉风格的中文交付物
  • 为 Codex 建立可复用的 PDF 翻译自动化流程

使用建议

这个 Skill 更适合“视觉版中文 PDF”,而不是可复制文字的原生 PDF。如果你更在意文字可检索和可复制,可以把它作为视觉交付版本,再单独保留原始英文 PDF 或 Markdown 译稿。

由于最终页面由 imagegen 生成,建议正式交付前抽查标题、表格、数字、专有名词和页码,尤其是长表格和密集小字页面。

TuneFab 音乐转换广告图

TuneFab 音乐下载转换器

可将 Spotify、Apple Music、YouTube Music、Amazon Music、Deezer、Pandora、SoundCloud 与 Audible 转成 MP3、WAV 或 FLAC。

  • 覆盖主流流媒体音乐平台与 Audible 有声书。
  • 保留原始音质,并支持 MP3、WAV、FLAC 导出。
  • 适合离线收听、素材整理和统一桌面工作流。
查看 TuneFab

包含联盟推广链接,将在新标签页打开。

☕ 觉得有帮助?

Mr. Guo Logo

© 2026 Mr'Guo

Twitter Github WeChat