本文详细介绍如何使用 TransGPTex 工具,将英文 LaTeX 论文翻译成中文并生成 PDF,保留原有格式、公式、图表和引用。适合需要翻译学术论文的科研工作者。
在学术研究中,我们经常需要阅读大量英文文献。虽然英文是学术界的通用语言,但对于中文读者来说,能够快速获取中文版本有助于:
提高阅读效率:降低语言障碍,快速把握核心内容学术交流:便于与团队成员分享和讨论知识传播:将前沿研究成果以中文形式传播传统的翻译方法存在诸多问题:
人工翻译成本高、周期长普通机器翻译无法处理 LaTeX 格式复制粘贴到翻译工具后,公式、图表、引用格式全部丢失TransGPTex 是一款专门针对 LaTeX 学术论文的翻译工具,它能够:
✅ 保留完整的 LaTeX 格式(公式、表格、图表、引用)✅ 利用大语言模型(LLM)进行高质量翻译✅ 支持多种 LLM(DeepSeek、OpenAI GPT、智谱 GLM 等)✅ 自动编译生成中文 PDF本文将以一篇航天领域的英文论文为例,手把手教你完成翻译。
本教程基于 Windows 11 + PowerShell 7 环境,其他系统可参考调整。
PowerShell 7 是跨平台的新版 PowerShell,比 Windows 自带的 PowerShell 5.1 功能更强大。
Win 键打开开始菜单搜索"PowerShell 7"或"pwsh"点击"PowerShell 7 (x64)"
Win + R 打开运行框输入
pwsh按回车
pwsh按回车(PowerShell 会在当前目录打开)
Windows 11 通常预装 PowerShell 7。如果未安装,可通过以下方式安装:
# 方法一:使用 winget(Windows 11 自带)
winget install --id Microsoft.PowerShell -e
# 方法二:从 Microsoft Store 安装
# 搜索"PowerShell"并安装
验证 PowerShell 7:
# 查看版本(应显示 7.x.x)
$PSVersionTable.PSVersion
输出示例:
Major Minor Patch PreReleaseLabel BuildLabel
----- ----- ----- --------------- ----------
7 4 1
注意:如果只有 PowerShell 5.1(Windows 自带),本教程的命令仍可用,但推荐升级到 PowerShell 7 以获得更好体验。
TransGPTex 基于 Python 开发,需要 Python 3.7 或更高版本。
# 检查 Python 版本
python --version
如果未安装,访问 Python 官网 下载安装,或使用包管理器:
# Windows 使用 winget 安装
winget install Python.Python.3.11
# 验证安装
python --version
XeLaTeX 用于编译含中文的 LaTeX 文档。Windows 推荐安装 TeX Live 或 MiKTeX。
访问 TeX Live 官网 下载完整安装包,安装后包含 XeLaTeX。
访问 MiKTeX 官网 下载安装程序,安装时选择"完整安装"。
# 检查 xelatex 是否可用
xelatex --version
输出类似:
XeTeX 3.141592653-2.6-0.999997 (TeX Live 2025)
# 安装 TransGPTex
pip install transgptex
# 国内用户推荐使用镜像加速
pip install transgptex -i https://pypi.tuna.tsinghua.edu.cn/simple
# 查看 TransGPTex 版本和帮助
tgtex --version
tgtex -h
输出示例:
usage: tgtex [-h] [--version] [-o O] [--single_tex] [--own_tex_project]
[-llm_model LLM_MODEL] [-end_point END_POINT] ...
TransGPTex 需要调用大语言模型(LLM)进行翻译。目前支持的主流模型包括:
| 模型 | 提供商 | 输入价格(元/1M tokens) | 输出价格(元/1M tokens) | 官网 |
|---|---|---|---|---|
| DeepSeek-V3 | DeepSeek | 2 | 8 | https://platform.deepseek.com |
| GPT-4o-mini | OpenAI | 1.05 | 4.2 | https://platform.openai.com |
| GLM-4-Air | 智谱 AI | 0.5 | 0.5 | https://open.bigmodel.cn |
| Doubao-1.5-pro | 字节跳动 | 0.8 | 2 | https://console.volcengine.com |
本教程以 DeepSeek 为例(性价比高,推理速度快)。
sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx)
⚠️ 安全提示:API Key 只显示一次,务必妥善保存;切勿公开分享。
在 PowerShell 中设置环境变量:
# 临时设置(当前终端有效)
$env:LLM_API_KEY = "sk-你的API密钥"
# 永久设置(重启终端后生效)
setx LLM_API_KEY "sk-你的API密钥"
验证配置:
# 查看密钥长度(不显示明文)
$env:LLM_API_KEY.Length
输出应为 36(DeepSeek 密钥长度)。
假设你的英文论文文件为
main.tex,位于
D:paper 目录:
D:paper
├── main.tex # 主文件
├── figure # 图片目录
│ ├── fig1.png
│ └── fig2.pdf
└── elsarticle.cls # 文档类(如有)
进入论文目录并执行翻译:
# 切换到论文目录
cd D:paper
# 翻译单个 .tex 文件
tgtex --single_tex -o .main_zh.tex .main.tex -llm_model deepseek-chat -end_point https://api.deepseek.com/v1
参数说明:
--single_tex:单文件翻译模式
-o .main_zh.tex:输出文件路径
.main.tex:输入的英文论文
-llm_model deepseek-chat:使用 DeepSeek 模型
-end_point https://api.deepseek.com/v1:API 端点
执行后会显示翻译进度:
正在翻译 main.tex ...
开始请求API进行翻译,总请求数:35
请求API中... 进度:5 / 35
请求API中... 进度:10 / 35
...
请求API中... 进度:35 / 35
请求完成,开始执行后续操作...
main.tex 翻译完成!
翻译完成后,会在当前目录生成
main_zh.tex/ 文件夹,内含翻译后的
main.tex。
如果论文包含多个
.tex 文件(通过
input 或
include 引用),使用项目模式:
tgtex --own_tex_project -o . ranslated_output . `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1
参数说明:
--own_tex_project:项目翻译模式
.:当前目录作为项目根目录
思维链(Chain-of-Thought)模式让 LLM 先"思考"再翻译,可能提升翻译质量,但会增加 token 消耗:
tgtex --single_tex --use_cot -o .main_zh.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1
翻译后的 LaTeX 文件会引用原论文的图片,需要确保图片路径正确。最简单的方法是将
figure 目录复制到翻译输出目录:
# 复制图片目录到翻译输出文件夹
Copy-Item -Path ".figure" -Destination ".main_zh.tex" -Recurse -Force
进入翻译输出目录并编译:
# 进入翻译后的目录
cd .main_zh.tex
# 使用 xelatex 编译(需执行两次以生成正确的目录和引用)
xelatex main.tex
xelatex main.tex
为什么要编译两次?
第一次:生成
.aux 辅助文件,处理引用和交叉引用第二次:根据
.aux 文件更新目录、图表索引和引用编号
编译成功后,会在当前目录生成
main.pdf。用 PDF 阅读器打开检查:
错误信息:
openai.AuthenticationError: Error code: 401 -
{'error': {'message': 'Authentication Fails, Your api key: ****fb3" is invalid'}}
原因:
API Key 错误或已失效环境变量设置时混入了多余字符(引号、空格、换行)解决方法:
# 清除旧变量
Remove-Item Env:LLM_API_KEY -ErrorAction SilentlyContinue
[Environment]::SetEnvironmentVariable('LLM_API_KEY', $null, 'User')
# 重新设置(确保无多余字符)
$env:LLM_API_KEY = "sk-你的新密钥"
# 验证
$env:LLM_API_KEY.Length
[int][char]($env:LLM_API_KEY[-1]) # 末尾字符不应为 34(") 或 32(空格)
tgtex 命令错误信息:
tgtex : 无法将"tgtex"项识别为 cmdlet、函数、脚本文件或可运行程序的名称。
原因:
Python Scripts 目录未加入 PATH解决方法:
# 找到 Python Scripts 路径(通常在用户目录)
# 例如:C:Users你的用户名AppDataRoamingPythonPython311Scripts
# 临时添加到 PATH
$env:PATH += ";C:Users你的用户名AppDataRoamingPythonPython311Scripts"
# 或重新安装时使用 --user 参数
pip install --user transgptex
# 重启终端后再试
Undefined control sequence错误信息:
! Undefined control sequence.
<*> .main_zh.tex
原因:
翻译后的 LaTeX 代码中存在未定义的命令使用了错误的编译器(
latex 或
pdflatex 而非
xelatex)
解决方法:
确保使用 xelatex 编译(支持中文):
xelatex main.tex # 而非 latex 或 pdflatex
检查翻译后的
.tex 文件,确保导言区包含中文支持:
usepackage{xeCJK}
setCJKmainfont{SimSun} % 或其他中文字体
错误信息:
! Unable to load picture or PDF file 'figure2.png'.
原因:
图片路径相对于翻译输出目录不正确解决方法:
# 将图片目录复制到翻译输出目录
Copy-Item -Path "..figure" -Destination ".main_zh.tex" -Recurse -Force
或修改翻译后
.tex 文件中的
graphicspath:
graphicspath{{../figure/}} % 指向上层目录的 figure
原因:
系统缺少中文字体未正确指定中文字体解决方法:
在翻译后的
.tex 文件导言区添加:
usepackage{xeCJK}
setCJKmainfont{SimSun} % Windows 宋体
% 或使用其他字体:
% setCJKmainfont{Microsoft YaHei} % 微软雅黑
% setCJKmainfont{Noto Serif CJK SC} % 思源宋体(需安装)
问题:
不希望参考文献被翻译解决方法:
从原始
main.tex 中复制
egin{thebibliography}...end{thebibliography} 块,替换翻译后文件中的对应部分:
# 手动编辑 main_zh.tex/main.tex
# 找到参考文献部分,用原始英文版本替换
默认翻译为中文,也可翻译为其他语言:
tgtex --single_tex -o .main_jp.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1 `
--language_to Japanese
修改系统提示词以控制翻译风格:
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1 `
--system_prompt "你是一位航天领域的专业翻译,请将以下学术论文翻译成中文,保持专业术语的准确性"
加快翻译速度(前提:你的 API 有足够配额):
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1 `
-num_concurrent 50 # 默认 100
跳过自动编译步骤(手动控制编译过程):
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1 `
--no_compile
$env:LLM_API_KEY = "sk-你的OpenAI密钥"
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model gpt-4o-mini `
-end_point https://api.openai.com/v1
$env:LLM_API_KEY = "你的智谱密钥"
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model glm-4-air `
-end_point https://open.bigmodel.cn/api/paas/v4
TransGPTex 支持直接从 arXiv 下载并翻译论文:
# 翻译 arXiv 上的论文(以 "Attention Is All You Need" 为例)
tgtex https://arxiv.org/abs/1706.03762 -o .attention_paper `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1
本文详细介绍了使用 TransGPTex 翻译 LaTeX 英文论文的完整流程:
pip install transgptex配置 API:获取 LLM 密钥并设置环境变量执行翻译:使用
tgtex 命令翻译 LaTeX 文件编译 PDF:使用
xelatex 生成中文 PDF
✅ 格式完整保留:公式、表格、图表、引用全部保持原样
✅ 翻译质量高:基于 LLM 的翻译准确度远超传统机器翻译
✅ 成本低:一篇论文翻译成本通常不到 1 元(使用 DeepSeek)
✅ 速度快:几分钟即可完成整篇论文翻译
✅ 易于操作:几条命令即可完成,无需复杂配置
⚠️ 翻译仅供学习参考,不建议用于正式发表
⚠️ 保护 API 密钥,切勿公开分享
⚠️ 尊重版权,翻译后的内容仅供个人学习使用
# 1. 安装 TransGPTex
pip install transgptex -i https://pypi.tuna.tsinghua.edu.cn/simple
# 2. 配置 API Key
$env:LLM_API_KEY = "sk-你的密钥"
# 3. 翻译单个文件
cd D:paper
tgtex --single_tex -o .main_zh.tex .main.tex `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1
# 4. 复制图片资源
Copy-Item -Path ".figure" -Destination ".main_zh.tex" -Recurse -Force
# 5. 编译 PDF
cd .main_zh.tex
xelatex main.tex
xelatex main.tex
# 6. 翻译 arXiv 论文
tgtex https://arxiv.org/abs/论文ID -o .output `
-llm_model deepseek-chat `
-end_point https://api.deepseek.com/v1
作者注:本教程基于真实项目实践编写,所有命令均已验证可用(Windows 11 + PowerShell 7 + TeX Live 2025 环境)。如遇问题欢迎留言讨论!
更新日期:2025年1月
关键词:TransGPTex, LaTeX翻译, 论文翻译, DeepSeek, XeLaTeX, 学术工具
如果本文对你有帮助,欢迎点赞👍、收藏⭐、评论💬!