formula2X 公式识别系统

项目介绍

随着学术论文的数字化和在线共享的增加，数学公式作为学术内容的重要组成部分，其规范化复制和引用成为了一个重要问题。传统的图片、PDF等格式公式难以直接编辑和引用，这大大增加了研究工作的难度。基于对这一点的体会，我们设计了formula2X公式识别系统，旨在提供一个从数学公式图片到可编辑文本格式的自动化转换工具。项目采用Django框架，基于深度学习模型，实现了Web端的公式识别。用户可将包含公式的图片上传至Web端，formula2X可实现图片中公式的识别，并将识别结果分别以Markdown、LaTeX等格式可复制呈现。

项目结构

test.py：测试模型的最小程序
testforweb.py：查看Django安装情况的测试脚本
backend：项目主体
BackEnd\BackEnd：核心配置文件
BackEnd\BackEnd\urls.py：根路由配置
BackEnd\BackEnd\settings.py：项目设置（模板路径、语言、时区、内网访问权限等）
BackEnd\BackEnd\views.py：核心业务逻辑函数
BackEnd\processSection文件夹：初始版本核心功能模块
依赖根路由配置：path('processSection/', include('processSection.urls'))
BackEnd\templates：前端代码

BackEnd\static文件夹：CSS等静态资源

BackEnd\templates\main.html：首页及文件上传接口
BackEnd\templates\resDisplay.html：识别结果展示页
BackEnd\uploadedFile文件夹：用户上传图片存储目录
db.sqlite3：项目自带数据库

如何使用

以下操作推荐在项目工作空间(.venv)中进行：

基础使用

安装依赖 pip install -r requirements.txt
启动服务
cd Backend
python manage.py runserver 0.0.0.0:8000
o 本机访问：http://127.0.0.1:8000/
o 局域网访问：<服务器IP地址>:8000
注意事项
o 首次运行时需等待模型权重文件自动下载（命令行显示进度条）
o 虚拟环境部署需先激活环境再启动服务
o 关闭服务：在Backend目录下按 Ctrl+C

模型训练

环境准备

安装训练依赖

pip install "pix2tex[train]"

数据准备

生成数据集 python -m pix2tex.dataset.dataset --equations <数学公式文本路径> --images <训练集图片文件夹路径> --out <输出文件名.pkl>
o 预生成数据集：Google Drive下载（含formulae.zip图片和math.txt标签）
o 验证集/测试集需重复此步骤

配置训练

修改配置文件

o 编辑 pix2tex/model/settings/config.yaml
o 关键配置项：
data: <训练集.pkl路径> # 如 dataset_train.pkl
valdata: <验证集.pkl路径> # 如 dataset_val.pkl
tokenizer: <分词器路径> # 默认 tokenizer.json
num_tokens: <词汇表大小> # 需与分词器一致

启动训练

python -m pix2tex.train --config <配置文件路径>
推荐调整参数：
• batch_size
• learning_rate
• warmup_steps
• max_epochs
自定义分词器（可选）
python -m pix2tex.dataset.dataset --equations <数学公式文本路径> --vocab-size <词汇表大小> # 推荐 8000</br> --out <输出分词器.json> # 如 custom_tokenizer.json
完成后需同步更新配置文件中的 tokenizer 路径和 num_tokens 值。

注意事项

定期检查数据加载逻辑
建议使用GPU环境（显存消耗较大）
参考官方Colab Notebook进行云端训练

训练结束后模型文件的保存与替换

模型文件的保存

在模型训练完成后，模型文件将以 .pth 格式保存，文件命名格式如下：
{name}_e{epoch}_step{step}.pth
其中：
{name} 为模型的名称，来自于 config.yaml 配置中的 args.name
{epoch} 为当前训练的轮次（e+1）
{step} 为当前训练步骤编号（i）
模型默认保存在：
out_path = os.path.join(args.model_path, args.name)
此外，训练时的配置文件也会自动保存：
config.yaml
该文件包含所有训练参数，便于后续加载或复现训练过程。

如何替换预训练模型

训练完成后，您需要手动替换 formula2X 识别系统中的模型文件：
找到最新的模型文件
ls <模型保存目录>
例如：
formula2X_e10_step500.pth
将训练好的模型文件复制到 Web 端目录
cp <新模型路径> <Web 端模型存储路径>
例如：
cp formula2X_e10_step500.pth backend/model.pth
修改 Web 端代码以加载新模型
在 settings.py 或 views.py 中修改模型加载路径：
MODEL_PATH = "backend/model.pth"
重启 Web 服务
cd Backend
python manage.py runserver 0.0.0.0:8000

版本说明

V 0.0.1 Beta | 2025年1月27日
完成开源全部流程

V 1.0.0 Beta | 2025年10月31日

重构前端布局逻辑重新面世

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
BackEnd		BackEnd
example		example
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
test.py		test.py
testforweb.py		testforweb.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

formula2X 公式识别系统

项目介绍

项目结构

如何使用

基础使用

模型训练

环境准备

安装训练依赖

数据准备

配置训练

修改配置文件

启动训练

注意事项

训练结束后模型文件的保存与替换

模型文件的保存

如何替换预训练模型

版本说明

版权说明

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

formula2X 公式识别系统

项目介绍

项目结构

如何使用

基础使用

模型训练

环境准备

安装训练依赖

数据准备

配置训练

修改配置文件

启动训练

注意事项

训练结束后模型文件的保存与替换

模型文件的保存

如何替换预训练模型

版本说明

版权说明

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages