Mistral OCR 文档处理工具

这个项目使用 mistral-ocr-latest 模型处理 PDF 与图片（当前对应 Mistral OCR 4），提取文本与图像并保存为 Markdown。

功能特点

🚀 使用 mistral-ocr-latest 模型（当前对应 Mistral OCR 4）
📄 支持 PDF 与图片输入（PNG、JPG、WebP、GIF、BMP、TIFF）
🖼️ 提取并保存文档中的图像
📝 生成以原文件名命名的 Markdown 文件
🌏 支持中文等多种语言
🌐 Web UI 支持：
- 实时进度展示
- 最多 5 个文件并发处理
- 暂停/继续/取消任务
- 部分完成文件支持下载
- 下载文件带时间戳命名

安装要求

pip install "mistralai>=2" flask

SDK 兼容 mistralai 1.x / 2.x，代码优先使用 2.x；若环境仅有 1.x 也可运行。

使用方法

1. 获取 API 密钥

访问 Mistral AI Console 注册或登录账号
进入 API Keys 页面创建 API 密钥
更多信息请参考 Mistral AI 快速入门文档

2. 设置环境变量

在 Linux 或 macOS 上：

export MISTRAL_API_KEY="your_actual_api_key"

在 Windows PowerShell 中：

$Env:MISTRAL_API_KEY="your_actual_api_key"

3. 启动 Web UI（推荐）

python webui.py

浏览器访问 http://localhost:8080，可上传 PDF 或图片批量处理。

4. 命令行模式（可选）

python pdf_ocr.py your_document.pdf
python pdf_ocr.py photo.png
python pdf_ocr.py scan.jpg -o custom_output_folder

未指定输出目录时，结果保存在 ocr_results_[文件名] 文件夹中。

输出结果

每个文件会生成一个输出目录，包含：

[文件名].md：OCR 识别的 Markdown 内容
images/：提取出的图像（如有）

下载的 ZIP 文件命名格式：ocr_results_YYYYMMDD_HHMMSS.zip

注意事项

请确保文件路径正确且文件可访问
API 密钥需要具有 OCR 功能的访问权限
若输出目录已存在，同名 .md 文件可能会被覆盖

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.gitignore		.gitignore
README.md		README.md
pdf_ocr.py		pdf_ocr.py
webui.py		webui.py
zh.pdf		zh.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mistral OCR 文档处理工具

功能特点

安装要求

使用方法

1. 获取 API 密钥

2. 设置环境变量

3. 启动 Web UI（推荐）

4. 命令行模式（可选）

输出结果

注意事项

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Mistral OCR 文档处理工具

功能特点

安装要求

使用方法

1. 获取 API 密钥

2. 设置环境变量

3. 启动 Web UI（推荐）

4. 命令行模式（可选）

输出结果

注意事项

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages