Skip to content

msjsc001/Mistral_AI_PDF_OCR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 

Repository files navigation

Mistral_AI_PDF_OCR

Mistral AI PDF OCR 工具

版本 许可 image

简介:

这款工具利用 Mistral AI 强大的 OCR (光学字符识别) 服务,帮助你将扫描版 PDF 文档转换为可编辑的 Markdown 格式文本,并提取 PDF 中的图片。它提供简洁易用的图形界面,无需编程知识即可轻松操作。 无视官方大小限制,自动切割PDF上传识别后合并!(特别注意现在官方上传限制是52MB,设置切割大小一般不要大于这个数值)

主要功能:

  1. PDF OCR 转换为 Markdown: 将扫描版 PDF 文件识别为 Markdown 文本,方便编辑和整理。
  2. 自动处理大文件: 如果 PDF 文件超过 Mistral AI 的文件大小限制,程序会自动拆分 PDF 文件,分批进行 OCR 处理,无需用户手动操作。
  3. 图片提取与内嵌: 从 PDF 文档中提取图片,并以本地图片链接的形式嵌入到生成的 Markdown 文件中,方便图文对照查看。
  4. 图形用户界面 (GUI): 提供直观友好的图形界面,操作简单易上手,无需命令行操作。
  5. 灵活的输出设置: 用户可以自定义 OCR 结果的输出目录。
  6. 浅色/深色模式: 支持浅色和深色界面模式,适应不同用户的偏好。
  7. 配置持久化: API 密钥、界面模式和输出目录等设置会被保存,下次启动程序时自动加载。

使用方法:

image

  1. 获取 Mistral AI API 密钥: 你需要在 Mistral AI 平台 (请替换为 Mistral AI 官方平台链接) 获取你的 API 密钥。
  2. 下载并运行程序: 从 发布页面 (请替换为你的仓库发布页面链接) 下载打包好的 EXE 可执行文件,解压后直接运行。
  3. 填写 API 密钥: 在程序界面中,输入你的 Mistral AI API 密钥。
  4. 选择 PDF 文件: 点击 "浏览" 按钮选择你需要进行 OCR 处理的 PDF 文件。
  5. 设置输出目录 (可选): 你可以点击 "输出目录" 旁边的 "浏览" 按钮,选择 OCR 结果的保存位置。如果留空,则默认保存在与 PDF 文件相同的目录下。
  6. 设置最大文件大小 (可选): 通常情况下,程序会自动处理文件大小限制,无需手动设置。如果你需要自定义最大文件大小 (MB),可以在 "最大文件大小 (MB)" 输入框中修改。
  7. 点击 "开始 OCR": 点击 "开始 OCR" 按钮,程序将开始处理 PDF 文件。
  8. 查看结果: OCR 处理完成后,结果文件 (Markdown 文件和 images 文件夹) 将保存在你设置的输出目录中。

输出文件结构:

OCR 结果会保存在以 PDF 文件名命名的文件夹中(如果指定了输出目录,则在该目录下创建文件夹)。文件夹内包含以下内容:

  • [PDF文件名]_[时间戳].md: Markdown 格式的 OCR 结果文件,包含识别出的文本内容和图片链接。
  • images 文件夹: 存放从 PDF 中提取出的所有图片文件 (PNG 格式)。
  • [PDF文件名]_split 文件夹 (如果 PDF 被拆分): 如果原始 PDF 文件过大而被程序拆分,拆分后的临时 PDF 文件会保存在此文件夹中。(注意:这些拆分文件不会自动删除。)

注意事项:

  • API 密钥有效性: 请确保你输入的 Mistral AI API 密钥是有效且可用的,并且你的 API 账户有足够的配额。
  • PDF 文件路径: PDF 文件路径可以是绝对路径或相对路径。
  • 自动文件拆分: 程序会自动处理 PDF 文件大小限制和拆分,用户无需手动干预。
  • Markdown 文件名: 输出的 Markdown 文件名包含时间戳,以避免多次 OCR 处理时文件名冲突和覆盖。
  • 临时拆分文件: 拆分后的临时 PDF 文件会保留在 [PDF文件名]_split 文件夹中,不会自动删除。如果需要重复 OCR 处理同一个文件,可以避免重复拆分。
  • OCR 识别质量: OCR 识别质量受 PDF 文档质量的影响。对于复杂布局、低分辨率或包含特殊字符的 PDF,Mistral AI 的 OCR 可能会产生少量错误或乱码,这是 OCR 技术本身的局限性,属于正常现象。 如有发现乱码,请尝试检查原始 PDF 文件是否包含特殊符号或异常字符。

版本更新记录:

  • v1.3.9 (最新)
    • 移除 API 连接测试功能,简化用户操作流程。
    • 优化用户界面和用户体验。
    • 修复已知 bug。

贡献:

欢迎提交 issue 报告 bug 或提出改进建议。如果你有代码贡献,请提交 Pull Request。

许可协议:

本项目使用 MIT 许可证 (请根据你的实际许可证文件修改)。


感谢使用 Mistral AI PDF OCR 工具!

About

使用Mistral-OCR把扫描版PDF书籍转换为Markdown格式(带图)

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages