paddleocr安装使用教程-问答三三

paddleocr安装使用教程

PaddleOCR 是百度飞桨（PaddlePaddle）团队开发的一款开源 OCR 工具，它支持多种语言的文字识别，并且提供了丰富的预训练模型和便捷的 API 接口。以下是如何安装和使用 PaddleOCR 的详细步骤。

Python 环境：
- 确保已安装 Python 3.6+ 版本。可以通过命令行输入 python --version 或 python3 --version 来检查当前安装的 Python 版本。
虚拟环境（可选但推荐）：
- 使用 venv 或 conda 创建一个新的虚拟环境以避免依赖冲突。例如，使用 venv 可以按如下方式操作：python3 -m venv ocr_env source ocr_env/bin/activate # 在 Unix 或 MacOS 上 ocr_env\Scripts\activate # 在 Windows 上

安装 PaddlePaddle：
- 根据你的系统和 CUDA 版本选择合适的 PaddlePaddle 安装命令。可以在 PaddlePaddle 官网找到最新的安装指南。例如，如果你使用的是 CPU 且操作系统为 Ubuntu，可以使用以下命令：pip install paddlepaddle==2.x.x # 请替换 x 为最新版本号
- 如果你的机器上有 NVIDIA GPU 并安装了 CUDA，可以选择安装 GPU 支持的版本：pip install paddlepaddle-gpu==2.x.x # 同样需要替换版本号
安装 PaddleOCR：
- 直接通过 pip 安装 PaddleOCR：pip install paddleocr

PaddleOCR 默认提供了一些常用的中英文模型，但你也可以根据需要下载其他语言的模型。你可以从 PaddleOCR GitHub 页面获取更多信息。
例如，要下载并解压中文（简体）和英文的轻量级模型，可以执行以下命令：
# 下载 PaddleOCR 的资源文件 wget https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_ppocr_v2.0_det_train.tar && tar xf ch_ppocr_v2.0_det_train.tar wget https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_ppocr_v2.0_rec_train.tar && tar xf ch_ppocr_v2.0_rec_train.tar wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/en_ppocr_mobile_v2.0_det_train.tar && tar xf en_ppocr_mobile_v2.0_det_train.tar wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/en_ppocr_mobile_v2.0_rec_train.tar && tar xf en_ppocr_mobile_v2.0_rec_train.tar

基本用法：
- 使用默认配置进行 OCR 识别：from paddleocr import PaddleOCR, draw_ocr import matplotlib.pyplot as plt from PIL import Image # 初始化 OCR 模型，选择使用的语言 ocr = PaddleOCR(use_angle_cls=True, lang='ch') # lang 参数可以设置 'ch' (中文), 'en' (英文) 等 # 执行 OCR 识别 img_path = 'path/to/your/image.jpg' result = ocr.ocr(img_path, cls=True) # 打印结果 for line in result: print(line) # 可视化结果（可选） image = Image.open(img_path).convert('RGB') boxes = [elements[0] for elements in result] txts = [elements[1][0] for elements in result] scores = [elements[1][1] for elements in result] im_show = draw_ocr(image, boxes, txts, scores, font_path='path/to/font.ttf') # 需要指定字体路径 im_show = Image.fromarray(im_show) plt.imshow(im_show) plt.axis('off') plt.show()
高级配置：
- 你可以通过设置不同的参数来调整 OCR 的行为，比如调整检测框的置信度阈值、设置最大检测文本框数量等。具体可以参考 PaddleOCR 的官方文档或源代码中的注释。