Ubuntu PaddleOCR的API接口使用

avatar
作者
筋斗云
阅读量:0

要使用Ubuntu上的PaddleOCR API接口,您需要首先安装PaddleOCR库并正确配置环境

  1. 安装PaddleOCR:

在终端中运行以下命令以安装PaddleOCR:

pip install paddlepaddle paddlepaddleocr 
  1. 准备数据集:

为了训练OCR模型,您需要一个带标签的数据集。数据集应包含图像和相应的文本文件。例如,对于英语数据集,您可以使用EMNIST数据集。将数据集放在PaddleOCR/data文件夹中。

  1. 训练模型:

在终端中运行以下命令以训练OCR模型:

python PaddleOCR/train.py \     -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \     --train_dataset=PaddleOCR/data/ch_simfang \     --val_dataset=PaddleOCR/data/ch_simfang \     --train_batch_size=8 \     --rec_learning_rate=0.001 \     --save_dir=PaddleOCR/output 
  1. 导出训练好的模型:

训练完成后,您可以导出训练好的模型。运行以下命令以导出模型:

python PaddleOCR/export.py \     -c PaddleOCR/configs/rec/ch_ppocr_server_v2.0_rec_infer.yml \     --model_dir=PaddleOCR/output/rec \     --save_dir=PaddleOCR/output/export 
  1. 使用API接口:

现在,您可以使用导出的模型通过REST API识别图像中的文本。首先,安装Flask库:

pip install flask 

接下来,创建一个名为app.py的文件,并添加以下内容:

from flask import Flask, request, jsonify import paddlepaddle import paddlepaddleocr  app = Flask(__name__)  def ocr_client(image_path):     config = paddlepaddleocr.deploy.Config(det_model_dir="PaddleOCR/output/export", rec_model_dir="PaddleOCR/output/export")     det_loader = paddlepaddleocr.deploy.load_inference_model(config, det_model_type="CRNN")     rec_loader = paddlepaddleocr.deploy.load_inference_model(config, rec_model_type="CRNN")      img = paddlepaddle.io.read_image(image_path)     result = det_loader(img)     text = "".join([item["text"] for item in result])      return text  @app.route("/api/recognize", methods=["POST"]) def recognize():     image_file = request.files["image"]     image_path = "/tmp/" + image_file.filename     image_file.save(image_path)      text = ocr_client(image_path)     os.remove(image_path)      return jsonify({"text": text})  if __name__ == "__main__":     app.run(host="0.0.0.0", port=8080) 

现在,运行app.py文件以启动OCR API服务器:

python app.py 

要使用API接口,您可以使用curl命令或Postman等工具向http://0.0.0.0:8080/api/recognize发送POST请求,其中包含图像文件的base64编码。例如,使用curl命令:

curl -X POST -H "Content-Type: application/json" -d '{"image": "data:image/jpeg;base64,..."}' http://0.0.0.0:8080/api/recognize 

这将返回图像中的文本。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!