PaddleOCRのインストールと簡単な使用(Windows) インストール手順
PaddleOCRはPaddlePaddle深層学習プラットフォームをベースにしたOCR(Optical Character Recognition:光学的文字認識)ツールキットであり、テキスト認識、テキスト検出、およびテキスト方向検出などのタスクに使用できます。WindowsシステムでPaddleOCRをインストールする手順と簡単な使用例は次の通りです:
- Python環境がインストールされていることを確認し、Python環境の管理にはAnacondaをお勧めします。
- Anaconda Promptを開いてください(Anacondaを使用している場合)またはコマンドラインターミナルを開いてください。
- 新しい仮想環境を作成し、アクティブ化します(オプションですがお勧めします)。
- コンダを使用して、PaddleOCRの仮想環境を作成し、アクティブにします。
- PaddlePaddleの深層学習プラットフォームをインストールする。
- conda install paddlepaddle-gpu==2.1.0 cudatoolkit=10.2 -c paddleをインストールしてください。
- PaddleOCR のインストール:
- paddlepaddleとpaddleocrをpipを使ってインストールしてください。
- 予め学習されたモデルファイルをダウンロードしてください。
- paddleocrの中国語モデルをダウンロードする。
- 簡単なサンプルコードを実行してください。
- import paddleocr# OCRリーダーを作成
ocr = paddleocr.OCR()# 画像を読み込む
img_path = ‘path/to/your/image.jpg’
img = paddleocr.read_image(img_path)# 文字を認識する
result = ocr.ocr(img)# 認識結果を出力する
for line in result:
print(‘ ‘.join([word_info[-1] for word_info in line]))
これで、PaddleOCRのインストールと基本的な使用が完了しました。テキスト検出、テキストの方向検出など、さまざまなOCRタスクをカスタマイズすることができます。詳しい使い方はPaddleOCRの公式ドキュメントを参照してください。