どうすればPythonで画像から文字を抽出できるのか
OCR(光学字符認識)ライブラリである Tesseract を使用すれば、画像からテキストを抽出できます。以下は、Tesseract ライブラリを使用した画像テキスト抽出の例です。
- まず、Tesseract OCRライブラリとPythonのTesseractライブラリがインストールされていることを確認してください。インストールには以下のコマンドを使用できます。
pip install tesseract
pip install pytesseract
- 必要なライブラリをインポートする。
import pytesseract
from PIL import Image
- 画像のロード・プリプロセス
image = Image.open('image.jpg') # 加载图片
image = image.convert('L') # 转为灰度图像
- Tesseractを用いた文字認識
text = pytesseract.image_to_string(image)
print(text)
上記コードを実行すると、抽出された画像のテキストが出力されます。
既定のコードは、tesseract のデフォルト言語モデルでテキスト抽出に利用されることにご留意ください。特定の言語のテキストを抽出する必要がある場合は、pytesseract.image_to_string 関数の lang パラメーターで言語モデルを指定できます(例:
text = pytesseract.image_to_string(image, lang='chi_sim') # 提取中文文字
また、Tesseractによる文字検出を利用するためには、Tesseract の実行可能ファイルのパスをシステム環境変数に追加するか、コードの中で Tesseract の実行可能ファイルのパスを指定する必要があります。