プログラムとしてはtesseractをダウンロード出来るサイト(https://code.google.com/p/python-tesseract/)に書いてあるとおりに、
api = tesseract.TessBaseAPI()
api.SetOutputName("outputName");
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetPageSegMode(tesseract.PSM_AUTO)
mImgFile = "xxx.jpg"
pixImage=tesseract.pixRead(mImgFile)
api.SetImage(pixImage)
outText=api.GetUTF8Text()
みたいな感じで使えます。
api.Initの中の"."の.はtesseract-ocrのファイルがある場所を指定します.
api.Init("/usr/tesseract-ocr","eng",tesseract.OEM_DEFAULT)みたいに書きます。
SetPageSegModeの中を(tesseract.PSM_SINGLE_BLOCK)のように変えるとモードを変えられる。ことができます。PSM_OSD_ONLY
......オリエンテーションとスクリプト検出だけPSM_OSD_ONLY
.....オリエンテーションとスクリプト検出にページ分割ができます。PSM_AUTO_ONLY
......OSD ,OCDのない自動ページ分割PSM_AUTO
......OSDのない完全な自動ページ分割PSM_SINGLE_COLUMN
......可変サイズのテキストの1列にとして仮定するPSM_SINGLE_BLOCK_VERT_TEXT
.....垂直配向テキストの一つの均一なブロックと仮定します。PSM_SINGLE_BLOCK
.....テキストの一つの均一なブロックを仮定します。PSM_SINGLE_LINE
.....一つのテキストラインとして画像を扱います。PSM_SINGLE_WORD
....一つの単語のような画像を扱います。PSM_SINGLE_WORD
サークル内の一つの単語として画像を扱います。PSM_SINGLE_WORD
1つの文字として画像を扱います。PSM_COUNT 列挙型エントリの数。