アラキタウン

黒歴史や生き恥を切り売り

技術-tesseract

tesseract3.04.01に出来た。

最初にleptonicaでエラーが出て、leptonicaをアップグレードしたりしたはず。(うろ覚え) そのあと、autogen.shを実行しようとしたら、 Something went wrong, bailing out! ってエラーが出て困っていた。 ↓参考に TesseractGitInstallation · tesseract-oc…

tesseract 3.03でかなり読める

今新しく出ているバージョンが3.04.01で、最新版がかなり読めるようになったということを聞きまして、今はどれくらいなのかと見てみただけです。 ↑3つは普通に -l jpnのコマンドで読むことができました。

tesseract の論文?を読みました。

論文というか、取り扱い説明書??? http://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/33418.pdf ↑ググったらすぐに出てくるこれです。 verview of the Tesseract OCR Engine直訳して、テセラクトの概要...... どういう仕…

tesseract を使うときでの手こずったとこ

プログラムとしてはtesseractをダウンロード出来るサイト(https://code.google.com/p/python-tesseract/)に書いてあるとおりに、 api = tesseract.TessBaseAPI()api.SetOutputName("outputName");api.Init(".","eng",tesseract.OEM_DEFAULT)api.SetPageSegMo…