アラキタウン

黒歴史や生き恥を切り売り

2015-05-01から1ヶ月間の記事一覧

beamerのフォーマット

ネットに基本形(フォーマット?)みたいなの置いておいたらどこでも作れると思ったので設置。 いちいち調べるのめんどくさいのでww

tesseract を使うときでの手こずったとこ

プログラムとしてはtesseractをダウンロード出来るサイト(https://code.google.com/p/python-tesseract/)に書いてあるとおりに、 api = tesseract.TessBaseAPI()api.SetOutputName("outputName");api.Init(".","eng",tesseract.OEM_DEFAULT)api.SetPageSegMo…

セット4(前半)

セット4(前半)です。 (1)ファイルを読み込み,単語をキーとして,品詞,活用形,基本形のタプルのリストを値とするマッピング型に格納せよ.プログラムの動作を確認するため,標準入力から読み込んだ単語の語彙項目を閲覧するプログラムを実装 #!usr/bin/e…

セット3

セット3です。 (1)標準入力から英語のテキストを読み込み,ピリオドを文の区切りと見なし,1行1文の形式で標準出力に書き出す f = open("medsamp2012h.txt","r")data = f.read() t=re.sub("\.",'.\n',data)print(t)f.close() re.subでピリオドを改行(\n)…

かたわ少女 うぶんつ実行

かたわ少女の日本語版がリリースされたと聞いてさっそくダウンロードしてみました。 linux環境でもプレイできる数少ないゲームですね。 ゲームの概要としてもすごく興味があって、昔に一度英語版をやっていたのですが、途中で挫折しましたww ダウンロード…

セット2

セット2です。 (1)「拡散希望」という文字列を含むツイートを抽出 #!usr/bin/env python3# -*- coding: utf-8 -*-import retweet = re.compile("<text>[\s\S]*?</text>")kakusan=re.compile("拡散希望")f = open('tweets.txt',"r")data = f.read() # ファイル終端まで全て…

100本ノック セット1

100本ノックを課題としてやったのでそのメモです。 東北大学の乾・岡崎研究室のサイトで公開されている、言語処理100本ノックのメモです。問題の詳細はサイトをご覧ください。 第1セット (1) 行数をカウント。 #!usr/bin/env python3# -*- coding: utf-8…