タグ

2013年3月27日のブックマーク (7件)

  • hayashi_ad2

    hayashi_ad2

  • 京都大学テキストコーパス - LANGUAGE MEDIA PROCESSING LAB

    京都大学テキストコーパス † 毎日新聞の記事に各種言語情報を人手で付与したテキストコーパスです。95年1月1日から17日までの全記事、約2万文、1月から12月までの社説記事、約2万文、計約4万文に対して、形態素・構文情報を付与しています。これらの情報は、形態素解析システムJUMAN、構文解析システムKNPで自動解析を行い、その結果を人手で修正したものです。 さらに、社説記事を除く約2万文に対しては、格関係、照応・省略関係、共参照の情報を付与しています。 ↑ ダウンロード † GitHubリポジトリ: https://github.com/ku-nlp/KyotoCorpus 過去のバージョン 京都大学テキストコーパス Version 4.0 (7,990,765 bytes) 形態素・構文情報のタグ付け基準マニュアル 格関係、照応・省略関係、共参照情報のタグ付け基準マニュアル ※ これらの

  • Python組み込み関数(any 関数 と all 関数)

    今回は小ネタです。 この前ソースを眺めていたら、見慣れない関数があった。例えば次のようなコードである。 if not filename.startswith('/') or \ any(filename.endswith(x) for x in ignore_concat): この中で any が使われているが、なんだこれは?。・・・ということで調べてみました。 any はPython組み込み関数である。似た関数として all というものもあるそうだ。 any(iterable) iterable のいずれかの要素が真ならば True を返します。 iterable が空なら False を返します。以下のコードと等価です。 def any(iterable): for element in iterable: if element: return True return False バー

  • Python組み込み関数(property関数)

    関数パラメーター property(fget=None, fset=None, fdel=None, doc=None) fget プロパティを取得するメソッド名 fset プロパティを設定するメソッド名 fdel プロパティを削除するメソッド名 doc  プロパティの説明文 まず property関数を使わない使用例を示す。 >>> class Cal(object): ... def __init__(self): ... self.__x = None ... def getx(self): ... return self.__x ... def setx(self, value): ... self.__x = value ... def delx(self): ... del self.__x ... >>> a = Cal() >>> a.setx(10) >>> a.getx

  • defaultdict を使うのだ - かせきのうさぎさん

    collections.defaultdictを使うと要素のカウントがシンプルに書けるね。 # Python 2.5 from collections import defaultdict d = defaultdict(int) s = "abrakadabra" # 文字別にカウント for i in s: d[i] += 1 # 結果表示 for k, v in d.iteritems(): print k, v # 結果 # a 5 # r 2 # b 2 # k 1 # d 1 defaultdictの第1引数にはファクトリ関数を指定する。つまり「呼んだら新しいオブジェクトを戻り値として返すようなブツ」を入れろということだ。ビルトインなファクトリ関数には次のようなものがある: >>> int() 0 >>> float() 0.0 >>> list() [] >>> set()

    defaultdict を使うのだ - かせきのうさぎさん
  • MeCabのコマンドライン引数一覧とその実行例 | mwSoft

    -r --rcfile 使用するリソースファイルを指定する リソースファイルとは、辞書ディレクトリに入っている「dicrc」ファイルを指します。 試しにシステム辞書の「dicrc」ファイルをコピーして、「dicrc2」というファイルを作り、その中の「; simple」の「EOS」を「eos」に書き換えます。するとこんな風になります。 // リソースを指定せずに実行 $ echo テスト | mecab -O simple テスト 名詞-サ変接続 EOS // リソースを改変したdic2に指定して実行 $ echo テスト | mecab -r dicrc2 -O simple -d /usr/local/lib/mecab/dic/naist-jdic テスト 名詞-サ変接続 eos 我が家の環境では、システム辞書ディレクトリをカレントディレクトリとした状態にするか、「-d」でシステム辞書

  • MeCabのコマンドライン引数一覧とその実行例 | mwSoft

    -r --rcfile 使用するリソースファイルを指定する リソースファイルとは、辞書ディレクトリに入っている「dicrc」ファイルを指します。 試しにシステム辞書の「dicrc」ファイルをコピーして、「dicrc2」というファイルを作り、その中の「; simple」の「EOS」を「eos」に書き換えます。するとこんな風になります。 // リソースを指定せずに実行 $ echo テスト | mecab -O simple テスト 名詞-サ変接続 EOS // リソースを改変したdic2に指定して実行 $ echo テスト | mecab -r dicrc2 -O simple -d /usr/local/lib/mecab/dic/naist-jdic テスト 名詞-サ変接続 eos 我が家の環境では、システム辞書ディレクトリをカレントディレクトリとした状態にするか、「-d」でシステム辞書