タグ

2011年11月2日のブックマーク (2件)

  • 形態素解析器のデコーダ部分を作ってみた - Negative/Positive Thinking

    はじめに 形態素解析器のデコーダ部分を超簡単に書いてみた。 いつも通り速度などは考えずに流れを学ぶために書いているので遅い。。。 あと「辞書の構築(コスト計算)」と「未知語処理」ができればそれっぽいものができそうな予感。 速度の改善などは、double arrayにしたりバイナリ読み込みにしたり。。。 やっていること 辞書ファイルの読み込み 単語辞書 隣接可能性行列 解析したい文を入力する ラティスの構築 解の探索 ビタビアルゴリズムでコストが最小のパスを探索 パスの単語リストを出力する 辞書の準備 辞書のダウンロード NIST NAIST Japanese Dic(for MeCab)を使わせていただきます 「mecab-naist-jdic-0.6.3b-20111013」 http://sourceforge.jp/projects/naist-jdic/ ちょっと修正 文字コード変

    形態素解析器のデコーダ部分を作ってみた - Negative/Positive Thinking
    prozorec
    prozorec 2011/11/02
    後で
  • みんな納豆菌を甘く見ない方がいい - クマムシ博士のむしブロ

    image from Wikipedia もしあなたが、納豆菌のことを納豆作りのために必要なだけの貧弱な菌だと考えているなら、それは納豆菌のことをみくびっていると言わざるをえない。 納豆そのものや、納豆菌から産生されるナットウキナーゼが、健康増進作用を持つと代替医療団体やテレビ局によって持ち上げられることもある。だがこれは、納豆菌たちが画策した印象操作にすぎない。 栄養補助品として販売されるナットウキナーゼ 後述する通り、彼らは当に恐ろしい奴らなのだ。 納豆菌の学名はバチルス・サブチリス・ナットー(Bacillus subtilis var. natto)。枯草菌のグループに属している。 家庭用に販売されている粉末状の納豆菌 こいつらは、栄養不足になると芽胞を形成する。この芽胞のスペックは半端ではない。まさに不死身ともいえる、驚異的な耐性能力があるのだ。 そのスペックとは、 ・栄養源な

    みんな納豆菌を甘く見ない方がいい - クマムシ博士のむしブロ
    prozorec
    prozorec 2011/11/02
    侵略ナットウ娘か?