タグ

ブックマーク / blog.knjcode.com (2)

  • Node.jsでmecab-unidic-NEologdを使う

    最近、ボットに漢字を含む日語の「読み」を解析させて遊んでいます。 前回の記事でmecab-ipadic-NEologdを使いましたが、今回は元となる辞書にipadicではなくunidicを利用しているmecab-unidic-NEologdを使ってみたので、その際のメモです。 まだ触ってみた感触だけですが、unidic版のNEologdのほうが「読み」を正しく解析できる場合が多いように思います。 mecab-unidic-NEologdの導入 mecab-unidic-NEologdを導入するために、まずはmecabとmecab-unidicをシステムに導入します。 手順については、mecab-unidic-NEologdのREADMEに詳しく書いてありますので、ここでは、OSXの場合の手順を抜粋しておきます。 # mecabとmecab-unidicと関連ツールをbrewでインストール

    Node.jsでmecab-unidic-NEologdを使う
    daabtk
    daabtk 2018/02/06
  • Word2Vecをhubotから使う

    概要 overlast さんによる Word2Vec の WebAPI である word-vector-web-api を hubotから利用するスクリプトを書きました。 knjcode/hubot-word-vector-script Word2Vecとは Word2Vecというのは予め構築したモデル内で各単語を多次元のベクトルとして定義し、単語同士のベクトルの近似度や単語間のベクトルの近似度を求める手法です。詳細はgoogleの公式サイト等を御覧ください。 例えば、(SONY – PlayStation + Nintendo) という表現は、NintendoにおけるSONYのPlayStationに相当するものを表現します。 word-vector-web-apiに付属のモデルでは、(SONY – PlayStation + Nintendo) は Wii、ゲームボーイアドバンス、ニン

    Word2Vecをhubotから使う
  • 1