daabtkのブックマーク - はてなブックマーク

Node.jsでmecab-unidic-NEologdを使う
最近、ボットに漢字を含む日本語の「読み」を解析させて遊んでいます。前回の記事でmecab-ipadic-NEologdを使いましたが、今回は元となる辞書にipadicではなくunidicを利用しているmecab-unidic-NEologdを使ってみたので、その際のメモです。まだ触ってみた感触だけですが、unidic版のNEologdのほうが「読み」を正しく解析できる場合が多いように思います。 mecab-unidic-NEologdの導入 mecab-unidic-NEologdを導入するために、まずはmecabとmecab-unidicをシステムに導入します。手順については、mecab-unidic-NEologdのREADMEに詳しく書いてありますので、ここでは、OSXの場合の手順を抜粋しておきます。 # mecabとmecab-unidicと関連ツールをbrewでインストール
daabtk 2018/02/06
リンク
Word2Vecをhubotから使う
概要 overlast さんによる Word2Vec の WebAPI である word-vector-web-api を hubotから利用するスクリプトを書きました。 knjcode/hubot-word-vector-script Word2Vecとは Word2Vecというのは予め構築したモデル内で各単語を多次元のベクトルとして定義し、単語同士のベクトルの近似度や単語間のベクトルの近似度を求める手法です。詳細はgoogleの公式サイト等を御覧ください。例えば、(SONY – PlayStation + Nintendo) という表現は、NintendoにおけるSONYのPlayStationに相当するものを表現します。 word-vector-web-apiに付属のモデルでは、(SONY – PlayStation + Nintendo) は Wii、ゲームボーイアドバンス、ニン
daabtk 2015/07/29
-api

API

neologd

自然言語処理

word2vec

nlp

machinelearning

機械学習

web
リンク
1

はてなブックマーク

タグ

ブックマーク / blog.knjcode.com (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / blog.knjcode.com (2)

Node.jsでmecab-unidic-NEologdを使う

Word2Vecをhubotから使う

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス