[B! 自然言語処理] kuyのブックマーク

kuy id:kuy

自然言語処理に関するkuyのブックマーク (6)

https://airev.co.jp/
kuy 2016/08/10
NLP

自然言語処理

機械学習

AI

人工知能
リンク
米googleの研究者が開発したWord2Vecで自然言語処理(独自データ) - Qiita
「Word2Vec」は、米グーグルの研究者であるトマス・ミコロフ氏らが提案した手法であり、いくつかの問題について従来のアルゴリズムよりも飛躍的な精度向上を可能にした自然言語処理の手法。 Word2Vecは、その名前の表す通り、単語をベクトル化して表現するする定量化手法である。例えば日本人が日常的に使う語彙数は数万から数十万といわれるが、Word2Vecでは各単語を200次元くらいの空間内におけるベクトルとして表現する。その結果、今まで分からなかったり精度を向上するのが難しかった単語同士の類似度や、単語間での加算・減算などができるようになり、単語の「意味」を捉えられるようになった。というわけで、かなり興味深いないようなので、早速実践してみることにします。 1.環境構築 subversionを使ってWord2Vecのソースコードをcheckoutする。 mkdir ~/word2vec_t
kuy 2015/05/15
自然言語処理

word2vec

google
リンク
ジャストシステムの形態素解析技術
Development and Experiment of Deep Learning with Caffe and mafKenta Oono
kuy 2015/05/03
自然言語処理

形態素解析
リンク
自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記
Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体本文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非
kuy 2015/04/27
自然言語処理

機械学習

論文
リンク
WikipediaからのSolr用類義語辞書の自動生成
6. 見出し語（＝原型語）類義語（＝略語、日本語版頭字語）入国管理局入管文房具文具社員食堂社食国際連盟国連リポビタンD リポD ベルサイユのばらベルばら木村拓哉キムタク Universal Serial Bus USB （日本語における頭字語の例） Copyright (c) 2012 RONDHUIT Co.,Ltd. 6 7. 辞書型コーパス（見出し語,説明）× M 項目設定ファイル＜類義語知識の獲得＞すべての見出し語に関し以下をループ処理 Lucene/Solr インデックス 1. 類義語候補tBの同定インデックス作成 2. 見出し語tAと類義語候補tBの類似度S(tA, tB)の計算 3. 類似ならば出力 • • • 説見見明出出しし語語の読 CSVファイルみ Copyright (c) 2012 RONDHUIT Co.,Ltd
kuy 2015/04/27
類義語

lucene

solr

search

自然言語処理
リンク
テキストマイニングのための機械学習超入門　一夜目 - あんちべ！
テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい（けれど高度な数学は厳しい…）」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの？じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう
kuy 2015/04/27
機械学習

テキストマイニング

自然言語処理
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx