[B! 自然言語処理][base] kyo_agoのブックマーク

kyo_ago id:kyo_ago

自然言語処理とbaseに関するkyo_agoのブックマーク (1)

Tweet2VecでQiitaの投稿を形態素解析せずに分類する - Qiita
目次やりたかったこと Qiita投稿を取得する Tweet2Vecを使う GPUインスタンスを使うタグ予測結果類似投稿を出してみる考察と課題やりたかったこと短い日本語文書（ツイートなど）を分類したいニューラルネットワーク使いたい形態素解析せずにやりたい SNSの投稿などを処理する場合、誤字、脱字、スラング、新語、絵文字、顔文字、外国語、専門用語、表記ゆれなどが多く含まれるため、形態素解析器を用いたアプローチは不利に思われる。近年のNLP論文を読んでいると単語レベルではなく文字レベルで学習させる方向にいっているようなので、その流れに乗ってみる。日本語は一文字あたりの情報量が大きいので英語より有利だと思う。文書が長すぎず、形態素解析しにくそうで、ある程度トピックにまとまりがある題材として、Qiitaの投稿をタイトルのみで分類してみることにした。Qiitaの本文はmarkdow
kyo_ago 2016/06/14
class

base

api

自然言語処理

Qiita

tag

JSON

形態素解析

True
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx