![ソニー、新音楽再生アプリ「Music Center for PC」。Media Go後継だがx-アプリベース](https://cdn-ak-scissors.b.st-hatena.com/image/square/3cd785739d961db01c3714421e654b4d8cb1c292/height=288;version=1;width=512/http%3A%2F%2Fav.watch.impress.co.jp%2Fimg%2Favw%2Flist%2F1073%2F442%2Fmcp0.jpg)
「フランス」-「パリ」+「東京」=「日本」 こんな単語同士の演算ができる、と話題になったのがGoogleが発表したWord2Vecです。これは端的に言えば単語を数値で表現する技術で、これにより単語同士の「近さ」を測ったり、上記のような演算をすることが可能になります。この、単語を数値表現にしたものを分散表現と呼びます。 今回紹介するFacebookの発表したfastTextはこのWord2Vecの延長線上にあるもので、より精度が高い表現を、高速に学習できます。本稿ではその仕組みと日本語文書に対しての適用方法について解説していきます。 fastTextの仕組み fastTextでは、Word2Vecとその類型のモデルでそれまで考慮されていなかった、「活用形」をまとめられるようなモデルになっています。具体的には、goとgoes、そしてgoing、これらは全て「go」ですが、字面的にはすべて異なる
fastTextとは何なのか 自然言語処理の学習を高速化するツール これまで5日かかっていたタスクがたったの10秒で終了 fastTextで取り組める3つのこと fastTextで出来る3つの全体像 Facebookはニュースフィードから釣り見出しを排除するためにfastTextをつくった? リクルートテクノロジーズでは、レコメンドに応用 サイバーエージェントが実用化したAWAでのアーティストレコメンド Yahoo!はレシートメールの文章から製品をオススメする ◯2Vecを考えれば推薦に応用できる fastTextを安全に使うために必要な理論 単語をベクトル表現化するWord2Vec ベクトル表現を構築するアーキテクチャ CBoW Skip-gram fastTextを使ってみよう fastTextをインストールする 単語のベクトル表現を構築しよう Tweetデータの収集 単語のベクトル表
拝啓 平素は格別のご高配を賜り、厚く御礼申し上げます。 弊社所属俳優の種田梨沙ですが、 かねてより喉の治療の為お休みさせて頂いておりましたが、 この度体調を考慮しながらではありますが、少しずつお仕事を再開させて頂く予定です。 ファンの皆様、関係者の皆様におかれましては、 多大なるご心配とご迷惑をお掛け致しました事を心よりお詫び申し上げます。 今後とも変わらぬご声援、ご支援賜りますよう宜しくお願い申し上げます。 敬具 株式会社 大沢事務所
So after some time of searching on Google and Super User (and scanning man pages) I was unable to find an answer to something that (I think) should be simple: If you go here: http://www.vim.org/scripts/script.php?script_id=2340 And try to download the theme: http://www.vim.org/scripts/download_script.php?src_id=9750 Like so: wget http://www.vim.org/scripts/download_script.php?src_id=9750 You’ll pr
IntelliJ Platform is an OSS platform developed by JetBrains for building IDEs and language-aware developer tools. It is used by IntelliJ IDEA, Android Studio, CUBA Studio and Cursive, to name a few. Built on Java, it provides a cross-platform approach to building tools for any language, whether targeting the JVM or not. It is available under an Apache 2.0 license allowing you to create royalty-fre
Record and share your terminal sessions, the simple way. Forget screen recording apps and blurry video. Experience a lightweight, text-based approach to terminal recording. asciinema [as-kee-nuh-muh] is a free and open source solution for recording terminal sessions and sharing them on the web. Read about how it works. Easy recording Record right where you work - in a terminal. To start, run ascii
小池百合子・東京都知事が率いる地域政党「都民ファーストの会」は3日、子どもの受動喫煙を防ぐための条例案を9月開会の都議会に提出する方針を明らかにした。子どもがいる自宅や自家用車の中、通学路などでの禁煙について、罰則規定を設けず、努力義務を課す案を検討中だという。 同会は7月の都議選の公約で受動喫煙対策を掲げ、飲食店などの屋内を原則禁煙とすることや、子どもがいる自宅や自家用車内での喫煙制限を条例で定めるとした。このうち、まず子どもに関する部分を条例案として出す方向で、内容を詰めているという。 一方、屋内禁煙は条例で罰則を定めて規制したい考えだが、同会の増子博樹幹事長は3日、報道陣に「関係当局との協議が必要で時間がかかる」とし、条例案の準備が9月開会の都議会には間に合わないとの見通しを示した。 都議会では、同会や公明党など小池氏の支持勢力が過半数を占めており、条例案が提出されれば、可決される可
JUMAN++とは 外国人参政権? RNNLM 大規模語彙知識 JUMANやMeCabとの比較 精度 速度 MeCab JUMAN JUMAN++ JUMAN++とPythonバインディングのインストール JUMAN++の使い方 コマンドライン Pythonから使用する まとめ 参考 日本語は、英語と違ってスペースで単語が区切られていない。 だから、日本語の自然言語処理においては、まず単語の境界と品詞を推定することから始めることが多い。 このテキストを単語に分割して品詞や意味を推定することを、「形態素解析」という。 本記事では、その形態素解析をニューラルネットワークの一種であるRNNLM(Recurrent Neural Network Language Model)で構築された、JUMAN++を紹介する。 本記事を読むと、 JUMAN++とRNNLMについて MeCabなど他の形態素解析
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く