タグ

単語に関するskozawaのブックマーク (3)

  • 単語の数学的表現メモ - Negative/Positive Thinking

    はじめに 単語をベクトルや確率分布などの数学的表現で扱いたい場合があったりする。 しかし、「どのようなベクトル・確率分布にすべきか?」などはタスクに依存したりして、自明じゃない。 たくさんあって、派生や新しいものもどんどんでていると思うので、どんなものがあるか調べたかぎりメモ。 One hot表現 各次元が「その単語か否か」を表すベクトルで表現 次元の大きさ=ボキャブラリ数 例: スカイツリー = (「船」か否か, 「スカイツリー」か否か, ... ) = (0,1,0,...) 素性のどれか1つしか1にならなくてスパースネスの問題がでる 未知語はゼロベクトルになってしまう 文字nグラムによる表現 単語の表層から得られる情報を利用 単語に出現している文字nグラムを利用 カタカナ語とか有効そう 例: スカイツリー = (「スカ」の出現回数, 「カイ」の出現回数, 「イツ」の出現回数, 「アア

    単語の数学的表現メモ - Negative/Positive Thinking
  • 草「w」はどんなコメントに生えるか? - 唯物是真 @Scaled_Wurm

    書きかけの記事とか書いたけど公開してない記事が溜まっているので2014年になったのを機に公開して供養していく 以下の記事はニコニコデータセットを利用しています 情報学研究データリポジトリ ニコニコデータセット ネットスラングの草「w」は以下のように笑いとか強調を表す意味で使われます 吹いたw ちょまwww クソワロタwwwwwwwwwwwwwww最近国語辞典に載ったことでも話題になりました すごい!国語辞典に、この意味を載せたのは初めてですよ! ダブリュー[W](名)①②③省略④〔←warai=笑い〕〔俗〕〔インターネットで〕(あざ)笑うことをあらわす文字。「まさかwww」(以下略) (三省堂国語辞典第七版) pic.twitter.com/bFbb1HI3XE— 三国ことは@三国ちゃん/紅白閲覧 (@sankokuziten) 2013, 12月 15 三省堂国語辞典 第七版 作者: 見

    草「w」はどんなコメントに生えるか? - 唯物是真 @Scaled_Wurm
  • プログラマーが間違えやすいかもしれない英単語 - Tagussan's Junk Depot

    プログラマー以外の普通の人も是非見ていってください) プログラミングをしていると様々な英単語と出会いますが、そこで使われる単語の意味は日常的に使われる意味のごく一部だったりします。プログラミングでしか使われない意味だけを覚えていると、実際に英文を読むときに困ったりします。この記事では、今まで私がプログラミングで出会った英単語のうち、他の意味もちゃんと知っておいたほうが良いと思ったものをまとめました。一問一答のクイズ形式です。 しかし、タイトルで「プログラマーが間違えやすい」と書きましたが、書いていくにつれてプログラミングとあんまり関係なさそうな単語も並べてしまいました。プログラマー以外の人も自分の語彙チェックとして利用してもらえれば幸いです。 問題文は、格言・名文から引用すると印象に残って良いかなぁと思い、BrainQuotes から殆どを持ってきました。By~が明示されてないものは自分

  • 1