タグ

ブックマーク / hivecolor.com (3)

  • コーパスの意味について調べてみた【ら、ベクトル空間だということが分かった】

    コーパスが何なのか分からなかったので、コーパスの意味を調べてみた。そのメモ。 コーパスとは?の疑問に答えられるようになることがこの記事の最終目標です。 gensimに実装されたコーパスの中身を見てみました コーパスの意味を知るには、コーパスをprintしてみて実際のデータ構造を見るのが手っ取り早そうです。 そのために、gensimに実装されたコーパスの中身を見てみることにしました。 gensimのチュートリアル通りに進みます。今回見るのは、「Corpora and Vector Spaces」です。 実際のコードを追っていきます。 >>> import logging >>> logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) # フォーマットしたprintの

  • fluentdでログをs3とmongodbへ同時に送る方法

    fluentdでログをs3とmongodbへ同時に送る方法メモ。 fluentdをインストールしテスト動作させる まず最初に、OSのパラメーターをfluentdの動作に最適化させる設定を行う。ちょっと動かすだけならここはやらなくても大丈夫。 ※ファイル編集後にサーバーを再起動する必要があります # vi /etc/security/limits.conf root soft nofile 65536 root hard nofile 65536 * soft nofile 65536 * hard nofile 65536 # vi /etc/sysctl.conf net.ipv4.tcp_tw_recycle = 1 net.ipv4.tcp_tw_reuse = 1 net.ipv4.ip_local_port_range = 10240 65535 # fluentdのインストール

  • ニコニコ動画のタグネットワークを描画してみた

    ニコニコの動画のタグネットワークを描画してみました。 今回の調査には、「(株)ドワンゴと国立情報学研究所が提供しているデータ」を利用させていただきました。 前回からのおさらい 前回、「ニコニコ動画のタグの傾向を見てみた」こういう記事を書きました。 その続きとして、今回はタグネットワークを描画してみました。特にこれといった発見はないんですが、せっかくなので紹介します…(^^) タグネットワークの定義 今回のタグネットワークは大雑把に以下のように定義しました。 2012年9月29日に投稿された動画(1900.dat)のデータを利用した 各タグがノードに対応する 一つの動画に一緒に使わているタグにエッジがあると見なす 一度しか出現しないタグは取り除く エッジは全て無方向 利用回数が多すぎるタグ(ノード)は取り除く

  • 1