2018年6月8日のブックマーク (12件)

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • Pythonで単語分散表現のクラスタリング - Ahogrammer

    最近の自然言語処理では、単語の分散表現は当たり前のように使われています。 単語分散表現では、各単語が高次元ベクトル空間に配置され、加減乗除等の演算を行えるようになります。 これらのベクトルは、意味の近い単語に対しては同じようなベクトルになることがわかっています。 記事では、単語分散表現のベクトルをクラスタリングし、意味が近い単語のクラスタを作ってみたいと思います。 これらのクラスタは、眺めて楽しむだけでなく、機械学習の素性として使うこともできます。 イメージ的には、以下のような感じで単語をクラスタにまとめます。 では、単語分散表現をクラスタリングして、単語のクラスタを作ってみましょう。 準備 まずは、作業用のディレクトリを作成しておきましょう。 また、必要に応じて Python の仮想環境も用意します。 以下のコマンドを実行することで、ディレクトリを用意します。 $ mkdir work

    Pythonで単語分散表現のクラスタリング - Ahogrammer
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • 階層構造を持つデータの可視化 - Qiita

    社会に存在するデータのうち、たとえばこのようなデータが該当する。 - コンピュータOSが管理するファイルシステムにおけるファイルとディレクトリの関係 - 書籍の構造(部、章、節) - レガシーな会社組織(社長、部長、課長) - 生物の分類法 - 文献学(philology) 表現方法 大きく三つに分ける。 隣接関係・ダイアグラム(Adjacency diagrams)...入れ子(nested) アイシクル・ツリー(Icicle Tree) サンバースト・チャート(Sunburst Chart) エンクロージャー・ダイアグラム(Enclosure diagrams)...入れ子(nested) ツリーマップ(Treemaps) サークルパッキング(Circle Packing) ノードリンク・ダイアグラム(Node-link diagrams)...積み重ね(stacked) Dendro

    階層構造を持つデータの可視化 - Qiita
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • ツリー構造データを可視化するためのシンプルな非依存型スクリプト・「treeData.js」

    treeData.jsはツリー構造のデータを可視化する為のスクリプトです。シンプルな仕様で、単純に可視化するためだけのものとなっていますので他スクリプト等への依存もなく、コードも少なく実装も容易です。使い勝手は良いかなという印象です。マウスホバーで子のノードも一緒にスタイル変更されます。 試しに家系図的なもの(データ参照:徳川家系図大鑑)を作ってみました。家系図ならマウスホバーでparentも参照、スタイル変更等出来ると良いのですが現状では子のみとなっています。でもコードいじれば出来そう。応用効きそうですね。ライセンスは明記がないので問い合わせを。 treeData.js

    ツリー構造データを可視化するためのシンプルな非依存型スクリプト・「treeData.js」
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • ディレクトリ構造を一発で可視化するtreeコマンドを使ってみた。

    treeコマンドとは? treeコマンドは、ディレクトリ構造を可視化するコマンドです。 The Tree Command for Linux Homepage lsコマンドは、カレントディレクトリのファイルのみを表示しますが、treeコマンドは、カレントディレクトリ以下の階層を探索しながら表示してくれます。 試しに「設定ファイル分割や、コマンド補完が使える拡張sshコマンドを公開しました。」で紹介したsshxのソースコードでtreeコマンドを実行してみます。 $ tree . ├── LICENSE ├── README.md ├── bin │ └── sshx ├── lib │ ├── sshx │ │ ├── cli.rb │ │ └── version.rb │ └── sshx.rb ├── sshx-0.0.0.gem ├── sshx-0.1.0.gem ├── sshx-

    ディレクトリ構造を一発で可視化するtreeコマンドを使ってみた。
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • Graphvizとdot言語でグラフを描く方法のまとめ - Qiita

    概要 Graphvizはdot言語で記述されたグラフ構造を任意のフォーマットの画像ファイルへ出力するツールです。 グラフ構造はdot言語でdotファイルというプレーンテキストに記述します。 この記事はdot言語でグラフを書く方法を簡単にまとめたものです。 環境 下記の環境で動作確認を行いました。 Windows7 (64bit) [Graphviz] (http://www.graphviz.org/) 2.38 参考 下記のサイトを参考にさせて頂きました。 [Graphviz - Documentation] (http://www.graphviz.org/documentation/) [Graphviz - Gallery] (http://www.graphviz.org/gallery/) [Gvizの目次 - Rubyの世界からGraphvizの世界にこんにちは!] (htt

    Graphvizとdot言語でグラフを描く方法のまとめ - Qiita
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • データのビジュアル化を最少の労力で: Graphviz

    Graphviz は、人や物のネットワーク、フローチャート、系統樹などに適したグラフ描画ツールです。WindowsMacLinux など多くの OS で利用できます。 まずシンプルな例から見てみましょう。次の図は夏目漱石『坊ちゃん』の人間関係をグラフにしたものです。 Graphviz のデフォルト設定では、この図のようにそれぞれの事物(ノードと呼びます)を楕円で描画し、ノードとノードを線(エッジと呼びます)で結びます。デフォルトではエッジは片方向の矢印で表現されますが、ここでは少し工夫して、人物の敵対関係を双方向の矢印で、また一方的関係を片方向の矢印で示してみました。 もう少し複雑な例を見てみます。図2 は Graphviz の公式サイトにあげられているものです。ここではノードの形が楕円から円に変わっています。二重の円になっているものもあります。またノードだけでなく、それぞれのエッジ(

    データのビジュアル化を最少の労力で: Graphviz
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • Graphvizで作る、私たちの国「日本」の今度こそ本当の姿かたち

    (追記:2014-3-3) Gvizについてのまとめ頁を作りました。 Gvizの目次 - Rubyの世界からGraphvizの世界にこんにちは! 僕は前回、antlaboさんが公開されている全国市区町村の隣接データに基いて、Graphvizで次のような日を作りました。 “Graphvizで作る、私たちの国「日」の当の姿かたち” ええ、これが「日」です。 まあ、これはこれで面白かったのですが、全体的形状としては現実の日国土とは程遠いものとなりました。都道府県の隣接情報に基いて日を書いたときや、州の隣接情報に基いて米国を書いたときには、それなりに上手くいっていたのですが、今回のようにノード数が異常に多いとGraphvizにおける配置演算が難しくなって、隣接ノード間の距離がまちまちになってしまうのです。 それで、各市町村の位置情報があればうまくいくはずということで、どこかにそのような

    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • ニコニコ動画のタグネットワークをリアルタイムに可視化する | 月と燃素と、ひと匙の砂糖

    巨大なグラフ1を階層的に纏め上げてくれるLouvain Method(Blondel, et al. [2008])というアルゴリズムの論文と、これをリアルタイム可視化に用いている(Praneenararat et al.[2011])論文を発見して、面白そうだなぁと思ったので(小学生並みの感想)、ニコニコデータセットに適応してやってみました。 明日、日曜日(4/26)に「ニコニコ超会議」内の「ニコつく」でサークルの一つとして展示します。I19です。 デモサイトはこちら (2018/04/24: メモリの圧がキツいので終了しました) ネットワーク・クラスタリング ニコニコ動画へのタグって、ふつう「アニメ, 遊戯王, この虫野郎」みたいな感じで相互に関連するタグが付けられますよね。 このタグ同士の関連をネットワークとして可視化したら、ニコニコ動画の中でどんな概念同士がリンクしてるのかなー、と

    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • 改訂版: プログラマーが効果的な可視化を作成する (前編) - Qiita

    改訂版について (5/7/2019公開) この記事は、私がこちらに公開したもの中では最も読まれているようです。そこで、執筆後に気づいたこと、古くなった情報、新しい技術動向などを考慮に入れて改訂をしました。主な変更点は以下の通りです: 新しいセクションの追加 最近のの紹介 細かな表現の修正 この記事は複数のセクションに分かれていますので、前編から始め、順番にアップデートして行きたいと思います。何かお気付きの点などありましたら、コメント欄、もしくはkonoアットマークucsd.eduにお願いいたします。 はじめに この記事は、可視化の専門家ではない人がコンピュータを使ってデータ可視化を実際に行う場合に必要な、一般的なノウハウをお伝えするシリーズの第一回です。 前編: 効果的なデータ可視化とはどのようなものか? (稿) 中編: 分かりにくい可視化を避けるための手法の選択 後編: Part 1

    改訂版: プログラマーが効果的な可視化を作成する (前編) - Qiita
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • 【備忘録】PCとiPadではviewportを読み込ませないようにする | WEBの技

    レスポンシブで制作し、 iPadで見た際にPC表示になっているものの 端が切れたり・・・拡大縮小もできず・・・ という出来事がきっかけで PCと同じ見た目で表示させたい場合はそもそもviewport設定が無ければいい。 という記事と出会い、 スマートフォンと PC および iPad でviewport設定を以下のようにjsで振り分け。 <script type="text/javascript"> if ((navigator.userAgent.indexOf('iPhone') > 0) || navigator.userAgent.indexOf('iPod') > 0 || navigator.userAgent.indexOf('Android') > 0) { //iPhone、iPod、Androidの設定 document.write('<meta name="viewpo

    【備忘録】PCとiPadではviewportを読み込ませないようにする | WEBの技
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags:
  • もう逃げない。HTMLのviewportをちゃんと理解する

    と呪文のように書いてきたが、いい加減ちゃんと整理して理解しよう。 いろいろ調査した結果、以下の考え方で理解できると思う。 まず、実際の液晶の解像度は一旦忘れろ。 <meta name="viewport" content="width=480">と指定したとする。 するとそこに幅480pxの仮想的なウインドウが作られる。幅480pxの液晶モニターがあることをイメージして欲しい。これをviewportと呼ぶ。 ブラウザはviewportにレンダリングする。viewportの中では、あたかも当に480pxのモニターを使っているかのような環境になっている。なので、JSのdocument.documentElement.clientWidthなんかも480を返すし、media queryの条件判定でも480pxの画面幅が使われる。 次にviewportを実際の液晶画面に表示する。この時、view

    もう逃げない。HTMLのviewportをちゃんと理解する
    anony3masuda
    anony3masuda 2018/06/08
    From: Pocekt@phase Tags: