タグ

algorithmに関するsasamistreetのブックマーク (2)

  • 第2回 階層的クラスタリングによる特徴抽出 | gihyo.jp

    はじめに 前回は、情報可視化の基的な考え方について、HatenarMapsなどの実例を示しながら説明しました。第2回以降は、Java言語を使用して実際にプログラムを作成することで、情報可視化の実践例を示していきたいと思います。 目標 連載では、はてなブックマークの人気エントリーのデータを可視化することを最終的な目標にします。可視化にあたっては、統計学的観点から「階層的クラスタリング⁠」⁠、視覚的観点から「ツリーマップ」の手法をそれぞれ用いることにします。 Java開発環境のセットアップ 手元にJavaの開発環境がなく、連載のプログラムを試したい場合には、Sun Microsystemsが提供している統合開発環境、NetBeansの導入をおすすめします。 NetBeansはオールインワン型のIDEですので、インストールするだけで特別な設定の必要もなく、一通りの開発環境を整えることができ

    第2回 階層的クラスタリングによる特徴抽出 | gihyo.jp
  • 最長しりとり連鎖問題 - Satomilogical Research

    こういう問題を思いついた。 次に言う言葉がもうない場合、最後に「ん」がついた場合にしりとりが終了するとして、ある辞書に登録された単語のみを使ってしりとりをするとしよう。もっとも長いしりとり連鎖の回数(とその連鎖のリスト)を出力するアルゴリズムを考えよ。 twitter/satomilogy ある辞書に登録された単語に限定してしりとりを行うとどうなるんだろうと考えた。まずしりとりはちゃんと終わるだろうか。有限の単語数の辞書なんだから必ず終わる。「ん」がついても終わる。では、ある辞書の中でどれくらい長くしりとりを続けることができるのだろうか、というのがこの問題です。可能なしりとり連鎖の組み合わせを総当りで求めて、その中から最長のものを選ぶというアルゴリズムはすぐに思いつきましたけど、おもしろくないですね。 問題を単純化してみてわかったこと 実際の国語辞典を使ってやる場合には、しりとりのローカル

  • 1