タグ

researchに関するnaoeのブックマーク (190)

  • K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

    K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。 以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。 この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+

    K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ
  • もうアンテナ低いなんて言わせない!? 情報収集11のテクニック | 教えて君.net

    毎日新しい情報が駆け巡っているネットの世界では、ボンヤリしていると面白い情報を見逃してしまう。今回は大量の情報を効率よくチェックする為の【情報収集】に関する基的なTipsをまとめてみたぞ。

  • 勉強会配信セットを作ってみました

    札幌のフリーランサーまいむぞうのブログ。Android関連、コンピュータビジョン、IoT、ロボティクスあたりをやっています。 パチンコで勝ったので、このアブクゼニが無くならないうちに勉強会をUst配信するために必要な機材をバック1つにまとめたセット(以下勉強会配信セット)を作ってみました。 方向性としては、 配信に必要なものがバック1つに収まること 最低限のクオリティを確保しつつ安価であること 勉強会間で貸し借り可能なこと(LOCALで管理する前提でまとめました) ネットワーク回線は調達方法がいろいろあるし、責任問題が付きまとうからセットには含めない としています。 「ちょっと○○配信したいから貸してよー」「ほーい」と簡単に貸せるセットとして使いたいのです。 以下にセット内容と選定理由と購入価格と短評をまとめてみます。 Webカメラ "Logicool キューカムプロ9000 QCAM-2

    勉強会配信セットを作ってみました
    naoe
    naoe 2009/01/13
    勉強会配信セット
  • よしおかひろたかの「初めての勉強会」 インデックス - @IT自分戦略研究所

    オープンイノベーション時代における勉強会の価値 よしおかひろたかの「初めての勉強会」(終) OSSとIT勉強会はよく似ている。モチベーションの高い自律的な人が集まると、明確なロードマップや仕様書がなくてもうまく回る

    naoe
    naoe 2009/01/13
    勉強会を開くとき・参加するときの心得
  • Leo's Chronicle: ぜひ押さえておきたいデータベースの教科書

    先日のエントリで少し話したのですが、僕が在学していたときの東大にはデータベースを学ぶためのコースというものがありませんでした(DB関係の授業は年に1つか2つある程度。現在はどうなんだろう?)。そんなときに役だったのは、やはり教科書。読みやすいものから順に紹介していきます。(とはいってもすべて英語です。あしからず) 一番のお薦めは、Raghu Ramakrishnan先生 (現在は、Yahoo! Research) の「Database Management Systems (3rd Edition)」。初学者から研究者まで幅広く使えます。データベース管理システム(DBMS)の基概念から、問い合わせ最適化、トランザクション管理など、これらを実装・評価するために必要な、「DBの世界での常識」が、丁寧な語り口でふんだんに盛り込まれています。この1冊を読んでおけば、DBの世界で議論するための

    naoe
    naoe 2009/01/08
    おすすめ4冊が載ってる
  • 論文を読む上で重要かつシンプルな9つのルール - 晴耕雨読ときどき昼寝の日々

    研究 | 00:06 | 最初に言っておくけど、このタイトルはホッテントリメーカーでつくったんじゃないよ!結果としてこうなったんだよー!! ゴホッゴホッ(咳をする音)、では気分を取り直して、以下文です。 しんぷる大先生 (id:simpleA) が読書をする上でいかに自分のアイデンティティーを大事にするかという興味深いエントリーを上げていたので、エントリーでは研究者の論文の読み方について思うところを。 ライフサイエンス系の最前線の研究者は論文を読むことと実験をすることに忙殺されていると思うから、ほとんどの研究者は論文か実験に使う時間を出来るだけ減らしたいという願望を持っていると思うのです(エラクなるごとに実験量は減り、論文を読む量は増えるよー)。私は(エラクはないけど、っつーか、シタッパーズです!それでも)読む必要性のある論文が常に山になっているのですが、論文を読む時はこんな点に注意し

  • サーベイの仕方・論文の読み方 - 4403 is written(終了しました)

    @自宅(個人の見解に基づいており,所属組織などとは一切関係ありませんし,事実かどうかもわかりません) この世界に希望をもつためには批判し続けることこそが必要だ - Edward W. Said (1935-2003) 少し時間が空いてしまったが,やっと形になったので,公開してみる.dis覚悟なので,disって下さい.叩き上げて,より良い資料になればと思います. サーベイの仕方・論文の読み方 情報系院進学予定の卒研生とM1を対象にしています.内容に偏りがあるのは,その分野しか分からないからです.色々な方からのご意見を頂きたいです. 見て頂ければわかると思いますが,naoeさんにインスパイアされています.参考にさせて頂いております.ありがとうございますm(__)m. まとめていて気付いたんですが,世の中には「論文の書き方」や「プレゼンの仕方」なる資料は良質なものがゴロゴロと見つかりますが,「研

  • 情報系研究者が研究・論文執筆をする前に知っておくべきこと - 4403 is written(終了しました)

    @自宅(個人の見解に基づいており,所属組織などとは一切関係ありませんし,事実かどうかもわかりません) この世界に希望をもつためには批判し続けることこそが必要だ - Edward W. Said (1935-2003) 情報系の研究者が研究・論文執筆をする際に知らなくてはならない事 - naoeの日記 すぐに書こうと思っていたのだが,またもやxreaが重くなり始めて,投稿がままならなくて,ちょっと悩んでます.でも,早い段階で1人でも多くの人に広めておきたいので,簡単に紹介を.後日,ちゃんと書きます. そもそも,「情報系の研究者」を対象にした,論文の書き方や研究の仕方についてまとめた記事は見たことがないと思う.東大で学んだ卒論の書き方にしても,工学全般という感じだし,理科系の作文技術にしたって,実験系を対象にしている.確かに,一般的な意味ではとても有用で,役に立つところが多いのだが,情報系とい

    naoe
    naoe 2008/05/26
    取り上げていただき,ありがとうございます.
  • 情報系の研究者が研究・論文執筆をする際に知らなくてはならない事や心構え - naoeの日記

    そういえば,先週表題通りの勉強会を行いました. 自分のしょぼさを露呈することとなりますが,もしかしたら知らない人もいるかと思い, また,こういう情報は共有できたほうがいいかなと思い,公開しようと考えました. 内容としては,Googleが意外と使えてしまう昨今,サーベイするのにGoogleばかり使っている人を見掛けますが, それ以外の方法でサーベイを効率的にする方法を紹介しているものになっています. サーベイ論文の見つけ方,そこから効率のいい論文の検索方法,論文や文献の管理方法, 論文募集(CFP)の見つけ方等にフォーカスしてみました. 電子ジャーナルを使いましょう〜とかその辺.割とBiBTexを駆使した方法を紹介しています. 話の中身は慶應にあるサービスに特化した話が多いですが,一般の大学でも使えるところが多いのでは?と思います. で,勉強会の様子を試しにUstream.tvにて勉強会をU

    情報系の研究者が研究・論文執筆をする際に知らなくてはならない事や心構え - naoeの日記
    naoe
    naoe 2008/05/21
    自分用memo
  • Video Lectures - naoeの日記

    http://videolectures.net/ SOIとかGlobal Campusみたいに 講義を配信している. これはすばらしい. SVMとかSemi Supervised Learningとかも,とにかく色々あるぜよ〜〜

    Video Lectures - naoeの日記