タグ

2010年6月23日のブックマーク (6件)

  • 31データクレンジング方法

    データマイニングでは、データが膨大となっている場合があります。ここまでデータ量が大きくなると計算量の問題で解析時間がかかりすぎるという問題が起き、色々なデータマイニング技法を試行することができません。 それでは、大規模データに対抗するためにどうしたらいいでしょう?  今、著者が思いついたものを挙げてみると 1.高速なマシンに期待する 2.大規模でも計算する手法を編み出す 3.仮説を立てて絞り込んで挑戦 4.サンプリングして、そこそこの量のデータで試す 5.それでもじっくり処理が終わるのを待つ ということをとりあえず思いつきました。(他にある場合は教えてください) それでは、以上の項目をデータマイニングとして検討してみましょう。 【1番:高速なマシンに期待する】高速マシンに投資することは基的に有効です。30年前の計算機ではどうやっても不可能であった計算処理であっても技術

  • 自宅でできるやり方で論文をさがす・あつめる・手に入れる 読書猿Classic: between / beyond readers

    100冊読む時間があったら論文を100「解剖」した方が良い 読書猿Classic: between / beyond readers の続きというか、補遺。 大学等に所属してる人は、そこの図書館と契約してる有料データベースを駆使されたし(使い方はガイダンスがあったりするし、図書館のレファレンスでも教えてくれるだろう)。っていうか、言うまでもないだろ、そんなことは。 ここではフリー(市井)の人が使える手を考える。手はたくさんあるが、いっぱいあっても混乱するだろうから、少しだけ。必要なら追記していく。 とりあえず3つのケースに分けてみた。 1.読みたい論文が決まっている、タイトルも分かっている 2.読みたい分野、知りたいジャンルくらいは決まってる 3.何からはじめればいいのか、さっぱりわからん 番外.論文なんて屋で買えるぜ 1.読みたい論文が決まっている、タイトルも分かっている A.まずは

    自宅でできるやり方で論文をさがす・あつめる・手に入れる 読書猿Classic: between / beyond readers
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

  • データマイニングの宝箱

    データマイニングに関することを、データの集め方から知識の獲得まで、幅広く丁寧に解説しています。データマイニングで用いられる知識発見技術は、バスケット分析・決定木・ニューラルネットワークなど多くの手法があります。だからといって全部を同時に利用することは考えられません。解析手法はそれぞれの役割があり、その目的に合わせて使い分けなければなりません。 それぞれの役割があると書きましたが、大きくわけると2つのタイプがあると思います。「データから質を探る」タイプと「データから未知の現象を予測する」タイプです。 この章では、「データの洗浄」から「知識発見の方法」を交えて知識発見を考えてみます。

  • http://repo.lib.nitech.ac.jp/handle/123456789/602

  • ゲームAIコンペティションの新展開

    IGDA日のアカデミックブログです。研究・教育・人材育成・学会動向といった学術系情報を発信・蓄積していきます。ゲーム産業における学から産の、風とおしのよい窓口になればと思います。学術活動の情報発信でIGDA日に協力して頂ける方は、IGDA日(academic(アットマーク)igda.jp)担当山根までご連絡ください。また、ゲーム関係者は、是非、ご講読して役立ててください。また気軽にコメントください。それでは、よろしくお願いします。 ※このサイトに書かれている内容は、各執筆者の個人的な意見・見解であり、IGDA日の公式な意見ではありません。 近年,世界各地の研究機関がデジタルゲームAIプレイヤーを開発しては順位を競っている.IGDA日でもこれまでにSIG-AIでパックマンについて,SIG e-sportsでStarCraftについて紹介している.稿ではこの動向を研究者集団の視点