CAジャーナルクラブ Dremel: Interactive Analysis of Web-Scale DatasetsNaoyuki Yamada
Shogun - A Large Scale Machine Learning Toolbox This is the official homepage of the SHOGUN machine learning toolbox. The machine learning toolbox's focus is on large scale kernel methods and especially on Support Vector Machines (SVM) [1]. It provides a generic SVM object interfacing to several different SVM implementations, among them the state of the art OCAS [21], Liblinear [20], LibSVM [2], S
開催案内 配付資料 議事概要 イベント概要 日時:2009年3月5日(木) 14:00-18:30 会場:如水会館 スターホール (東京都千代田区一ッ橋2-1-1) 藤田 昌久 (RIETI所長・CRO) 情報技術の急速な発達は私たちの生活を大きく変化させてきている。これは我々研究者の研究方法、研究スタイルにどのような影響を及ぼすか。これが本日のテーマである。 ビジネスの現場に目を向けると、Eメールやインターネットの普及,これらがビジネスのやり方を大きく変えている。それ以外でも、POSデータや電子マネー、オンライントレーディングなどのビジネスのさまざまな現場で、情報通信技術が重要な役割を担うようになってきている。 研究者の観点から注目すべきは、ここで蓄積される電子情報である。たとえば、POSデータには、あるコンピュータで何時何分何秒にどのような人が来店し、何をいくらで何個購入したかが、すべ
共起尺度について説明します。 共起とは、まさに ある一組の「共に起きる」程度を表したものです。 例えば、 amazonで本を検索するときに、 この商品を買っている人は、この本も買っています と紹介されますが、それは、過去の購買データから、 共起が高い商品を勧めているのです。 共起尺度として、 主なものは、 共起頻度、Jaccard係数、Simpson係数、コサイン距離があります。 これらの指標について、「X」と「Y」という一組の共起性がどう測られるか示します 「X」と「Y」の単独での出現数を|X|、|Y|、 どちらか一方が出現した回数を|X∪Y|、 両方が出現した回数を|X∩Y|とします。 A)共起頻度 共起の回数であり、 |X∩Y|で計算される。 B)Jaccard係数 どちらかが出現したうち、何回同時に出現するかで、 |X∩Y|/|X∪Y|で計算される C)Simpson係数 Jacc
2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0 ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x
★ 0/1データのクラスタリングについて ★ 7390. 0/1データのクラスタリングについて いちろう 2005/08/05 (金) 21:01 ├7392. Re: 0/1データのクラスタリングについて 青木繁伸 2005/08/05 (金) 21:50 │└7395. Re^2: 0/1データのクラスタリングについて いちろう 2005/08/05 (金) 22:16 └7391. Re: 0/1データのクラスタリングについて kzkishi 2005/08/05 (金) 21:47 ├7394. Re^2: 0/1データのクラスタリングについて いちろう 2005/08/05 (金) 22:06 │└7396. Re^3: 0/1データのクラスタリングについて にゃんちゅう 2005/08/05 (金) 22:19 │ └7399. Re^4: 0/1データのクラスタリングについて
現在の様々な世界的問題を解決していくためには, 科学技術を発展させていく以外に方法はなく, 科学技術こそが人類の共通文明となりうる資格を持っている. そして、科学技術というパンドラの箱を開けてしまった以上, それを発展させ、科学的知見に基づいて合理的に振る舞うしか, 人類が生存する道は残されていない. この考えに基づき,山下研究室では,人類福祉の向上を目指した技術開発, 人類に新しいものの考え方を提供する科学的知見の創造を目的として 研究を進めていくものである. 山下研究室では,上記の理念のもと,次のような研究を行っています. パターン認識・学習 画像符号化 計算機アーキテクチャ Text Oriented Bi-Stream Explanation (TOBE) System 以下では,それぞれについて,詳しく説明していきます. 専攻説明会での配布資料 パターン認識・学習 パターン認識は
人工知能学会 データマイニングと統計数理研究会 (SIG-DMSM) 第11回 発表募集 日程 2009年10月18日 (日) 場所 九州大学 医学部 百年講堂 (福岡市) 担当幹事 神嶌 敏弘 @ 産業技術総合研究所 連続開催 第12回情報論的学習理論ワークショップ (IBIS2009) 人工知能学会「データマイニングと統計数理研究会」は2006年に設立されました.本研究会は,データマイニングやデータサイエンスの理論や技術の研究・開発を目的としています.特に,機械学習と統計数理学的の両研究コミュニティの交流により,互いの技術・アプローチを融合した新たな手法の創出をめざしています. 第11回研究会を,2009年10月18日(日)に開催いたします.福岡市にて,情報理論・統計学・機械学習のワークショップとして長い歴史をもつ「第12回情報論的学習理論ワークショップ (IBIS2009)」と連続
オープンソースのSVMソフトウェアの基本デフォルトの設定で比較などをしてみた。 利用データはLIBSVM Data: Classification, Regression, and Multi-labelのa9aとnews20.binaryを利用した。 データセットの詳細は以下のようになっている データセット名 訓練データ数 テストデータ数 データの次元 a9a 32561 16281 123 news20.binary 15000 4996 1355199 なお、news20.binaryでの訓練データとテストデータの作成については id:n_shuyoさんの記事を参考にした。 比較に用いたソフトウェアは以下の5つ LIBSVM リンク SVM-Light リンク TinySVM リンク SVM-perf リンク LIBLINEAR リンク 測定結果は以下のようになった。パラメータの設定
重要日程 † 発表申込締切:2009年8月17日(月) 原稿提出締切:2009年8月31日(月) 参加事前申込み締切: 2009年9月 5日(土) ↑ 開催主旨 † 近年,これまで市場に興味を持たなかった一般の人々の間にも,金融市場への関心が高まっています.このような状況の中で,ファイナンス分野への人工知能技術の応用を促進するため,この研究会では,ファイナンスに関わる研究課題を広く対象とし,人工知能分野の工学系研究者と金融市場の現場で活躍されている技術者との交流を深めるとともに,新しい人工知能技術の創出を目指しています. 第3回研究会は,金融市場の現場で活躍されている技術者の方々が参加しやすいように都内で土曜日に開催し,招待講演を含む研究発表と懇親会を予定しております. また,口頭発表だけでなく,他の参加者からより多くの意見を集められるような場を設ける予定です. 人工知能学会の会員でなくて
igaiga 曰く、 "BioNewsFromNatureの記事によると、曲のサビをみつけてジャンプできる新しいプログラムを産業技術総合研究所の後藤真孝研究員が米国音響学会で発表した。 Celine Dionの「マイ・ハート・ウィル・ゴー・オン」や、Jon Bon Joviの「ユー・ギブ・ラブ・ア・バッド・ネーム」などのポピュラー音楽のヒット曲でサビからサビへとジャンプできることを実演したという。 このアルゴリズムは音程(ドレミ)ごとの強さを基に繰り返しを検出し、サビに相当する可能性が高い部分を選ぶ。 分析時間は4分の曲で約1分、また80%の曲でサビを正しく選び出した。 音楽を扱うアルゴリズムは自然科学などの分野に比べればまだまだ発展途上、面白いアルゴリズムが今後たくさん生まれてくるのかもしれない。"
The 4th International Workshop on Data-Mining and Statistical Science (DMSS2009)† このページはしましまがThe 4th International Workshop on Data-Mining and Statistical Science (DMSS2009) に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください. ↑ Efficient Exploration through Active Learning for Value Function Approximation in Reinforcement Learning† Takayuki Akiyama, Hirotaka Hachiya,
分布推定アルゴリズム。遺伝的アルゴリズムを改良した物です。個体の集合を交叉・突然変異させるのではなく、個体の生成確率を進化させます。最適化問題のアルゴリズムです。以下、自分へのメモです。わかったことが増えたら追記するかも。 ビットストリング 計算量に関しては、ビット数をn、反復数をTとしています。 Population-Based Incremental Learning (PBIL) http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.61.8554 http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.44.5424 http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.43.1108 Population-ba
主催 日本オペレーションズ・リサーチ学会 実践的データマイニング研究部会 協賛 チームラボ株式会社 人工知能学会 経営情報学会関西支部 ビジネスマイニング研究センター有限責任事業組合 趣旨 近年、B2Cの飛躍的な増加に伴い、WEB上での消費者の購買履歴や行動履歴を容易に、かつ大量に蓄積することが可能となり、それに伴って究極的なワンツーワン・マーケティングが可能になりつつあります。その1つのアプリケーションとして、顧客に対する適切な商品や行動の推薦を目的としたリコメンデーションシステムの導入が盛んに行われています.リコメンデーションシステムのアルゴリズムは,これまでに様々なものが研究提案されてきてはいるものの,ビジネスにおける実践という面から見ると,それらの研究成果が産業会に十分に還元できているとは言えない状況でしょう.そこで,実データに基づいたリコメンデーションコンテストを実
第12回情報論的学習理論ワークショップ (IBIS 2009) 2009年10月19日(月)-21日(火) 九州大学医学部 百年講堂 日時: 2009年10月19日(月)-21日(水) 場所: 九州大学医学部 百年講堂 参加費:参加費は無料です。参加申し込み方法は追ってここに記載します。 発表申し込み締切: 2009年9月4日(金) 連続開催:2009年10月18日(日)に開催予定のデータマイニングと統計数理研究会(DMSM研究会) との連続開催とする予定です。 開催趣旨 情報論的学習理論ワークショップ(略称IBIS; Information-Based Induction Sciences)は、情報理論、統計学、統計物理学、計算機科学など、広い意味で機械学習に関係する分野の学際理論フォーラムを作ることを目指し、1998年に産声をあげました。それ以来、参加者の方々の質の高い発表に
The annual ACM SIGKDD conference is the premier international forum for data mining researchers and practitioners from academia, industry, and government to share their ideas, research results and experiences. KDD-08 will feature keynote presentations, oral paper presentations, poster sessions, workshops, tutorials, panels, exhibits, demonstrations, and the KDD Cup competition. News 26 September 2
Where People and Computing Connect Informatics shapes the way we use technology and computing to improve how we work, live, and play—expanding the potential of business, art, health care, law, environmental sustainability, smart cities, and everything you can imagine. Learn more about us 2018 grads already giving back by establishing a new SoIC scholarship Mikaylah Gross (BS Informatics ‘16 and MS
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く