まえがき 先日、あるパーティで年上の研究者の方と久しぶりにお話しする機会があった。 同氏:「加藤さんはいつも楽しそうに研究しているようでいいですね。」 私:「そう見えますか。とすれば嬉しいことです。そうありたいと、そう見えるように努力しているんですよ。」 「競争と評価」の時代 最近、大学・研究機関の公的研究費は、競争的外部資金と呼ばれ、数倍から数十倍の競争率で激しく競争することが求められる。厳しい競争をくぐり抜けて採択された後も、中間評価を何度もされ、最後に事後評価がなされ、評価結果はインターネット上で公開される。 厳しい財政事情の中、他の予算に比して相対的に、科学技術予算は優遇されていると言われている(国際的に見れば、優遇されているとは言えないが)。それはおそらく、平成7年に制定された科学技術基本法のおかげである。これを実現するために、科学技術基本計画が5年ごとに定められ、さまざまな科学
家に帰ってまとめブログを書くまでが勉強会です。 チームラボにてレコメンデーションアルゴリズム勉強会を開催しますので、是非オフィスに遊びに来てください : ATND ビッグサイトの就活イベントや同人イベントガン無視でチームラボで開催されたレコメンデーションアルゴリズム勉強会に行ってきた。 流れは上にあるとおりで何人かの発表があったのだけれど、やっぱり話題になるのはNetflix prizeでのあれですよ、あれ。 netflix prize is over, 時間経過による嗜好性の変化: DO++ Yehuda Koren, ”Collaborative Filtering with Temporal Dynamics ”, KDD 2009 SVD→SVD++→timeSVD++の流れで一人が話してしまったら後の人が被りまくりになるというアレな事態になってて、こういうどマイナーというかニッチ
協調フィルタリングとはAmazonのお勧めのように「この商品を購入した人はこんな商品も購入しています」という情報を用いて推薦をする手法です。グラフィカルモデルはベイジアンネットワークとも呼ばれ、最近一部で流行している機械学習の手法です。今回は、協調フィルタリングをグラフィカルモデルで表現したらどのようになるだろう、と考えて思いついたアイデアを紹介します。 今、ユーザuとアイテムiの組{u,i}のデータが大量に与えられているとします。例えばソーシャルブックマークならユーザとブックマークしているページの組み合わせ、E-commerseならユーザと購入した商品の組み合わせ、などです。ここではSBMを例に考えるので、はてブと同様にユーザはマイナスの評価を付けることはできないものとします。 このときユーザuに対してお勧めのページを推薦することを考えると、ユーザuがまだブックマークしていないページiに
昨日ありました、PFIでのセミナーでの発表資料です。 研究開発のチームの紹介の後に、2009年サーベイした論文の中で面白かった論文を 機械学習、データ構造、画像処理で紹介してます 紹介した話は - Multi-class CW (Multi-class Confidence Weighted Learning,) - AROW (Adaptive Regularization Of Weight Vector) - Online-EM algorithm - 全備簡潔木 (Fully-functional Succinct Tree) - 圧縮連想配列 (compressed function) - PatchMatch です。 #資料中の簡潔木の表現方法のDFUDSの紹介でtxも使用と書いてあるのは、公開しているtxでは、 LOUDSのみをつかっていますので正確ではありませんでした。これ
SimStringという類似文字列検索ライブラリをBSDライセンスでリリースしました.類似文字列検索とは,文字列集合(データベース)の中から,クエリ文字列と似ているものを見つけ出す処理です.コンピュータは,正確に一致する文字列を探すのは得意ですが,表記揺れに出くわすと,途端に対応できなくなります.例えば,「スパゲティ」に対して,レストラン情報などを返すサービスにおいて,「スパゲッティ」や「スパゲティー」などの表記揺れが検索クエリに与えられると,通常のデータベースでは情報を提示することが出来ません.類似文字列検索を用いると,表記揺れが検索クエリに与えられても,「スパゲティ」という既知語を代替クエリとして提案したり,「スパゲティ」の情報をダイレクトに引き出すことができるようになります. 似てる語を探す技術って,文字列処理の基本中の基本で,自然言語処理では当たり前のように使われていてもおかしくな
学者ならずとも、データを使って考察したり、仮説を検証する機会はあるもの。コンピュータ技術の発達により、面倒なデータ集計や難しい計算は、すべてコンピュータにお任せできるわけですが、「その結果から、何を読み解き、どう考えるか?」はヒトが担うべき重要な役割ですね。こちらでは、統計のスペシャリスト直伝のデータ活用術をご紹介しましょう。 統計学の博士課程に在学しているNathan Yauさんは、数々のデータ分析の経験から、データを活用するコツとして、以下のようにまとめています。 細部に注目する データ分析では傾向やパターンにばかり目がいきがちだが、同様に「異常値」にも注目することが大切。見逃している視点がここに潜んでいることも。 大局で捉える データひとつひとつを別々に捉えるのではなく、データひと塊をザクっと捉えて、大きく考えることを心がけよう。 予断を持たない データ分析は可能な限り客観的に行うべ
Bayesian Sets (Ghahramani and Heller, NIPS 2005)は Google Sets と同じようなことをベイズ的に行うアルゴリズムです。 いくつかアイテムを入れると, それを「補完する」ようなアイテムを 返してくれます。 これは NIPS の accepted papers が出た去年の8月から気になっていて, 本会議ではオーラルの発表もあって大体のやっていることはわかった ものの, 何と(本会議の時も!)論文がなく, 直接Hellerに連絡して もらえるように頼んでいたところ, Online proceedings の締切りがあった 時に連絡があって, 読めるようになりました。(リンクは下のページ参照) 岡野原君に先に 紹介 されてしまいましたが, 以下は, 岡野原君が書いていない話。 Bayesian Sets は, アイテム集合 D に対して,
トップページ #=> 2009年5月1日 報告 1. はじめに RecSys08のTOCより「Session 2: Social Networks and Recommenders」「Poster」から関連があるのではないかという論文を抜粋し、Abstractを翻訳した。 ファイル「Abstract_Translation.pdf」 2. 論文 Tag Recommendations Based on Tensor Dimensionality Reduction ■テンソル次元削除に基づくタグ推薦 ソーシャルタギングの多くは、ユーザがキーワードの形でメタデータを加えるプロセスである。 そして、歌や絵、ウェブリンク、製品その他などに注釈をつけて分類を行う。 共同タギングシステムでは、他のユーザが同じ項目に対して、どのようなタグを使用したかに基づいて推薦を行う。 これは、項目の特
発表文献(論文誌) 総説・解説 国際会議 著書 Google Scholar DBLP 発表文献(論文誌) 小林由弥, 鈴木雅大, 松尾豊: 深層生成モデルによる背景情報を利用したシーン解釈, 人工知能学会論文誌, 第38巻3号, (2023). Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo: Robustifying Vision Transformer Without Retraining From Scratch Using Attention Based Test-Time Adaptation, New Generation Computing, (2022). Tatsuya Matsushima, Yuki Noguchi, Jumpei Arima, Toshiki Aoki, Yuki Okita, Yuya Ikeda, K
このページでは「WEB+DB PRESS Vol.49」に関する補足情報を公開しています。 サンプルファイルのダウンロード ■ご注意 ※ 本コーナーは,本誌記事参考用資料としてのご提供を目的としております。 ※ 本誌記載の内容およびサポートサイトで公開しているサンプルコードに基づく運用の結果について,記事の筆者,プログラムの作者/提供元,(株)技術評論社は一切の責任を負いかねます。ご自身の責任のもと,ご使用ください。 ※ 各サンプルファイル/ソースコードには,個別に,ライセンスやREADMEファイルなどで注意事項/制限事項が添付されている場合がございます。その場合,該当のライセンス,注意事項/制限事項を優先して適用とさせていただきますので,ダウンロード後,内容をご確認ください。 特集1「現場で役立つ DRYの基礎知識」 本特集で使用されたサンプルコード 特別企画「あの「オススメ」機能のしく
画像類似度に基づくリンク解析を用いた画像ランキング手法の比較検討: 山根 遥香, 豊田 正史(東大) Web検索サービスにおける多義的なクエリ推薦手法: 今井 良太(中央大), 戸田 浩之, 関口 裕一郎(NTTR&D),望月 崇由, 鈴木 智也(NTTレゾナント), 今井 桂子(中央大) ユーザの適・不適評価を用いたWebページ検索結果のリランキング: 松岡 研二, 范 薇, 小柳 佑介, 渡邉 豊英(名大) 部分木を利用した適合部分検索手法の一考察: 楊 斐, 清光 英成, 大月 一弘, 森下 淳也(神戸大) クエリに応じたファセットの動的抽出によるWeb画像検索結果の提示: 川野 悠, 大島 裕明, 田中 克己(京大) 知識共有サイトにおける参加者の貢献度に着目したコミュニティ分析手法: 佐藤 弘樹, 島田 諭(筑波大), 伏見 卓恭(静岡県立大), 福原 知宏(東大), 斉藤 和巳
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "情報検索" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2024年3月) 情報検索(じょうほうけんさく、英語: information retrieval)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像(動画)、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索[1]するためのコンピュータ側における仕組みを記述している。 情報検索に対する
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く