タグ

ブックマーク / www.mtoyoda.com (23)

  • 修士1年の皆さんがWebDB Forum 2014に投稿するべき7つの理由 - 豊田正史のSLとは関係ございません(2014-06-23)

    _ 修士1年の皆さんがWebDB Forum 2014に投稿するべき7つの理由 第7回 Webとデータベースに関するフォーラム(WebDB Forum 2014)のプログラム委員長を務めております豊田です。Webやデータベースに関連のある研究分野にいる方はぜひ投稿を検討していただきたく思います。今回のWebDB Forumでは、特に修士1年の皆さんの投稿を期待しているのですが、この記事ではその理由を述べたいと思います。今後の進路を考える上でも是非参考にしてください。 _ 1. 修士1年の夏は、修士論文のテーマをじっくり考えられるまたとない機会です。この時期に読んだ論文の数や、考えた時間、こなした実験の数が修士論文のクオリティを決めると言っても過言ではありません。しかし、目標がなければだらだらと勉強をしてしまいがちです。8月末締め切りのWebDB Forumは、夏の目標とするのにぴったりの会

    修士1年の皆さんがWebDB Forum 2014に投稿するべき7つの理由 - 豊田正史のSLとは関係ございません(2014-06-23)
    morioka
    morioka 2014/06/23
  • WebDB Forum 2009 - 豊田正史のSLとは関係ございません(2009-11-19)

    _ [学会] WebDB Forum 2009 WebDB Forum 2009に参加してきたので、座長をしたセッションの様子を書いておきます。長尾先生と大向さんの講演とか、パネルセッションとかまだ色々あるのですが、力尽きた... セッション1A: 情報推薦・検索支援    座長:豊田 正史(東大) 「地域限定性を考慮した情報推薦方式に関する基礎検討」奥 健太, 服部 文夫(立命館大学) 旅先の地域検索で、自分の地元にあるような店が出てきてもうれしくない。地元のキーワードに対してIDF的なペナルティを与えて検索する地域に特徴的なキーワードをランキングできるように工夫。地元でやるのと全国でやるのとどの程度差が出るかな。 「閲覧者を用いた検索とコミュニケーションによるWeb情報収集支援システムの提案」松井 優也, 河合 由起子(京都産業大学) 検索結果をページの現在の閲覧人数を考慮してリアルタ

    WebDB Forum 2009 - 豊田正史のSLとは関係ございません(2009-11-19)
    morioka
    morioka 2009/11/22
  • WWW2009のサーベイ@情報爆発キックオフ - 豊田正史のSLとは関係ございません(2009-05-14)

    _ [学会] WWW2009のサーベイ@情報爆発キックオフ 情報爆発のキックオフミーティングでWWW2009の15分サーベイという無謀な試みをやらされたので、発表資料を以下に置いてみます。キーノート2、論文数の多い3セッションから流行りを抜き出すため、タイトル、アブストをタグクラウド化してトレンド論文をリストアップ。いくつかの論文についてちょっとだけ紹介。と言う形にしました。全体的に、Yahoo!, MSの論文が多く、ちょっとおもしろ目のアイデアを、検索エンジン会社の実データで実験してしっかり評価するという論文が多く通っている印象です。大学の教員が企業を兼務していたり、インターンの学生が検索エンジン会社に行って仕事したのをまとめていたりと、企業と大学の連携がうまくいっているということでしょうね。 WWW2009survey.pdf

    WWW2009のサーベイ@情報爆発キックオフ - 豊田正史のSLとは関係ございません(2009-05-14)
    morioka
    morioka 2009/05/14
  • 査読システムの破綻 - 豊田正史のSLとは関係ございません(2009-05-09)

    _ [研究] 査読システムの破綻 もっと緻密な議論が他にあるはずですし、当たり前の結論になってしまうのですが一応書いてみます。100人の研究者コミュニティがあったとしましょう。1人の研究者が年間平均kの査読付き論文を投稿するとします。論文1の採否を判定するためには査読が平均s必要です。コミュニティの中で実際に査読をしている人の割合はaだとしてみましょうか。さて、1人の査読者が年間に行う査読数は何になるでしょうか(単位をサドークとでもしてみましょうか)。単純に計算すると k * s / aですね。実際の数値はなかなか推測しにくいのですが、乱暴にk=4, s=2.5, a=.3としてみます。結果は約33サドークです(もっとしてるぞという方もいるかと思いますが。。。)10日に1は査読している計算ですね。これが意味するところは、1人の研究者が3カ月以上かけた仕事を10日をはるかに下回る

    査読システムの破綻 - 豊田正史のSLとは関係ございません(2009-05-09)
    morioka
    morioka 2009/05/11
  • レンコンと情報信憑性 - 豊田正史のSLとは関係ございません(2009-03-26)

    _ [研究] レンコンと情報信憑性 ある日の話。母親が「煮ると黒くなってしまうレンコンがあるがべても大丈夫なのか検索エンジンで調べてみた」と言う。おお、とうとうそんなことができるようになったかと感動しつつ続きを聞くと、「大丈夫と書いてあるページが見つかったが、よく見ると普通の人が書いている。専門家の書いたものは見つからず信じて良いものかわからない」とおっしゃる。確かにそうだよねえ、うーんと唸ってしまった。素人が何人OKと言っても一人の専門家の言葉にはかなわないこともある、という至極当たり前の話ではあるのだけれど、どこかの農学部の先生が大丈夫と書いていたとしてもそれを信じて良いのかという疑問もあるしなあ。結局この手の話は、情報処理で何とかできるものではないよね、というと某所からお叱りを受けるだろうか。かといって、知識を集積する適切なソーシャル的仕組みを作ればよいかというと、現状ではWiki

    レンコンと情報信憑性 - 豊田正史のSLとは関係ございません(2009-03-26)
    morioka
    morioka 2009/03/29
  • 冬入試やります: 東京大学 情報理工学研究科 電子情報学専攻 - 豊田正史のSLとは関係ございません(2008-11-11)

    _ [大学] 冬入試やります: 東京大学 情報理工学研究科 電子情報学専攻 私は、東大の生産技術研究所所属ですが、大学院では情報理工学研究科の電子情報学専攻というところに属しています。生産研は大学院から学生を取るのですが、修士や博士から、私のボスであるK研究室や私の研究室に入る場合には、この専攻の入試を受けることになります。 さて、夏の入試はとっくに終わったわけですが、この電子情報学専攻では冬にも日人、留学生、社会人を対象とした入試を行います。入学は来年の4月です。このブログを見ていて、4年生または修士2年生で、まだ進路が決まっていない人はほとんどいないかと思いますが、ダメもとで宣伝します。我と思わん方は是非挑戦してみてください。また、お近くに該当しそうな方がいたら伝えていただけますと幸いです。 ・出願期間: 平成21年1月5日(月)〜9日(金) ・試験期間: 平成21年2月2日(月)〜

    冬入試やります: 東京大学 情報理工学研究科 電子情報学専攻 - 豊田正史のSLとは関係ございません(2008-11-11)
    morioka
    morioka 2008/11/12
  • 生産研公開 - 豊田正史のSLとは関係ございません(2008-05-29)

    _ [大学] 生産研公開 今日から3日間、木金土と生産研のオープンハウスが行われます。 生研公開 2008(駒場リサーチキャンパス公開)

    生産研公開 - 豊田正史のSLとは関係ございません(2008-05-29)
    morioka
    morioka 2008/05/30
  • リンクスパムの分布図 - 豊田正史のSLとは関係ございません(2008-03-05)

    _ [研究] リンクスパムの分布図 PageRankのようなリンクに基づく検索結果ランキング手法を騙そうとする行為をリンクスパムと呼びます。大量にドメインを確保したり、業者同士で結託したりして、密なリンク構造を構成するのが簡単な方法です。日語ウェブアーカイブから、そのほんの一部を抽出してグラフ構造を可視化すると以下のようになります(丸はサイトの集合で、線はサイト集合間のリンク)。真中のグレーの丸は、ウェブグラフの中心にあたります。これは全サイトの3分の1くらいが含まれる巨大な強連結成分で、良いサイトも悪いサイトも山ほど含まれています(中の数字は、含まれるサイト数)。その周りに浮遊している黒い丸が、スパムサイトからなる強連結成分です。1つ1つに数百から数千の相互に強く結びついたスパムサイトが含まれています。スパムの強連結成分同士がまた密な構造を作っていてなかなか興味深い図になっています。昨

    リンクスパムの分布図 - 豊田正史のSLとは関係ございません(2008-03-05)
    morioka
    morioka 2008/03/06
  • WISS2007とANA欠航 - 豊田正史のSLとは関係ございません(2007-12-08)

    _ [学会] WISS2007とANA欠航 12/5から12/7に長崎で行われたWISS2007に参加してきました。あみぐるみ作成支援、大量写真閲覧、音楽リミックス、グラフ可視化、GUIデバッグ支援、実世界、植物I/O、テーブルトップ、風I/O、ペンインタフェース、携帯で貸し借り支援、ウェブ情報で音楽視聴支援、ちらし商品画像追跡、などなど相変わらず多彩です。このごった煮感はWISSの良いところではあるのですが、個々のネタがますますニッチになりすぎたように思います。そろそろ王道回帰の時期ですよきっと。 会議を堪能していざ帰ろうと言う時に大トラブルが発生しました。19:30発ANA便が、コックピットの不具合で欠航になったのです。Y先生、M先生、S先生に助けて頂き、ANAの用意した諫早のホテルにたどり着いたのが11:30、翌朝9:40の便でようやく帰ってくることができました。ANAの運行情報によ

    WISS2007とANA欠航 - 豊田正史のSLとは関係ございません(2007-12-08)
    morioka
    morioka 2007/12/09
    21世紀に入ってから、WISSはそんな感じ。インタラクションもだが。
  • DBWeb2007 暦本さん、椎尾さんの講演 - 豊田正史のSLとは関係ございません(2007-11-28)

    _ [学会] DBWeb2007 暦さん、椎尾さんの講演 今回のDBWebは生産研が会場で、暦さん、椎尾さんの講演があるとなっては行かねばと言うわけで、いろいろヤバイのに聴きに行きました。暦さんはデータベースとfolksonomyに引っ掛けてPlaceEngineの話。基地局位置推定の手法を詳しくやってくださったので、いろいろすっきりしました。信頼できる少数の基地局位置情報に加えて、多数のユーザのクエリから基地局間の位置制約を生成して、制約解消問題に落とすのですが、信頼できる位置情報が1%程度でもうまくいくというのが興味深いところです。ただその1%の分布はできるだけ一様にする必要がありそう。最近高木さんが基地局所有者のプライバシーを問題にしていましたが、それについてもちょっとお聞きすることができました。ロガーに特化したPlaceEngineはフリスクの箱より一回り大きいくらいのサイズ

    DBWeb2007 暦本さん、椎尾さんの講演 - 豊田正史のSLとは関係ございません(2007-11-28)
    morioka
    morioka 2007/11/30
  • 大学院講義「ウェブ工学」のネタ選び - 豊田正史のSLとは関係ございません(2007-08-13)

    _ [大学] 大学院講義「ウェブ工学」のネタ選び 10月開講の「ウェブ工学」で何をネタにするかそろそろ考えなくてはいけない。ウェブ工学ってなんだってのはひとまず置いておいて、ウェブ関係のネタで研究ができるようになることを目標とし、それに必要な基礎知識はなにか、というあたりから考えていくことにしよう。とりあえず思いついたものから挙げてみる。 The Anatomy of a Search Engine まずは、これを読めるような基礎知識を教えないといけないだろう。これの後に、この手のサーチエンジンアーキテクチャ論文ってあるのかな?あ、Anna Pattersonの記事とかあったなあ。 Tech Report: SRC-RR-175: The Link Database: Fast リンクデータベースの作り方。PageRankやHITSなどを実際にウェブのスケールで計算しようとするとこのあたり

    大学院講義「ウェブ工学」のネタ選び - 豊田正史のSLとは関係ございません(2007-08-13)
    morioka
    morioka 2007/08/16
    10月から東大で。聴講したい...
  • AIRWeb 2007 - 豊田正史のSLとは関係ございません(2007-05-08)

    _ [学会][WWW2007] AIRWeb 2007 この日はAdversarial Information Retrieval on the Web (AIRWeb'07)に参加。ホームページで全論文が公開されている。以下ピックアップ。 Splog Detection Using Self-similarity Analysis on Blog Temporal Dynamics Yu-Ru Lin, Hari Sundaram, Yun Chi, Junichi Tatemura and Belle Tseng ポストの時間分布、内容・リンク先の自己相似性でsplogを判断する。時間情報を利用するのがちょっと新しい。ただ若干ナイーブな手法なのでだますのは簡単そう。 A Large-Scale Study of Link Spam Detection by Graph Algorith

    AIRWeb 2007 - 豊田正史のSLとは関係ございません(2007-05-08)
    morioka
    morioka 2007/05/14
  • 第2回 ウェブリンク解析の会 - 豊田正史のSLとは関係ございません(2007-04-20)

    _ [研究] 第2回 ウェブリンク解析の会 脇田さん、宇野さん、近藤さんらとなんとなくはじめた会ですが、今回NTTの風間さん、NICT/ATRの湯田様、藤原様、東工大村田先生、に御参加いただき20名弱での開催となりました。2回目にして意外な大所帯になってしまいました。 湯田様からは、mixiのネットワーク解析と最近の話を少々していただきました。mixiの知り合いネットワークの直径は6程度であり、スモールワールドっぽい。ネットワークをNewmanらの手法でクラスタリングすると、サイズ対クラスタ数の累積割合においてサイズ百から数百の間にほとんどクラスタの存在しない領域(スキップ、ギャップ)がある。この傾向は、高い次数のノードを削除しても変わらない。ネットワーク成長モデルに一定のランダム性を導入すると、べき分布からかなりスキップのある分布の間をカバーでき、その中間あたりにmixiの分布があること

    第2回 ウェブリンク解析の会 - 豊田正史のSLとは関係ございません(2007-04-20)
    morioka
    morioka 2007/04/24
  • 大航海公募結果, 大航海公募結果についてのITproの記事 - 豊田正史のSLとは関係ございません(2007-04-17)

    _ [業界] 大航海公募結果 モデルサービスの開発と実証に関する公募結果が13日に出ていたことに今頃気が付きました。ドコモと日航が採択されたようです。どんなモデルサービスを開発するのか気になりますね。ところで勘違いされている方がいると困るので一応書いておきますと、私は公募関連については一切関知していませんし、このあたりの開発にたずさわることもありません。 公募(METI/経済産業省) _ [業界] 大航海公募結果についてのITproの記事 以下の記事には、計画されているサービス内容まで書かれてますね。ドコモの「行動連鎖型検索エンジン」はコンシューマ寄りですが、行動履歴を使われるのにはちょっと抵抗のあるところ。ロケーションアウェア、履歴利用検索なんてのは相当昔から言われていることではあるのだけど、ドコモの持ってる膨大な履歴データがあればなにか新しいことができそうなのでしょうか。一方日航のはか

    大航海公募結果, 大航海公募結果についてのITproの記事 - 豊田正史のSLとは関係ございません(2007-04-17)
    morioka
    morioka 2007/04/18
  • 英語クエリに対する検索結果の違い - 豊田正史のSLとは関係ございません(2007-04-03)

    _ [業界] 英語クエリに対する検索結果の違い 例えば、"lucene"を、google.co.jpとyahoo.co.jpで検索すると、Googleでは日語のlucene紹介ページがトップに、Yahoo!ではluceneの英語オフィシャルサイトがトップに出てくる(以下参照)。 lucene - Google 検索 Yahoo!検索 - lucene 英語のオフィシャルサイトを探そうとするときには、Googleの結果は日にローカライズしすぎていてフラストレーションがたまる。2ページ目、3ページ目に行っても、オフィシャルサイトを出してくれないので、「ウェブ全体から検索」をチェックして検索しなおさないといけない。これが結構手間なのである。日人にとっては日語サイトの方が好まれそうなのではあるが、オフィシャルサイトくらいは最初のページに出しても良いのではないか。この点、Yahoo!は適度に

    英語クエリに対する検索結果の違い - 豊田正史のSLとは関係ございません(2007-04-03)
    morioka
    morioka 2007/04/08
  • 今日の症状, ウェブリンク解析の会 - 豊田正史のSLとは関係ございません(2007-02-26)

    _ [花粉症] 今日の症状 起床時に鼻づまりの発作も1時間ほどで治まる。日中は特に症状なし。 _ [研究] ウェブリンク解析の会 東工大の脇田さん、学情の宇野さん、合原研の斎藤さん、たまたま居合わせたLunascapeの近藤さんらと謎の勉強会を開きました。脇田さん、宇野さんは、東工大時代に同じ学科にいらした方々で、研究テーマはだいぶ違っていたはずなのですが、なぜか最近別々な方向から急接近してきていたため、一度集まってお話したいなあと思っていたのでした。予想通り大変刺激的な会になりました。 脇田さんにはClauset, Newman, Morganによるグラフの階層クラスタリングアルゴリズムの高速化の話をして頂きました。グラフ全体の構造を見て効率的な合併が行われるようエッジウェイトの調整を行っていて、なぜかそうしたほうが最終的なmodularityも高くなるそうです。 宇野さんからは、擬似ク

    今日の症状, ウェブリンク解析の会 - 豊田正史のSLとは関係ございません(2007-02-26)
    morioka
    morioka 2007/03/01
    曰く"最近の論文ではタグを検索やクラスタリングに使うことには否定的な結果が出ていたような気がします。 "
  • 豊田正史のSLとは関係ないけどさ - 講演内容を詳しく紹介していただきました

    _ [研究] 講演内容を詳しく紹介していただきました 先日風間さんに呼ばれて研究会で講演をしましたが、そのときの様子を風間さんが紹介してくださっています。大変詳細で感動しました。ありがたいことです。風間さんどうもありがとうございます。 Cafe Babe - 招待講演「大規模Webアーカイブの時空間分析とその実際」 これを見たょゎさんという方が、WWW2006で発表した論文を読んでくださったようで、概要を紹介して頂きました。ちょっとご期待からは外れていたようですが、なにかヒントにはなりそうとの感想を頂きました。これもまた大変ありがたいことです。つまんねーとか書かれなくてよかったあ。 xe-kdoo(2007-02-11)

    豊田正史のSLとは関係ないけどさ - 講演内容を詳しく紹介していただきました
    morioka
    morioka 2007/02/14
  • 佐々木俊尚「次世代ウェブ グーグルの次のモデル」 - 豊田正史のSLとは関係ございません(2007-01-30)

    _ [] 佐々木俊尚「次世代ウェブ グーグルの次のモデル」 遅ればせながら読了。やはりしっかり取材がしてあるは参考になります。情報大航海についても書いてあって、珍しく好意的。もうあらかた書評などは出尽くしているだろうから特に書くこともないのだけど、出てきた興味深い企業をちょっとメモ。 Luke19 〜ルーク19〜,サンプル百貨店:登録ユーザの個人情報を用いて、適切なターゲットに商品サンプルを送る。サンプル提供企業から集金。 株式会社クインランド-The Very Your Life-,Qcam:おせっかいなナレッジマネジメント,NIA-MUC:車に関する集合知,DMES:マーケティング支援B2Bサービス,Qlep:地域ポータル「らくらくカンタン更新システム」,Glep:ゲーム情報ポータル。加盟店の在庫をECで共有 質問するならOKWave,荒らしに社長が電話 幸運体質マガジンageUN

    佐々木俊尚「次世代ウェブ グーグルの次のモデル」 - 豊田正史のSLとは関係ございません(2007-01-30)
    morioka
    morioka 2007/01/30
  • 招待講演@知能ソフトウェア工学研究会(KBSE)&知識ベースシステム研究会(JSAI-KBS) - 豊田正史のSLとは関係ございません(2007-01-22)

    _ [学会] 招待講演@知能ソフトウェア工学研究会(KBSE)&知識ベースシステム研究会(JSAI-KBS) という研究会で「Web情報処理」という特集があり、某風間さんに呼ばれて招待講演をしてきました。「大規模Webアーカイブの時空間分析とその実際」という怪しげな題目で、デモを交えつつ1時間ほど。だいたいこれまでのWeb関係の仕事のダイジェスト版ですが、ちょっとだけ実装よりの話も入れました。使ったスライドは以下においてあります。 kbse-jsai-kbs.pdf

    招待講演@知能ソフトウェア工学研究会(KBSE)&知識ベースシステム研究会(JSAI-KBS) - 豊田正史のSLとは関係ございません(2007-01-22)
    morioka
    morioka 2007/01/25
  • にわか自然言語処理 - 豊田正史のSLとは関係ございません(2006-08-19)

    _ [開発] にわか自然言語処理 適当な文書集合における単語の共起グラフを表示するなんていう古典的なことを試してみた。いろんな人がやっているので、ちょっとうちのデータで見てみたくなって。やっぱり当たり前な結果がでるのだが、見ていると案外面白い。この手のは応用が微妙なことが多いけど、なんか使い道はないもんかな。

    にわか自然言語処理 - 豊田正史のSLとは関係ございません(2006-08-19)
    morioka
    morioka 2006/08/24