サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ブックレビュー
thetocotonist.hatenadiary.org
14:55〜15:25 講師: 江原 遥さん(blog) 所属:東京大学 情報理工学系研究科 博士課程 講演タイトル:SocialDict - 英文Webページのスマートな注釈・辞書引きシステム 資料upあり videoあり 講演概要 私はSocialDictという英文Webページのスマートな注釈・辞書引きシステムを作成しています。どのようにスマートかというと、利用者の英語力を利用者が注釈の必要な箇所をクリックしたログから推定し、Webページ中のわからなさそうな単語をあらかじめ辞書で引いておいてくれる点がスマートです。推定には、TOEFLやTOEICで使われているとされる項目反応理論と等価な手法である対数線形モデルを用いています。 現在は、まだα版なのですが、9月頭あたりから開発時間が取れるので、発表までには、ある程度完成させ、下記URLにて公開できればと思います。 http://soci
このセッションを聴くmotivationも高かったです。 14:30〜14:55 講師: malaさん(blog, blog about tech.) 所属:株式会社ライブドア ブログビジネスユニット 開発グループ マネージャー via h 講演タイトル:Livedoor clip おもしろ大改造計画 資料upなしかな videoあり 講演概要 SBMにおいてソーシャル性を加速させるためには、参加ユーザがいま何を見て 何を考え 何を感じているのかをリアルタイムに共有する仕組みがカギになります。これを支える重要な技術となる“イベント通知API”の実装を、livedoor クリップの今後の進化の方向性などともからめてお話します。 以下は私のメモです。 イヴェントサーバをつくって、リアルタイム情報を取得・表示する デモが面白い Streaming API Realtime UI WebHook
13:45〜14:15 所属:東京電機大学 未来科学部 講演タイトル:言語表現に基づくブックマークコメントの分類とフィルタリング 資料upあり videoあり 講演概要 ブックマークコメントは、コンテンツの制作者にとっても、コンテンツの閲覧者にとっても、気になる存在である。しかし、コメントの内容は多種多様で、読みたいものはその一部であるため、何らかのフィルタの導入が有効であると考えられる。 ここではコメントの内容を言語表現に基づき分類し、目的別にフィルタリングする手法を紹介する。 以下は私のメモです。 はてブコメントを色んな側面から、内容を分類して解析 要約・引用コメント 意見・感想コメント 評価 疑問 予想・希望 自然言語処理にこだわった解析 Q&A 引用の著作権の扱いは?新聞社によってはdeep linkを禁止している(M日新聞など) その辺は厳密には考えてはいない タグで会話する う
私の一番のmotivationはこのセッションでした。 11:00〜11:50 講師: 岡野原 大輔さん(blog, twitter) 所属:株式会社プリファードインフラストラクチャー(PFI)特別研究員, 東京大学辻井研, 辻井研の論文 講演タイトル:SBMの推薦アルゴリズム 〜はてなブックマークのレコメンド(関連エントリ)の仕組み〜 資料upあり videoあり rf. はてなおやさんの資料 講演概要 本発表では、SBMの推薦アルゴリズムにおける精度、処理性能向上のための手法を最新の研究成果も含めて解説する。また、実例として、はてなブックマークにおける「関連エントリ」を弊社のシステムがどのように実現しているかを解説する。 以下は私のメモです。 PFIはもともとPurely Functional Infrastructureやったんや 岡野原さんではないが、(大田さんかな)Haskell
10:20〜11:00 講師: 佐々木 祥さん(twitter), 上村 理さん(twitter) 所属:東京工業大学 博士課程、修士課程 講演タイトル:エコメンデーション 資料upあり videoあり 講演概要 情報爆発の時代においてはユーザのニーズに合わせた情報発見のためのシステムとして,リコメンデーションの必要性は高まっている。しかしながら参加ユーザ数の増加,嗜好の多様化により,リコメンデーションに必要となる計算量は莫大となっている。 この問題に対し,計算処理の分散方法が各種提案されているが,これらの方法は複数の計算機を使い処理を行うため経済的側面や環境的側面から見ても「エコ」ではない。そこで,推薦の精度を保ちつつ,計算量削減を実現する方法を検討する。 以下は私のメモです。 佐々木さんの講演 1サイトにBMするだけではなく、2つのサイト間の関係としてBMするのも良い。 graphのl
追ってそれぞれについてメモや感想などをほぼ講演と同時にupしていこうと思います。 1000で40人くらい。はじまりました。男性率100%。 1020で60人くらい。 1311で70人くらい。男性率100%回避。 1400で90人くらい。 1500で90人くらい。これで安定化かな。 1615で80人くらい。 SBM研究会は3回目ですが、今までで最も技術よりの会だったかなぁ。 個人的には来て良かったと思ったのは、岡野原さん、malaさん、江原さんの講演でした。 第3回SBM研究会のスケジュールがFIXしました!: Tomo’s HotLine 日時:2009年9月13日(日) 10:00〜18:00 場所:東工大大岡山キャンパス 西6号館 W631 Twitter用公式アカウント: http://twitter.com/sbm3/ Twitter用公式ハッシュタグ: #sbmconf http
岡野原大輔さんのスライドを見ていたら、文献が紹介されていました。 「情報処理」Vol.48 No.9嗜好抽出技術の最前線 「Netflix Prize」、 wikipediaで、「レコメンダシステム」、「Recommender system」 Google Scholarで、「Collaborative Filtering」、「Matrix Factorization」、「Recommend」 またwikipedia内にもいい文献がありますね。
今のGoogle SearchのScoringにどのくらいの大きさで影響を持っているかは不明ではあるが,Googleを有名にしたアルゴリズムであることには間違いないですね. 収束性まで理解するのは少し数遊びに強くないといけませんが,scaleを気にしないcodingは容易です.単に繰り返しAdjancy Matrix(隣接行列)を収束するまで累乗していくだけです. PDL で PageRank by 伊藤直也さん, 20090305 しかし,Scaleのためには幾つか大事な点があります. Adjancy Matrixの要素が,疎であること(ゼロが多いこと)を利用してデータとしてフルマトリックスで持たないこと 行列計算を公平にしないこと 各行や各列ごとに要素の更新頻度の違いを見て,行列計算の更新頻度を行や列ごとに変えます Googleさんお得意の分散処理 PageRankの簡単に勉強するなら
20081206(Sat.)1619-1636 第2回SBM研究会のスケジュール 須藤洋一さんの発表資料は公開されていないかも? 須藤洋一さんはECナビでBuzzurlを開発した方。 内容 Buzzurlの紹介 結構がんばっているでしょ,というお話 Spam研究に期待したい. 感想 Buzzurlは名前だけ知っていて使ったことないですね.味見します.
20081206(Sat.)1618-1628 by 澤田さん 20081206(Sat.)1637-1640 by 岡本さん 第2回SBM研究会のスケジュール 澤田哲也さんの発表資料は公開されていないかも? 澤田さんの発表内容 Y!ブックマークの説明 すべてにおいて発展途上というところを意識付けした発表 Y!Jエコシステムを整える予定 知恵袋データ,検索データ,ブログデータを研究用に提供実績 ブックマークもいずれ提供すると思う. 岡本さんの発表内容 産学連携をしっかりやりたい 感想 Y!Jさんのこの辺(SBM, SNSなど)は,色々と機能を取り込むのは他社より早い気がするのですが,ユーザ数が多くなくで機能洪水っぽく見られてそうで残念.日本ではサーチで大きなシェアという力を持っているので,これからに期待. 良い交流ができることに期待
20081206(Sat.)1608-1617 第2回SBM研究会のスケジュール 井原郁央さんの発表資料 内容 今のところ収益化はGの手のひらの上 BMパタン my clips watch list recommendation LivedoorClipのData 5.5M clips 3.3M urls 0.12M users 10M tags 協調フィルタリングの研究用データとして公開するつもり 普通のCFとタグベースCFを6:4くらいにしている インターン大歓迎(はてなの京都は遠いですよねぇとのこと)
20081206(Sat.)1641-1741 欲しい情報は by 上野大樹さん URL, Title, User_Name, Timeともうひとつ? URL(10M件) CFだけだとはてなの関連エントリには勝てないかと感じている by 大向一輝さん Content, Tag, Userの3部グラフ timestampは欲しい commentsは欲しい 評価(○×など) ただし, Up-to-dateである必要性はない 無断クロールをしなくても良い状況になって欲しい 既存データ 自然言語系 TREC NTCIR ブログ系 ICWSM So-netリコメンドサービスコンテスト データ配布 Y!J検索語・知恵袋・ Google 日本語コーパス 課題 契約,成果の取扱,発表の場,事業者へのメリット(新機能開発,広報,採用活動) 事業者として期待するのは(優先度を上げたいのは),別ソースとの組み合
20081206(Sat.)1521-1557 第2回SBM研究会のスケジュール 藤田昭人さんの発表資料,ただし現時点でのこの資料は発表とは大きくことなる途中経過の模様,更新されるのか? 藤田昭人さんは,前回のSBM研究会懇親会後に飲ませて頂いた方です.夢をうちたてられる方です. 内容 Map/Reduce + P2P とのこと 基本的なスコアリング方式は,筑波大の神林さんのKikkerを利用している 苦労話を含めて実装活動報告 感想 自分がやっていることが好きな方なのだなぁと思いました. はてなの仕様変更に右往左往している苦労話は面白いが,はてなに相談したら事前に教えてくれるかも.色々とcodingすることが楽しい人なのだと思いました. 良く分からないがMap/Reduceで分散化することで, O(n)がO(log n)になることを単に示している? Map/ReduceとP2Pで相乗効果
20081206(Sat.)1410-1512 メモ量が多めでとりとめなくなっています.すみません. 第2回SBM研究会のスケジュール 伊藤直也さんの資料は公開されていないかも 伊藤直也さんははてブの方。今日のメイン発表の一つです。 はてなブックマーク2の説明 運営と技術の両サイドを話すつもり はてブの統計 3MUU/月 (UU: Unique Users) by Google Analyticsのセッション数 0.2M Accounts(最近やっとこうなった) 国内サイトでははてブの一人勝ち(だいたい7〜8割くらい),2ndはlivedoor, 3rdはdel.cio.us,他にyahoo, choix, fc2, buzzurl 国外だとdiggやdel.cio.usが大きくなる 男性62%, 女性38% 20-30代が大きい 女性に限ると25−29歳が多い(3割) はてなはIT系は多
20081206(Sat.)1345-1359 第2回SBM研究会のスケジュール 西谷智広さんの発表資料 西谷智広さんは,本研究会のボスです.公私ともに忙しい中,発表まで,ありがとうございます. 内容 SBMコメントの考察 対 Blogコメントにおけるメリット 簡単 コメント欄がないblogにも書ける 他のブロガーから干渉されない(コメント返しがない) コメントアグリゲーター機能として便利 対 Blogコメントの特徴 コメント回数などの制約がある コメント機能の質を上げる方法 incentive positive commentsだけに制約 などなど 感想 もともとはあまり興味のなかったところだが,ふむふむという感じ QA Q(広木さん): なぜブクマコメントの表示は上に伸びる A1(須藤さん@ECナビ): Buzzurlでは上にしているのもある A2(伊藤直也さん): 最初にそうしてしま
20081206(Sat.)1327-1344 第2回SBM研究会のスケジュール 資料は公開されていないかも? 美谷広海さん,良くイヴェントでお見かけします. 内容 ブックマークサイトはSEO力が高い RSSにより検索エンジンより早くindexingされる はてブとはてなダイアリーの相乗効果 ブックマークサービスにより,ブログの露出が増加する はてなは多様なRSS配信を徹底的に行っている 検索エンジンに対しても,例えばGoogle webmaster Toolsを使って同様の効果は達成できる 感想 丁寧で分かりやすい説明 さすがです 私もはてブ100件以上のRSS URLをGoogle Readerなどに登録していますが,相乗効果に加担していそうです. 何かで加工したサイトのRSSを見るなどさっきの広木さんのメタメタの話に関連している QA Q(広木さん): 内部リンク対策などはGoogl
20081206(Sat.)1313-1326 第2回SBM研究会のスケジュール 広木大地さんの発表資料 広木大地さんは前回のSBM研究会懇親会の後,飲みに行ってお話を伺った方です.しっかりした方だと思います.(たぶんほんとです.) 内容 ブックマークにおけるユーザ間の関係の説明 ブックマークの方法論を説明 メタメタでメタなメタサイトが成り立ち元記事がわけわからんようになるリスクがあるということ それぞれのpros and consを分かりやすく説明 Open SocialやOpenIDのような標準的な技術を使ってブックマークを普及しましょう 感想 言ってることは正しそうに思いましたが,全部は理解できてません 復習対象
20081206(Sat.)1115-1155 第2回SBM研究会のスケジュール ご本人の発表報告 第2回SBM研究会に参加&発表してきた感想 - kasihara1の日記 発表資料 上野大樹さんの発表資料 上野大樹さんは,情報評価付けの研究をなさっていて,この一年弱はブックマークについて研究されている方のようです. 内容 Bookmarkの傾向の観察して発表 Bookmarkのタイプには3種類ある 一時的にインパルス応答のコンテンツ 急激にブックマークされる時期があるコンテンツ ブックマーク数/ブックマークされた日数>=5 hotにはならないが息の長いコンテンツ<-こちらの方が有用な情報という仮説 ブックマーク数/ブックマークされた日数<=1.25 仮説が正しかったと主張 他にタグがあるSBMの方がより有用ではないかという仮説を今後検証したい 感想 発表中にマイクを両手に持つのが初々しい
20081206(Sat.)1015-1110 第2回SBM研究会のスケジュール 発表資料 大向一輝さんの発表資料@ご本人のblog 大向一輝さんの発表資料@SBM研究会資料集(最新ではない可能性あり 関連論文 Ikki Ohmukai, Masahiro Hamasaki, and Hideaki Takeda, "A Proposal of Community-based Folksonomy with RDF Metadata", 大向一輝さんは古くからSBMに絡んだ研究をしている.他のイヴェントや学会でお見かけするのですが,かなりアイデアを持っている方です. 内容 Buzzurlの一年間のニュースコンテンツのブックマーク行動を使い、一年の前半部分をtraining data, 後半部分をtest dataとして,実行した報告. 実際にはユーザ間協調フィルタリングを用いている.その結
「ほとんど本屋になってきた」らしい橋本大也さんらの講演を聴いてきました. ********************************************************************* 何: ビジネスモデル学会第6回KM研究会 〜『ブログ、メタデータの基幹系ビジネス応用』 http://www.biz-model.org/whatsnew/detail.html?whatsnew=62 時: 2005年10月7日(金) 13:30-17:30 所: 東京大学 工学部3号館3階 会議室 人: 野村直之さん,橋本大也さん,山崎秀夫さん 議事録:ビジネスモデル研究会@mixi http://mixi.jp/view_bbs.pl?id=2348147&page=all **************************************************
明日からの週末に既にあちこちで議論されている Longtail/Long Tail(ロングテール,ロングテイル)について(いまさら)書いてみようと思います. その前に私とLongtailとの関わりについて,一般の方には分かりづらい内容を述べようと思います. 昔,仕事で通信トラフィック解析をしていた私にとって最近話題になっているLongtailという言葉は懐かしいものでした. 電話がトラフィックの主流であったときはトラフィック管理はいつも予想の範囲内で動いていたのです.お行儀の良いトラフィック.でも私が就職した頃はwebが全盛でhttpやftpトラフィックに1セッション当たりのデータ長が長いパケットが増えてきました.パケットの分布をX軸にデータ長,Y軸にパケット数で書いてみるとX軸側に長いLongtailになり,トラフィック解析屋さんやQoS(Quality of Service)管理屋さん
このページを最初にブックマークしてみませんか?
『Tocotonistの日記(晴れのち快晴)』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く