タグ

hatenaと読み物に関するtorutoのブックマーク (24)

  • 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改

    新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。 新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日はこのアルゴリズムについて紹介してみる。 Complement Naive Bayesは2003年のICMLでJ. Rennieらが提案した手法である。ICMLというのは、機械学習に関する(たぶん)最難関の学会で、採択率はここ数年は30%を切っている。2003は119/371で、32.1%の採択率だったようだ。 Complement Naive Bayesの位置づけは 実装が簡単 学習時間が短い 性能もそこそこよい という感じで、2003年段階にあっても、絶対的な性能ではSVMに負けていた。しかし、学習が早いというのは実アプリケーシ

    新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改
  • お気に入りに入れる条件って

    お気に入りに入れる条件って どういう人を はてブのお気に入り に入れるべきかというのは実は難しいんじゃないか。 その基準がどうにも明らかでないと、お気に入りに入れるべき人を自動で推薦、 みたいなのって意味がないと思うのだけど、どうなんでしょ。 第2回SBM研究会 の会場で大西さんにそういう質問したんだけど、 つまり「類似度の高い人を推薦」つったって、 類似度が最大、つまり完全に同じものをブクマしている人をお気に入りに入れても、 それって意味あるの? という問題。 類似度の計算はいろいろあるみたいなんだけど、 それはとりあえず置いておいて、とにかく類似度が計算できるとしましょう。 そんで、なんで類似度が高くなるのかというと、 二人が同じところを巡回しているからだ、というのはあるんじゃないか。 はてブのホッテントリから同じようにピックアップしてブクマしてたら、 そりゃ傾向が似るでしょうと。 R

    toruto
    toruto 2008/12/14
    どんな視点・思想に基づいてレコメンドなどを行う際のスコア定義を決めるするかって話。お気に入り推薦で、万人に受ける定義を作るのは難しいだろうってこと。色々、考え方はあるだろうし。
  • はてブユーザ間の類似度 - Life like a clown

    注目の動画問題と総合メディア論事件との関連 いつか書こうと思いつつ随分と放置していた話題.きっかけは,NO!と言えるようになりたい:「注目の動画」は当に劣化したのかより.注目の動画(特にニコニコ動画側?)にアイドルマスターやらアニメ関係の動画ばかりが挙がっていて[これはひどい]と言う話題が一時期盛んでした.これに関連して,ひとつ気になっていたことがあったので調べてみました. 注目の動画(ニコニコ動画)からidolm@sterタグのついているエントリを新しいものから50個抜き出して,それらのエントリをブックマークしているユーザの分布を調べました.その結果がこちら(完全なログ:user_dist_nicovideo.log).一番右がユーザ名で,その隣が50エントリの中でそのユーザがブックマークしていたエントリの数です. get 50 entries 0 47 Ubuntu 1 44 ak9

    はてブユーザ間の類似度 - Life like a clown
  • 任天堂に対抗するだって?w 無駄な抵抗はやめておけ ~最強の55歳~

    任天堂の宮茂やWiiに関するNew York Timesの記事。 http://www.nytimes.com/2008/05/25/arts/television/25schi.html より拙訳。タイトル含め、所々意訳。 追記:原題の " Resistance Is Futile (抵抗は無意味だ) " はスタートレックに出てくる有名なフレーズだそうですね。これはそのままのほうがよかったかもしれません。教えてくれた人どうも 「任天堂に対抗するだって?w 無駄な抵抗はやめておけ 〜 最強の55歳 〜」 宮茂はゲーム界のウォルト・ディズニーと言っても決して言い過ぎではない。 ディズニーが1966年に亡くなったとき、宮さんは14歳の少年だった。学校で教鞭を執っていた父の元、彼は日の古都・京都で育った。当時漫画家を目指していた彼はディズニーのキャラクターに夢中になり、ひたすら絵を描いて

    任天堂に対抗するだって?w 無駄な抵抗はやめておけ ~最強の55歳~
  • IPAフォーラム2007で討論してきた - 東大MOT学生の奮闘記

    10月30日に行われたIPAフォーラム2007の『「学生から見たIT産業」と「IT産業から見た学生」〜IT産業は学生からの人気を回復できるか〜』と題された討論会でしゃべってきた。IPAとは情報処理推進機構の略で、情報処理技術者試験とか、未踏ソフトウェア創造事業をやっているところ。 大学の先生から、討論会に出る学生を求めいているという話を聞いたのが討論会に参加したきっかけ。僕はてっきり、IT産業の未来について語り合うのかと思っていたのだが、「IT産業は3Kのイメージが強く、就職において人気がなくなってきているが、どうすればその人気を回復できるか」というタイトルを聞いて、ちょっとがっかりした。 @ITにこの討論会についての「IT業界不人気の理由は? 現役学生が語るそのネガティブイメージ − @IT」という記事が上がっていた。ちなみに、記事の最初の写真に討論会に参加した学生が写っているが、前列の

    IPAフォーラム2007で討論してきた - 東大MOT学生の奮闘記
  • Googleのラリー・ページのミシガン大学卒業式でのスピーチ - himazu blog

    表題のリンク先にGoogleの共同創業者ラリー・ページが2005年5月にミシガン大学の卒業式でおこなったスピーチの音声とビデオがあるのを見つけた。コメントの中に筆記録がある。スピーチの一部の筆記録がコメントとして投稿されたあとで全体のものが投稿されている。音声は聞き取りにくくネーティブスピーカーでも苦労したようで筆記録にも聞き取れていないところが多々ある。 ミシガン大学はページにとってスタンフォード大学の大学院に進む前に卒業した母校であり、スピーチは母校の工学系の学生に向けた内容になっている。 興味深いと思った部分 大きなことをするほうが小さなことをするより容易だ。変に聞こえるだろうが、当に大きなことをしていると、他の人の助けが得られる。より多くの人が助けてくれる。必要な資源がより多く手に入る。だから、大きなことを世界を舞台に成し遂げることは考えるに値する。 12歳のとき発明家になりたい

    Googleのラリー・ページのミシガン大学卒業式でのスピーチ - himazu blog
  • 本当に恐ろしかった匿名オセロ

    http://anond.hatelabo.jp/20071101140722 はてラボで独立サービスとして始まった匿名オセロは4週目に突入する。 匿名プレイヤーは、その能力は別として常に勝ちを目指すウィナー、正反対のルーザー、白黒の均衡を取ろうとするバランサー、何も考えてないランダマイザーに大別された。それらが白黒手番を自由に行き来するため先読みが封じられ、指し手が凡手に均質化した結果、各局はほとんどが僅差で終了した。個々の局面を見ればそのプレイヤーのパターンなりに、他のプレイヤーの思考まで取り込んだ妙手は存在した。しかし、不特定多数の匿名であるがゆえ、その意図は推し量ることもできなかった。したがって鑑賞されることも省みられることも無く数多の対局に埋もれていった。プレイヤー達はいつしか考えることを止めた。 だが惰性からなのか、何かしらの繋がりを求める人の性からなのか10週を超えても延々と

    本当に恐ろしかった匿名オセロ
  • ソフトバンクモバイル株式会社の件について

    今日のhotentryでhttp://oshiete1.goo.ne.jp/kotaeru.php3?q=3322126というサイトがあった。なにやらソフトバンクの機種変が利用者の知らないうちに行われていた模様。この利用者は機種変をした覚えがなくソフトバンクに情報の開示を求めるのだが、会社としてまったく動かないソフトバンク。最終的には警察が動きやっとソフトバンクの社員が謝罪にくるということなのだが、こういった事に遭遇した際にどのように出ればいいのか私なりに書いてみる。 まず通信会社は比較的新しい組織構造をしている。まずは組織から。 ソフトバンクの場合 まずカウンターで受付や接客をしているいわゆる店員はSPと呼ばれている。彼らは必ずソフトバンクの制服を着ている。家電量販店などのブースに入っているスタッフはこの季節だと白に黒い線が入ったポロシャツまたは冬用の黒い長袖にソフトバンクの白いロゴが入

  • 集合知を多数決で作るのは間違い。 : ひろゆき@オープンSNS

    【教えてくん】コミュニティーなのです。 なんかニュースとかあったらここに書こうかと思ってますよ。とりあえず、おいらのブログ 集合知を多数決で作るのは間違い。 某で、あるブロガーさんの言葉を引用したのですが、 「ガリレオガリレイの時代に集合知があっても、地動説にはならなかった」 って話もありますが、 知識というのは多数決で決めると間違ってることがままあります。 普通の人が知識を超えた質問をされた場合に、 「わからない」という発言をしてくれればいいのですが、 「竹中直人は好きだから、正しいと思う」とか、 「モー娘はカワイイから嘘をつかないと思う」とか、 ギリシャ人と同じような感覚で評価したものが、 多数出てきたりします。。 そうすると、みんなが言ってるのだから、 真実であると誤解してしまう人が出てしまうのですね。 「ポケットはてなは著作権侵害ではないのだろうか」 という記事があります。 それ

  • 今の子供達にどうやってプログラミングの楽しさを教えたらいいのか?

    うちはとても貧乏だったというのに、なぜか俺が小学三年生のときに、親父がパソコンを買ってきた。 親父は電気工事屋をやっていたから電気製品が好きだったんだろう。 当時小学六年生だった兄貴も機械いじりが好きだった。 電子ブロックなんてのが家にあった。 とはいえ、二十万円もするパソコンをコンビニでウーロン茶を買うかのように買ってきた親父が、あとでオカンになんて言われたのか、いまとなっては知るよしもない (いや、親父もオカンもまだ生きてるので、聞こうと思えば聞けるが) 。 ともかく、俺が小学三年生の時には家に MZ-2000 というパソコンがあった。 三年生のときはそもそもパソコンとはなにかも知らなかったし、親父も兄貴も壊れものを扱うかのように大事に触るので (実際壊れものだ) 、俺には触らせてもらえなかった。 親父や兄貴の背中越しに見ているだけだった。 当時はパソコン用のソフトなんてのがそこらに売

    今の子供達にどうやってプログラミングの楽しさを教えたらいいのか?
    toruto
    toruto 2007/09/14
    このことはどんな分野の人でも思っているのだろうな
  • はてな伊藤直也氏MIJS講演「プログラマでいること」 : 小野和俊のブログ

    昨日MIJSのコンソーシアム内での技術発表会があり、理事会の方から「参加ベンダーの技術者が集まるイベントなので、技術者に元気を与えられるような人に講演をお願いしたい」という話があったので、はてな伊藤さんに講演をお願いした。 伊藤さんにお願いしようと思ったのは、伊藤さんなら、エンタープライズの世界にウェブの世界の元気な風を吹き込んでくれるのではないかと思ったからだ。 以下、私なりに講演の内容をまとめてみた。 ■「建物の建て方」 つくる対象がどのようなものかで、作り方は当然変わってくる。これは建物もソフトウェアも同じ。1階建ての格好良い小さなロッジを建てるのと、60階建ての安全で高品質な巨大ビルを建てるのとは方法も道具も異なる。ロッジを建てる時にはノコギリを使うが、巨大ビルを建てるにはクレーンを使う。 よくブログの世界でソフトウェアの開発について、ぜんぜん違うことをやっている人が同じ土俵で議論

    はてな伊藤直也氏MIJS講演「プログラマでいること」 : 小野和俊のブログ
    toruto
    toruto 2007/09/14
    ある日、ベンチャーに勤めている同い年のスーパーハッカーに、「一ヶ月くらいでできそうですね」と話したところ、「いや、3日でできる」と言われ、衝撃を受けた。
  • Googleの面接試験の問題と解答

    ★☆★☆★ 問題 ★☆★☆★ 1.スクールバスにゴルフボールは何個入るか? 2.あなたはニッケル電池ほどのサイズに縮んでしまう。質量は今現在のオリジナルの密度を維持している。そしてあなたはガラスのミキサーに投げ込まれる。ミキサーの刃は60秒で動き出す。さぁ、あなたはどうする? 3.シアトルのすべての窓ガラスを洗浄するとして、あなたはいくら請求しますか? 4.マシンのスタックがメモリ内で増えるか減るかしているのをどのようにして見つけ出しますか? 5.あなたの8歳の甥にデータベースについて3つの文で説明しなさい 6.時計の長針と短針は一日に何回重なりますか? 7.あなたはA地点からB地点に行かなくてはならない。そこに到着できるかどうかは知りません。どうしますか? 8.シャツでいっぱいの戸棚があるとします。特定のシャツを見つけるのは非常に難しいです。簡単にシャツを見つけるためにどのように整理しま

    Googleの面接試験の問題と解答
  • らいおんの隠れ家 - ポール・グレアム「就職なんてもう古い」

    賃貸暮らしのわが家の地震対策【揺れから命を守る編】 以前のブログでも記載した、防災の優先順位に基づいて対策を進めています。まだ手をつけられていない部分もありますが、ある程度まとまってきたのでざっくりとご紹介していきます。 優先順位別に改善していっているため、今回は主に地震の揺れ対策がメインになります。…

    らいおんの隠れ家 - ポール・グレアム「就職なんてもう古い」
  • 旧帝理系院卒ですが全く同意。というより俺がそのタイプだった。 文系な..

    旧帝理系院卒ですが全く同意。というより俺がそのタイプだった。 文系ならたぶんまだ大丈夫だが、 理系では勢い余ってサッカーにまで博識になるような人ではつらいだろう。 その通りだと思う。 高校までと大学以降の質的な違いは、自分が標準的な知識の体系の全体を網羅できるかということがあるだろう。高校までならこれは努力次第で十分可能なんだが、大学からは無理だ。専門分野を選ばなきゃいけない。 で、理系の学問ってのは、基的に「断言できること」だけを集めたものなんだよね。極端なことを言えば、コンピュータで処理できないものは理系の学問の対象にならない。どうしてもそういうものを対象にしようとするならば、コンピュータで処理できるような(というと語弊がありすぎるが)数学的モデルを自分で作り上げて、その正当性を検証しないといけない。そして、その作業は一生かかっても終わるかどうかわからないような膨大なものだ。 理系の

    旧帝理系院卒ですが全く同意。というより俺がそのタイプだった。 文系な..
  • 何でも楽しいという友人

    受験勉強が楽しいという友人がいた。 「数学と現代文はパズルだし、物理や化学や生物や地学なんてさ、物体や宇宙や、物体の動きとか、そんな宇宙の根的なところの話で普通に知ることが楽しいし、倫理なんかも人間の根的なことだから楽しいし役立つし、しかも過去の超天才、超有名人たちのエッセンスだけピックアップして体系化して知れるんだから倫理なんてマジで超お得じゃん!現代社会とか政経なんて普通に新聞読む時とか実生活に即役立つし、歴史なんて、俺らと同じ人間の今までのビッグニュースを集めたもんだし、しかもなんせ歴史はマジで起こった事なんだぜ、楽しいよ。理科も、架空の事じゃなくてマジで今のここにある物体の仕組みの事で、リアルありまくり。全部即役に立つじゃん。楽しいじゃん。古文も、日に文字とか文章とかの文化が生まれてから今までの超有名作がピックアップされててマジ便利。楽しい。漢文もそうだよ。だから勉強って超楽

    何でも楽しいという友人
  • jkondoの日記 - お盆、祭り、死

    今年の夏は、自分のビザの更新が少し手間取ってしまい、意図せず日に長く滞在することになりました。現在はアメリカに家があり、日にちゃんとした家がない僕は、結局実家に行ったり、会社のオフィスと兼用のマンションで過ごす事になりました。 8月に入ると、はてなに長く勤めてくれた社員が今月いっぱいで独立して起業する、という話が出て、それは素晴らしい挑戦だ、応援したい、頑張って欲しい、と言いながらも、やはりこれまで長く一緒にやってきた人が居なくなる事を受け止めるのには時間がかかり、その過程で色々な対話をし、改めて自分の仕事や、今の会社を見直すきっかけになった気がします。 8月は自分自身も社に身をおいて、社内の色々な人と直接対話をしながら仕事をし、そしてお盆には5日間のツール・ド・信州という自転車のイベントを行いました。 アメリカでの生活とは比べ物にならないくらいたくさんの人と接したこの夏は、まるで全

    jkondoの日記 - お盆、祭り、死
  • Life is beautiful: 『恋はブックマーク』―ブックマーク・コメントはシャイな日本人向け?

    [プロローグ] A子「ねえ、今度営業部に配属になった田中くんってイケてると思わない?」 B子「え、あなたもブックマークしてたの?彼は私が先にブックマークしたんだから手を出しちゃ駄目よ!」 [編] このブログを始める前は、英語でブログを書いていたのだが、英語圏の読者はものすごく気楽にコメントを書いて来るので驚いた。それと比較すると、日の読者がコメントを残すことはとてもまれである。エレベーターに乗り合わせ時に、「5月なのにまだ雨だね~」だとか「かっこいいTシャツですね」などと初対面の人に平気で話しかけてくるアメリカ人と、じっと黙っている(=知らない人に突然話しかけてはいけない)日人の普段の行動の違いを見ればうなずける。 「そんなシャイな日人には、トラック・バックが向いている」という話をどこかで聞いたことがある。しかし、「読みましたよ」という足跡を残すだけのために自分のブログにわざわざ新

  • 自動ソーシャルブックマークサービスPathtraqは第二のGoogleになるか?:TKMR.blog.show

    サイボウズラボからリリースされたPathtraqに興味津々です。 http://pathtraq.com/ ざっくり言うと「アクセス解析&共有サービス」または「自動ソーシャルブックマークサービス」で、ユーザ(参加者)がFireFoxかIEの拡張をインストールして、日々アクセスしたWebサイトの履歴をPathtraqが保存・解析するサービス。 実際リリースの数日前に「ページ滞在時間に応じてdel.icio.usに自動postするGreasemonkeyスクリプト」なんて同じ方向性のアイデアが(別の場所から)生まれて来てる通り、これは出てくるべくして出てきたサービスな気がする。何故か「ついに来たか」と感じた。「気になったページをブックマーク」なんてかったるいこと言わずに、もう全部ページブックマークしようぜと。これは何処かGoogle的発想を感じる。フィルタリング/ランク付け/クラスタリングなん

  • はてな匿名ダイアリー JASRAC伝説

    160 :最近風呂入ってないけど、 :2006/10/31(火) 19:32:46 ID:w586Zf1z0 ジャスラックに纏わる伝説で一番凄かったのがオーケン事件。ググると結構出てくる。 大槻ケンヂが自分のエッセイに筋少時代の曲(高円寺心中。もちろん人作詞)の歌詞を引用したんだけど 製後いきなりジャスラックが「知的財産権は我々にある。使用料をよこせ」って言って来て かなり頭に来たけど事を荒立てるのもアレだから素直に支払った。 その後、印税明細が来るのだが何故かジャスラックからの印税が一円も無い。 一応、ジャスラックの名目は「中間マージンとして摂取後、アーティストに一部印税を支払う」んだから オーケンが払った使用料の何%かは還元されなきゃいけないハズなのに1円も還って来ない。 ジャスラックに「歌詞使用料が振り込まれてるはずだろ?つか、払ったのオレ自身なんだから間違いない」と問い合わせる

    はてな匿名ダイアリー JASRAC伝説
  • 「変な会社」が徹底する真っ当な情報共有

    QAサイトやブログ、ソーシャルブックマークなどのネットサービスをてがける「はてな」。同社は、「立ったまま会議をする」「ミーティングをポッドキャスティングする」などユニークな試みを実践している「変な会社」として知られている。「超オープン」と言われる同社の情報共有の仕組みについて、川崎裕一副社長に話を聞いた。(聞き手は小野口 哲) はてな社内での情報共有はどんな仕組みになっているのでしょうか。 はてなでは、社員が全員ブログを書いています。業務日報的なものだけでなく、基的に何でも書くんです。例えばあるサーバー担当者は、仕事がきつい、眠いといった自分の状況やフットサルの感想の後で、エラーのログや監視プログラムの話を書いています。 「個人のブログみたいなことを書いても意味がない」と感じる人もいるでしょうか、そうではないんです。ブログを読んで、この担当者が眠いことを知ったら、「もう眠ったらどうか」と

    「変な会社」が徹底する真っ当な情報共有