タグ

2010年3月12日のブックマーク (17件)

  • フジタツヨシの新宿通信 その問題は本当に問題なのか?:【読んだ本】未来思考 10年先を読む「統計力」

    「その問題は、当に問題ですか?」 と統計で問い続けてきた神永先生は、書でもその姿勢を貫いている。 そして、書でそれぞれに問われる問いは 「少子化当に問題なのか?」という問いに収斂されて行く。 目次(Masahiro Kaminaga's Weblog) プロローグ PART1 少子化結婚 第1章 日少子化、世界の少子化 なぜ子どもが減ったのか コウノトリはどこへ 少なく産んで、しっかり育てる なぜ子どもが減っているのか 先進国の出生率を比べてみよう 教育費と出生率の関係 少子化ヲ克服セヨ 第2章 結婚しません? 未婚が増えている 長すぎる春 子どもは何人欲しいですか 生物学的限界 結婚しない/できない理由 結婚の三大リスク 第3章 産む自由、生まれる義務 世代会計―再配分の問題― 就学前教育の充実を! 大学が高すぎる このざまはなんだ 子どもさえ増えればいいのか 統計的差別

  • The Anatomy of Large-Scale Social Search Engine: ソーシャル検索エンジンAardvark論文の輪講用資料 - シリコンの谷のゾンビ

    巷 (もしかしたら非常に一部?) を騒がせているWWW2010に採択されたソーシャル検索エンジンAardvark論文 "The Anatomy of Large-Scale Social Search Engine" を読んで,ここ3日間ほど夜なべをして作成した輪講用資料を公開します.普段読まない類の論文だったので色々大変でしたが,非常に勉強になりました. ちょうど論文を読んだ頃にGoogleによる買収が正式発表になったので非常にタイムリーなネタとなりました. The Anatomy of Large-Scale Social Search EngineView more presentations from sleepy_yoshi. 論文や資料を見ればわかるとおり,個々の技術はオーソドックスな技術の組み合わせになっています.それを組み合わせてひとつのサービスという形で提供し,更に実際の

    The Anatomy of Large-Scale Social Search Engine: ソーシャル検索エンジンAardvark論文の輪講用資料 - シリコンの谷のゾンビ
  • TechCrunch | Startup and Technology News

    SpaceX’s massive Starship rocket could take to the skies for the fourth time on June 5, with the primary objective of evaluating the second stage’s reusable heat shield as the…

    TechCrunch | Startup and Technology News
  • トーナメントと多値分類 - DO++

    今やってる研究で、トーナメント問題を調べる機会がありました。 トーナメントは私も知らなかったのですが、勝者や順位を決める方式のことを指し、いわゆる二人ずつ戦って生き残っていく方式はノックアウトトーナメントといわれるそうです(wikipedia)。 #10000人戦う時にノックアウトトーナメントでは何回試合が行われるかというのはよくある質問ですね。 で、このトーナメント方式というのは調べてみると非常に様々なものがあります 例えばスイス式トーナメントは、最初はランダムな組み合わせで対戦、次は勝者同士と敗者同士、その次は全勝・1勝1敗・2戦全敗のそれぞれが・・というふうに同じ成績の人同士で戦う方式です。レーティングを計算して、レーティングが近いもの同士を戦わせるような拡張もあります。近いのは将棋でやってるようなものですね。 利点は全ての人が同じ試合数で戦い、また厳密な順位が決めやすいことがありま

    トーナメントと多値分類 - DO++
  • 松尾ぐみの論文の書き方:英語論文 | 松尾 豊

    あー、やっぱりこの国際会議は難しいな。日人ほとんど通ってないしなぁ。結構頑張ったんだけどなぁ。でも査読者、なんか良く分からないことを言ってる。こいつ分かってないな。こんな査読者に当たるとは運が悪い。3人中1人はすごくいいコメントなのになぁ。ま、いいや、研究会論文でも書こう。 (※に戻る) 私も以前はこんな感じでした。主要な国際会議のレベルは高いと思ってました。今では、そうは思いません。何といっても、まずは完成度の問題です。 完成度を上げることの重要性 完成度を上げるとは、自分で修正するところがなくなるまで、修正を繰り返すことです。 上の例では、初稿の段階で投稿していますね。これで通せる人は誰もいません。ここで私がよく目安に使っている2つの経験則を紹介しましょう。 執筆時間の法則: 経験上、次のような法則があります。「書こう」と思ってから、初稿ができるまでの時間をa0とします。すると、第2

  • 松尾ぐみの論文の書き方 | 松尾 豊

    松尾ぐみの論文の書き方 論文を書くことは、研究を進める上で重要なプロセスのひとつです。 研究者の業績も論文によって評価されます。ここでは、松尾ぐみの学生と一緒に論文を書いていく中で、よく注意点として出てくることをまとめて整理してみました。なお、松尾ぐみのテーマに即していますので、違う分野の人は参考にならないかもしれません。 研究を論文にするということ 自分の研究をきれいな形に切り取る 論文は、自分の研究日記でも苦労日記でもありません。卒論や修論は、自分がやったことをできるだけ主張する、 苦労した点を伝えるという点で、 ある意味、研究日記でも構わないでしょう。しかし、ジャーナルの論文や国際会議の論文は違います。 こういった論文は、新しい知見を読者に伝えるためにあります。読者が必要としている情報、知りたい情報を、過不足なく書く必要があります。 自分の苦労話や、横道に入るような研究は書く必要はあ

  • 英文レポート・エッセイで良いものを書くコツ(暫定版) - My Life After MIT Sloan

    今日はもういっちょ、スキル系の話を。(昼に寝すぎて眠れないから起き出して来た・・・) 最後のファイナル・レポート、昨日やっと終わる・・・。 今週は、ものすごい量の英文を書いた。 しばらく英文を書くのがイヤになるほど書いた。 ファイナルレポートは3だったけど、どれも長かったのと、うち2は自分がまとめ役になったから。 来学期、論文(Thesis)を書き上げることを考えれば大した量ではないが、練習としては良かったのかも。 というわけで、大量に英文を書いていて、気がついたコツなどを中心に。 MBAエッセイにも通じるものがあるので、エッセイ書いてる人にも役に立つかも。 (構成編) 1.全体の章立てを構成し、各章のタイトルを決める。空・雨・傘が使える。 英文のレポートの場合、最初にIntroduction、最後にConclusionを書くことが決まっている。 これは論文でも一緒。 後はその間をどう

  • やればできる卒論の書き方 第1部 論文の書き方

    やればできる 卒業論文の書き方 中田 亨 2003年10月15日初版。2009年4月27日改訂 工学部の標準的な卒論の書き方について説明します。修士論文でも博士論文でも書き方は同じです。 第1部 卒論クイックスタート 卒論とは? 他人の真似ではないアイデアが、 それが理論的に可能である理由、 やってみた証拠、 どんなふうに役に立つか、 とともに記述されている、組織立った文書。 卒論は習作であり、基準は甘い。対外発表論文では第1条が「他人のアイデアより明らかに優れたアイデア」と厳しくなる。 「新しい意味を伝えることが、命題の質である。」(ウィトゲンシュタイン) 標準的な卒論の構成 題目: 説明的なタイトルを付ける。例えば「人体計測装置の研究」では舌足らずであり、「赤外線平行投影法を用いた人体計測装置」とか、「海中でも使用可能な人体計測装置」などがよい。(私の上司の金出武雄氏の方式)。 要約

  • 小論文の書き方あるいはインターンシップの応募書類の書き方 - 武蔵野日記

    最近自分の研究内容やらやりたいことやらを(英語で)書かないといけないという機会の人に相談されることがあるので、いくつか紹介。 まずは英文レポート・エッセイで良いものを書くコツ(暫定版)。「エッセイ」と日語で言うと「随筆」のように散文的な感想文チックなものを想像されることが多いかもしれないが、英語で「エッセイ」と言うと基的には小論文のことである。これを間違えると採点不能(=0点)の文章を書いてしまう可能性があるので、注意されたし。 一番大事なのは、英語では「起承転結」は使わない、ということ。もちろん、日語の小論文でもできるだけ「起承転結」は使わないことをお勧めする。「起承転結」は小説漫画ならいいのだが、論文、特に英語の論文やエッセイでこれをやってはいけない(いけなさ具合が伝わるといいのだが、なまじっか文章を書くのがうまいと思っている人ほど、無意識のうちに「起承転結」の構成にしてしまう

    小論文の書き方あるいはインターンシップの応募書類の書き方 - 武蔵野日記
  • GPGPU がアツい。一番ではなく一番乗りになろう。 - 武蔵野日記

    PFI セミナー GPU コンピューティングの現状とスーパーコンピューティングの未来を見る。予想以上に遥かにおもしろかった。説明も分かりやすいしなにより @nushio さんの話し方が心底楽しそうなのがとてもよい :-) エンジニアにせよ研究者にせよ、一番大事なのは自分のやっていることに情熱をかけられるか、楽しんでいるか、ということに尽きると思う。上記のリンクは放映されたものの録画なのだが、スライドはこちら。トークもちょうど1時間程度なので、時間があればスライドだけではなく、トークの最初の数分だけでも見る(というか聞く)ことをお勧めする。先日のウェブ学会のときも思ったが、東京にいなくてもこういうのが聞ける時代になって、すごく便利だなあ。(あとから見ることもできるし、文字通り時空を超えている) GPGPU ってなんなのよ、というと、これは General Purpose computing

    GPGPU がアツい。一番ではなく一番乗りになろう。 - 武蔵野日記
  • 企業の研究者として生きるということ - 武蔵野日記

    最近出たで読もうと思っていたので東京出張の合間を縫って読む。 企業の研究者をめざす皆さんへ―Research That Matters 作者: 丸山宏出版社/メーカー: 近代科学社発売日: 2009/11/04メディア: 単行購入: 7人 クリック: 105回この商品を含むブログ (16件) を見る丸山さんは元々自然言語処理の研究者(昔 ACL にも通していた)で、IBM の東京基礎研究所の所長を2006年から努めていて、今回は所長として研究所で発行していたニューズレターに連載していたコラムをまとめたを上梓した、ということのようだ。 書き下ろしになっている第1章と第9章以外はそういうわけで大変読みにくい(他の見せ方はなかったのだろうか。手間をかけずに出版するためにこうなったのだろうが)のだが、書き下ろし部分だけでも確かに読んで参考になった。ニューズレター部分も参考になって、たとえばp

    企業の研究者として生きるということ - 武蔵野日記
    Gln
    Gln 2010/03/12
    「企業の研究者をめざす皆さんへ—Research That Matters」丸山宏
  • 日本語が亡びるとき、IME も亡びる - 生駒日記

    各地で噂に(?)なっていた 日語が亡びるとき―英語の世紀の中で 作者: 水村美苗出版社/メーカー: 筑摩書房発売日: 2008/11/05メディア: 単行購入: 169人 クリック: 12,657回この商品を含むブログ (459件) を見る を読んでみた。なんだこれは……。歴史的な認識の誤りとか日の国語国字問題とかそういう部分での知識の欠如とか多すぎて話にならない。まずこれは「論文」ではない。一言で要約すると「ワタシは明治・大正時代の日小説が美しくて好きだ。なぜならその時代の日小説家は知識人だったからだ。この美しい日語の小説が読まれなくなるのは腹立たしいので、日の若い世代でも明治時代の小説が読めるように、日政府はちゃんと日語を教育しなければならない」というものである。気持ちは分からないでもないが、そういう気持ちがあったとしても、他人を説得する文章を書きたいのであれば、

    日本語が亡びるとき、IME も亡びる - 生駒日記
  • 大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記

    id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどのを買ったかとか、推薦エンジンで使う行列)、ページ-リンク行列(どのページからどのページにリンクが出ているか、もしくはリンクをもらっているか。PageRank などページのランキングの計算に使う)、といったような行列を計算するとき、大規模行列だと計算量・記憶スペースともに膨大なので、事前にある程度計算しておけるのであれば、できるだけ小さくしておきたい(そして可能ならば精度も上げたい)、という手法である。 行列の圧縮には元の行列を A (m行n列)とすると A = USV^T というように3つに分解することが多いが、も

    大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記
  • 自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記

    Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。 この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非

    自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記
  • Python でグラフ・(疎)行列計算するためのライブラリを紹介するよ - 武蔵野日記

    PageRank とか HITS といったリンク解析ではグラフの計算が頻発するのだが、Python でそのあたり書くときの話をまとめてみる。グラフは行列で表現できる(ノード×ノード次元の行列 A を考えて、ノード i からノード j にエッジがあるとき、A[i,j] に値を入れておけばよい。無向グラフのときは A[i,j] = A[j,i] なので対称行列になる)ので、要は行列を手軽に扱えるライブラリの紹介である。 実は Python の行列演算ライブラリはどれも lapack/blas を内部的に呼んでいるので、C/C++ 等と比較してもそんなに遅くない。それどころか、自動的に並列化できるところは並列化してくれたりするので、まれに C より速いこともあるらしい。特に巨大なグラフを作る場合、ほとんどの処理は C などで書かれた関数に飛ぶので、速度的な問題は無視してもいいくらいである(逆に、

    Python でグラフ・(疎)行列計算するためのライブラリを紹介するよ - 武蔵野日記
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 大学教授も楽じゃない - 武蔵野日記

    id:takehikom さんの日記の大学教授という仕事〜How To Become A Professorというエントリにて知り、ご飯べながらつらつらと読んでみた。目に優しい感じなので、30分くらいで読める(笑) 大学教授という仕事 作者: 杉原厚吉出版社/メーカー: 水曜社発売日: 2010/01/25メディア: 単行(ソフトカバー)購入: 7人 クリック: 139回この商品を含むブログ (22件) を見る 来はこういう話は学会の懇親会に出たりして内輪話で聞くような話(というかそういうところに行くといつも聞くような話ばかり)であり、若い学生たちがそういう年上の人たちの集まるところに顔を出さず、こういうばかり読んで「大学教員の仕事ってこんななんだ」と思うのはよろしくないと思うのだが、最近は Twitter をやっている人も多いし、Twitter で「学生の指導だん。これから研究費

    大学教授も楽じゃない - 武蔵野日記
    Gln
    Gln 2010/03/12
    「大学教授という仕事 作者: 杉原厚吉」