タグ

ブックマーク / komachi.hatenablog.com (12)

  • オリジナリティを徹底的に追求する - 武蔵野日記

    MIT メディアラボの石井さんの記事がおもしろい。前この記事をどこかで読んだ気がするのだが、再度取り上げる。 この記事は、NTT 研究所で働いていた石井さんが、どのようにして MIT メディアラボにヘッドハントされたのか、そしてヘッドハントされてからどういう環境の中で生き抜いてきたのか、が赤裸々に語られている。たとえば、 「今までで取り組んできた研究の良さは分かった.でも同じようなものは MIT では絶対続けるな.全く新しいことをやれ.人生は短く新しいことに挑戦するのは最高のぜいたくだ」. と言われ、NTT 研究所時代にそれなりに成功を収めていた研究を全て捨てて、一から新しい研究を始めることにしたそうである。前マイクロソフト基礎研究所“最強伝説”でも書いたが、「一つの分野で成功した研究者に、同じ分野で研究させるのではなく、新しい研究テーマに向かわせ、開拓させる」というのが、常にトップを走り

    オリジナリティを徹底的に追求する - 武蔵野日記
    tarchan
    tarchan 2010/01/26
    >テニュアというのは「これから先ずっと大学教員をしていていいですよ」という権利のことであって、日本でも少しずつ導入されている
  • ソニー VAIO のサポートがひどかった件について - 武蔵野日記

    12月は VAIO の修理を依頼していたのだが、なんだかなぁと思う対応に振り回されたのでその顛末。検索すると他の人もひどいと書いている(ユーザ調査でも絶対上位ランクインしない)ので、自分だけではないと思うが、たまたま当たった人(たちx4)が悪かった可能性もあるし、他の会社でもひどい対応を受けた人もいると思う。Apple の対応がひどかったとか、いやいや大学名を出すと Apple は扱いが全然違うとか、うーん、と思う意見もいただいたが、たぶんこの業界で一番対応がよいのは IBM (ThinkPad) であるという認識は恐らく全員共通しており、自分もかれこれ指折り数えるくらい ThinkPad の修理を頼んでいるが、「え、ここまで交換してくれるの?!」というようなところまで換えてくれたり、修理も非常にスピーディなので大変好感が持てる。 今回のソニーの対応は、端的に言うと「修理のためにデータの初

    ソニー VAIO のサポートがひどかった件について - 武蔵野日記
    tarchan
    tarchan 2010/01/06
    チェック用に怪しげなソフトをインストールしてて、それを消すには初期化するしかないとか?
  • 病み上がりにとんまさのジャンボカツ - 武蔵野日記

    研究室に来ると manab-ki くんが「今日はがっつり行きませんか」と誘ってくれたので、みなさんと「がっつり亭」と言うところに行く予定だったのだが、「とんまさ」という(奈良では有名な)がっつり系のお店にみんな行ったことがないそうなので、manab-ki, katsumasa-y, masakazu-i, hayato-g (敬称略)と自分の5人で「とんまさ」に行く。 みんな思い思いに注文するのだが、hayato-g くんが頼んだ「百匁とんかつ」というメニュー、揚げる前にお肉と秤を持ってきて「これでいいですか」とおばちゃんが彼に訊いていたり。いや、「だめです」と言えないし……(百匁は600gらしい) で、これそのまま角煮に使うような肉を揚げるらしく、こんな感じに↓ (厚さが3cmくらいあるので、隠れているけどナイフとフォークがついて来る!) そして manab-ki くんの頼んだチキンカツ

    病み上がりにとんまさのジャンボカツ - 武蔵野日記
  • コンピュータ将棋は来年プロ4段に追いつく - 武蔵野日記

    情報処理学会の機関誌「情報処理」の2009年9月号の小特集「コンピュータ将棋の新しい波」がおもしろい機械学習に基づく局面評価関数のパラメータ(重み)調整を取り入れた Bonanza が話題をさらったのは記憶に新しいが、今年の世界コンピュータ将棋選手権ではソースコードまで全部公開された Bonanza を用いた手法が多数登場したらしい。(というのはtihara さんの日記で知っていたが) ちなみに優勝したのは GPS 将棋であり、p.871に ktanaka 先生や@shnskさん、@gyoshiki さんたちの写真が掲載されている :-) 棋譜や全体の結果は特集を参照してもらうとして、興味深いのは勝又6段の「プロ棋士から見たコンピュータ将棋」と伊藤さんの「合議アルゴリズム『文殊』」。先に後者のほうについて話すと、文殊は多数のプログラムの合議をして多数決で差し手を決めるシステムで、単にア

    コンピュータ将棋は来年プロ4段に追いつく - 武蔵野日記
  • Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記

    最近次世代「検索」エンジンが登場しつつあるが、彼らのすごいところは検索結果ではない。たとえば Mathematica を作った会社が Wolfram|Alpha や最近検索に異様に力を入れている Microsoft が Bing を開発中だとアナウンスされたが、彼らが真にすごいのは、現在の自然言語処理(や情報検索などの周辺技術)の精度では恐らく不可能だと思えるようなことをやろうとしている、もしくはやっているところだと思う。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解析器を作っているので仕方な

    Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記
  • 自然言語処理における半教師あり学習のテキスト - 武蔵野日記

    最近移動続きであまり研究に時間は割けないのだが、は読めるということでを2冊、サーベイ的な記事を3(うち2はチュートリアルスライドつき)を紹介する。まず Semisupervised Learning for Computational Linguistics (Chapman & Hall/CRC Computer Science & Data Analysis) 作者: Steven Abney出版社/メーカー: Chapman and Hall/CRC発売日: 2007/09/17メディア: ハードカバーこの商品を含むブログ (4件) を見る を読む。このの著者の Steven Abney はブートストラッピングの理論的解析をした人で、 Steven Abney. Bootstrapping. 40th Annual Meeting of the Association fo

    自然言語処理における半教師あり学習のテキスト - 武蔵野日記
  • ウェブ系の研究をするなら Microsoft に行くべき - 武蔵野日記

    SIGIR 2009 の採択論文が発表されていたようだ。SIGIR というのは情報検索に関する世界で一番権威ある国際会議で、情報系の国際会議ランキングでもトップ10にランクインしている。その採択数が一番多いのは Microsoft、二番目が Yahoo! 次いで Google (でも3だけ)という結果に。 なぜ採択数(率)が問題になるかというと、情報系の国際会議というのは最新の研究成果を発表する場であり、投稿された論文に2人以上の査読者がついて各項目について点数をつけ、一定点数以上のものだけを採択するので、国際会議のランクに応じてそれなりのクオリティの論文が書けないとそもそも通らないし、1人で書ける論文の量にも限界があるので大量に通せる研究機関は研究者の層も厚いことが分かるからである。 上記リンク先でも書いてあるが再度引用すると、 38% of the papers have at le

    ウェブ系の研究をするなら Microsoft に行くべき - 武蔵野日記
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 今年の夏は Apple でインターン(統計的手法を用いたことえりの研究開発)します。 - 武蔵野日記

    前この日記でも取り上げたが、Apple で統計的手法を用いたかな漢字変換の研究開発インターンの募集があった。 紆余曲折はあったが……。(自分で写真貼ってみて、白い MacBook に見えると思った) 元々科学史・科学哲学専攻から自然言語処理の大学院に来たのも、あまりプログラミングするほうじゃなかったのだが、かな漢字変換のソフトを自分で書きたいなと思ったのが第一の動機(だから ChaIME も作ってみた)なので、こういう機会があってよかった。今から超楽しみ! Microsoft Research で2年前インターンしたときは(シドニー大学に1年いたとはいえ)初めてのアメリカで不安だったが、今回は2回目なのでだいぶ勝手も分かっているし、海外のインターンはかなりプログラムが充実していることも知っているので、心配事も(博士論文を除けば……)あまりない。仕事おもしろいだろうしな〜 Mac のかな漢

    今年の夏は Apple でインターン(統計的手法を用いたことえりの研究開発)します。 - 武蔵野日記
    tarchan
    tarchan 2009/02/27
    がんばれーー!!
  • Apple で統計的かな漢字変換エンジンを研究開発するインターンシップ - 武蔵野日記

    Apple Inc. において自然言語処理のできる学生インターンを募集しますということで、khdd.net の中の人やびぎねっとの宮原さんに教えてもらった(Twitter でも流れていた)のだが、Mac日本語入力システムを統計的手法に移行したいそうで、そのサーベイとプロトタイプを作る学生を募集しているそうだ。 Will work on investigating and prototyping methods to improve Japanese input utilizing statistical methods. Position is available in Tokyo and Cupertino. The position requires proficiency with C and/or C++, and scripting languages such as per

    Apple で統計的かな漢字変換エンジンを研究開発するインターンシップ - 武蔵野日記
  • Google サジェストのローマ字検索機能 = Google IME - 武蔵野日記

    Google サジェストがもっと便利にという記事で、検索窓にローマ字で入力しても Google サジェストに変換した候補が出るようになったことを知る。(前からできたような気もするが……Google サジェストではなかったかも) それでこの記事に関するはてなブックマークのコメントを見ていて、これ migemo の発展版と見ている人が大勢いるのかぁ、とはっとする。自分的にはかな漢字変換の発展版だと思っていたのだが……(ローマ字→かな漢字変換してくれて検索する、という意味で。多言語情報検索の単言語版と見てもよいかも)。以下、実際どういう技術でやっているのかは推測にすぎないが、Migemo との比較で考察してみる。 Migemo としては 仕組みは簡単です。利用者が 1文字入力するたびに、ローマ字列か ら正規表現を生成して、それで検索するという力技な方法です。 ということで、たぶんクエリに対する検

    Google サジェストのローマ字検索機能 = Google IME - 武蔵野日記
  • 日本語が工学の言語になろうとしていた時期 - 武蔵野日記

    昨日のエントリに関して何人かから「研究者」として紹介されたのがちょっと嬉しかった。国語問題に関しては4年前の研究で、しかも続きをやっていないので、なんとも言えないけど……。 アイデアはいくつかあって、特に関心があったのは、大東亜共栄圏の学術語(前述ので言えば「共通語」)として日語が生き残る、という筋道は、日が植民地時代の言語政策にもう少し関心があれば、ありえたと思うし、それについてもっと検証したい、と言うのが一番大きい。 たとえばトラックバックいただいたが英語とかガラパゴスとかフラット化とかで、つらつらと考えること。で 他の国が多くの分野で一番になったら、その国の言語が共通言語になることがあるかもしれない。しかし、アメリカが建前であっても自由の国で他の国からどんどん人を集める限り、アメリカが一番であり続けるだろう。ロシア中国政治的に、フランスや日は面積的にアメリカと同じことはで

    日本語が工学の言語になろうとしていた時期 - 武蔵野日記
  • 1