東京大学 医療言語処理グループ medical natural language processing group SITE MOVED new URL http://mednlp.jp Copyright (c) 2008 Sitename.com. All rights reserved. Design by Free CSS Templates.
http://d.hatena.ne.jp/cafebabe/20091219/1261194304えーと。所属は研究開発とゆーことになってても、本人のやってることが研究、開発どちらにも該当しない人ですら、結構研究開発職です(キリッ!)とか言えちゃうのが日本企業クオリティです。これは本人の認識不足だけではなくて、日本企業の場合本人の責任範囲が曖昧で、年次どころか人によって引き受けられる責任と仕事の質と量がばらばら、具体的なjob descriptionが存在しないからだと思います。ただ、よくよく周りを見ているとなんとなく役割分担はされていて、研究テーマ、問題そのものを立案する人その問題に仮説を与え、解決方法を考える人解決方法に従って実験、解析を実行する人(パシリ)とゆー順番で、ゆるい役割があります。1〜3を全部一人でやる人もいますし、3しか出来ない人もいます。研究や開発のやり方は、あんまり
グーグルには、勤務時間の20%を自由な企画・開発に当てていい「20%プロジェクト」という制度がある。Google検索での誤入力に対して、正しい検索キーワードを勧める「もしかして」というスペリングコレクション機能を担当している、ソフトウェアエンジニアの工藤拓氏が、同じくエンジニアの小松弘幸氏と、この「20%」で進めていたのが「Google日本語入力」だった。 工藤氏が「変換」のコアな部分、小松氏がWindowsやMacintoshといったマルチプラットフォームへのつなぎ込み部分を主に担当してプロジェクトを進めた。そして仮バージョンができた時点で、相談を寄せたのがシニアプロダクトマネージャ(当時)の及川卓也氏だ。 2010年に登場するChrome OSへの搭載も予定され、Googleの日本展開の重要なツールとなるGoogle日本語入力の生みの親に、その狙いや開発の思想を聞いた。 Google日
アニメや漫画の作品ロゴは見た瞬間にそれとわかる特徴的なものが使われていますが、時にはその言葉を入れ替えて遊んでみたくなるもの。しかし、ロゴの大きさや色、フォントを似せて自分で作るとなると結構めんどくさいので、あまり手軽に遊べるものではありません。 そんな悩みを解決してくれるのが「とある櫻花の画像生成」。アニメ化もされた人気ライトノベル「とある魔術の禁書目録」にそっくりなロゴを簡単に生成してくれます。色も「とある魔術の禁書目録」の青色ロゴと、「とある科学の超電磁砲」の赤色ロゴが選べ、非常にいい感じです。 詳細は以下から。 とある櫻花の画像生成 http://to-a.ru/ 作り方はカンタンで、「とある」と「の」が固定されており、その間の言葉を自由に入力し、ロゴが縦か横か、色合いは赤か青かを決めて作成するだけ。 空欄で作るとこんな感じ。 「とある賢者の虚脱時間(ロストクロック)」。ハイパー賢
常識に縛られない異才・奇才が未来技術を切り開く。常識破り、型破りの発想をもったクレイジーエンジニアを紹介する第三回は、“聞くだけで彼女ができる”という謳い文句で話題になった『奇跡の着うた』の開発者としても知られる苫米地英人氏だ。世界を舞台に活動する脳機能学者の世界観とは。 聞くだけで彼女ができる、胸が大きくなる……。そんなうたい文句の携帯着うたが登場、1週間で1万ダウンロードを超えるヒットを記録した。鍵になる技術は脳波のコントロール。開発者は脳機能学者、苫米地氏だ。オウム真理教事件で、信者たちの脱「洗脳」を手がけ、マスコミに登場した彼だが、もともとコンピュータ・サイエンスの世界では有名な人物だった。まだ日本で人工知能がほとんど知られていないころ、彼はエール大学大学院で人工知能の父と呼ばれるロジャー・シャンクに学び、その後、カーネギーメロン大学で博士号を取得する。5年に一人しか出なかった当時
稲垣さんと愛用のau携帯。高校のころ「まめぞう」というキャラが表示されるJ-PHONE(当時)の携帯で友人とメールを送りあい、大学入学に合わせて「学割」のあるauに変えたという 「携帯のIMEはどんどん進化し、使っていて楽しいのに、PCのIMEはほとんど進化していない」――新日本語入力システム(IME)「Baidu Type」(バイドゥタイプ)は、“ケータイ世代”のそんな問題意識から生まれた。 企画したのは、バイドゥのプロダクト事業部に所属する稲垣あゆみさん(27)。中学生のころからPHSを使い、高校からは携帯のヘビーユーザー。文字入力は「携帯とPCでほぼ同じか携帯の方が速いぐらい」で、ブログもTwitterも携帯から更新。美しくネイルアートを施した爪で高速入力する“イマドキの女子”だ。 稲垣さんはPCのIMEに物足りなさを感じてきたという。携帯は自分の入力した内容をどんどん学習し、思い通
昔書いたことがあったけど、どこかにいってしまったのでもう一度書いてみた。推論方法にはギブスサンプリングと変分ベイズの2つがあるけど、導出も実装もより楽なcollapsed gibbs sampling(Griffiths and Steyvers, PNAS, 2004)の方を採用。 Token.java package lda; public class Token { public int docId; public int wordId; public Token(int d , int w){ docId = d; wordId = w; } } LDA.java package lda; import java.util.*; public class LDA { int D; // number of document int K; // number of topic int
最近読んだトピックモデル関係の論文のざっとしたメモ。内容については間違って理解しているところも多々あると思います。 (追記 12/24) 最後のほうに論文を読む基礎となる文献を追加しました。 Efficient Methods for Topic Model Inference on Streaming Document Collections (KDD 2009) 論文の話は2つあって一つ目がSparseLDAというCollapsed Gibbs samplerの省メモリかつ高速な方法の提案と2つ目はオンラインで文章が入力されるような場合において訓練データと新規データをどう使うかという戦略について述べて実験している。 Collapsed Gibbs samplerを高速化しようという論文はPorteous et al.(KDD 2008)でも述べられているけどそれよりも2倍ぐらい高速(通
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く