サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
体力トレーニング
leoclock.blogspot.com
来年度から法改正により、大学の役職名が変わります。友人のブログによくまとまっていたので引用すると、 あるべき姿 Professor→教授 Associate Professor→副教授とか? Assistant Professor→助教授(これが素直な訳) Research Assistant→助手 昔の過ち Professor→教授 Associate Professor→助教授(←これが取り返しのつかない大間違い) Assistant Professor→助手(←ここの境があいまいなのも間違い) Research Assistant→助手 来年度からの法改正 Professor→教授 Associate Professor→准教授(うーん) Assistant Professor→助教(笑) Research Assistant→助手 なんだそうです。役職名を国際標準に合わせたいという
フラッシュメモリーを使ったSolid State Drive (SSD)の容量が160GBに到達し、市場価格も下がってきたことにより、ハードディスクの代替品としてSSDを使う用途がいよいよ現実味を帯びてきました。低容量のものなら既にiPodやデジカメ用のメディアなど身の回りにも普及しており、市場ではすでに「破壊的イノベーション(「イノベーションのジレンマ―技術革新が巨大企業を滅ぼすとき」より)」が起こっているといえます。(HDD搭載のWalkmanとか既に滅んでいる例もあるし。。。)
博士課程には、二人として同じ学生はいない。そして、教師がすべきことも個々の学生に応じて変わる。自分のキャリアを振り返ってみて、うまくいったいくつかの方法と、よく使われているけれど実際には学生のためにならないやり方というのがよくわかるようになった。まず初めに述べておくと、教師のゴールとはどうやったら学生が自分自身の力で考え、新しいアイデアを組み立て、問題を解ける人になれるかを教えることだ。
研究が論文を書いて終わりでないなら、こんな心配をする必要はないはず。 自明なことを述べた論文は掲載されない(中略)「原理が複雑であまり便利でないシステム」の方が論文として 発表されやすくなってしまう 論文査読のシステムでは、確かに、査読者のめぐりあわせ次第で、重要な技術でも適切に評価されないことがある。けれど、もし本当に便利でないのならば、将来的に引用されることもなく、実用化もされず、論文の海の中に埋没するだけではないだろうか。 本当に便利なものだけを学会・論文誌に載せたい心情は理解できるが、実際、技術の本当の便利さがわかるのは、研究の結果が世に出てからのこと。つまり、便利さや将来的な世の中へのインパクトというのは、未来に起こる話であって、研究成果を発表する時点でそれを実証せよというはなんとも酷なように感じる。 (査読で便利なシステムを取り上げられない)問題を解決するのは簡単で、 論文の発
今回、縁があってこの本の出版のお手伝いをさせていただきました。内容はやや難し目のパズル問題集。すべての問題に目を通して、紙と鉛筆で解けるものもあれば、実際に手を動かしてプログラムを書いてみたり。前半は、プログラマでない人でも取り組めるようになっていますが、お勧めは実際にプログラムを使って解く後半。 プログラミングコンテストに挑んだことのある人には、もうおなじみの考え方だと思います。普通の人間ならやらないけれど、コンピュータというお供がいると、すべての可能性を調べ上げるような愚直な方法でも着実に実行してくれる。その様子を見て、人間がより良いアルゴリズムを思いつく、というサイクルが問題を通して学べます。
(最初に)長文です。そして、このエントリ、特に後半部分は、むしろ今「親」になっていない人、あるいは、子供に手がかからなくなってきた人に読んで欲しいと思っています。 「研究している間、子どもはどこにいるの?」研究に限らず、夫婦共働きなどでも気になるこの話。ボストンに留学中のtsugo-tsugoさんに、アメリカでの様子を教えてもらいました。(アメリカは州によってぜんぜん法律が違うことは念頭に置いて読んでください。) マサチューセッツ州の場合、14才以下の子供だけを家においておくのは幼児虐待とみなされ、それに気づいた周囲の人には通報義務があります。ということで、周囲の話を聞いてる限りでは、子供の保育園、学校がない時間帯はベビーシッターを雇うか、常に家に両親どちらかがいるはずです。ベビーシッターは、教会や大学、近所のコミュニティ等で近所の学生等を紹介してもらう無認可のサービスが多いです。 法律の
Yahoo! Researchの"Generating Example Data for Dataflow Programs"は恐らくPig Latinのデバッグ用のサンプルデータ生成の話。Hadoopなどの上で、複雑なデータ構造を動的に組み立てていくプログラム書きながら、横に実行結果の例を「適切に」示したサンプルが表示されると、わかりやすいよね、という話。”Towards a simpler XML Schema: effortless handling of nondeterministic regular expressions”はついに来たか、という感じ。Relational styleの考えが入っていて、スキーマ(relation)から考えられるいろいろな木構造をNFAを使って同時に検証する、という流れだったら嬉しい。"DDE: From Dewey to a Fully Dyn
例えば大学4年で卒業し就職してしまうと(法学部や経済学部に多い)全くといっていいほど研究の世界を知らないまま社会に出ることになります。日本では、報道などのメディアに就職する方も学部卒ということが多いため、テレビ・新聞などで研究の世界について深く書かれた記事を目にする機会はほとんどありません。 NHKのサイエンス・ゼロなどの番組で、研究者の様子を垣間見ることもできます。しかし、番組は研究の世界の一側面を見せているだけであり(取材時間に比べてカットが多く、内容も製作者の主観に左右される)、研究の世界で活躍していて評判の高い人は、実はほとんどメディアにでてこない事情もあります(「21歳からのハローワーク(研究者編)」を参照)。そのような研究者は、論文という形で一生懸命アウトプットを出しているのですが、論文は学部教育や大学院、博士での研究トレーニングを経ないと読みこなせない(研究の内容だけでなく、
今日発表されました。 今年のPODS2009は面白そうです。XML関連の研究もまだまだ盛ん。研究の世界ではやりの、Uncertain dataは多くなってきていますが、それだけでなく、heavy-hitterとか、secondary indexingとか、DBのcore技術寄りの論文もあるみたいで、論文が出てくるのが楽しみです。 採録された中には、日本人(面識はないのですが天野さんという方)も一人。Libkinのラボにいるのですね。おめでとうございます。こうやって日本からデータベースコミュニティの中で活躍していけるようになる人が増えるとうれしいですね。 29 Dynamic Indexability: The Query-Update Tradeoff for One-Dimensional Range Queries (Ke Yi) 31 Satisfiability of the do
写真の画像を一括変換してPDFにするとします。ImageMagickを使って、例えばデジカメで取った写真photo1.jpg, photo2.jpg, ..., photo10.jpgのコントラストを上げて、色を調整して、1つのPDFファイルにするコマンドは以下の通り: > convert -adjoin -sigmoidal-contrast 3,0% -normalize photo<1-10>.jpg out.pdf convert -thumbnail 100 'out.pdf[5]' なんて書き方で、pdfの6ページ目(0 origin)だけを取り出してthumbnailをつくるなんてこともできます。
As a programmer, I have many things to hack, but unfortunately I am not smart enough to remember everything to code after I slept. In the next morning, I usually forget some features to code. Bug Tracking System (BTS) is useful to keep remembering these tasks. Joel Spolsky also wrote an article about Bug Tracking Systems, and I totally agree with what he said; Bug tracking system is necessary to
Googleの検索結果に「このサイトはコンピューターに損害を与える可能性があります」と付くので、不思議に思っていたら、Googleのサイトそのものも損害を与える可能性があるそうで。
Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。 けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。
岡野原君が自然言語処理関連で2008年に読んだ論文のベスト5を紹介しています。それに倣って、僕も個人的にインパクトのあった2008年のデータベース研究のベスト5を集めてみました。 Michael J. Cahill, Uwe Röhm and Alan D. Fekete. Serializable Isolation for Snapshot Databases. SIGMOD 2008. (ACM DOI) 真っ先に思い浮かんできたのがこの論文。SIGMOD2008のベストペーパーでもあります。僕自身、トランザクション処理を長く研究していた経験から、Serializability(ディスクのread/writeの順番をあるプロトコルに従って入れ替えても、データベースの検索・更新結果に影響を与えない)を保障しつつ、一秒間あたりに処理できるトランザクションの数(つまりスループット)を上げる
ごめんなさい。タイトルは釣りです。TOEICは受けたことすらないので、990点がいったいどんなレベルなのか想像もつきません。ただ、「英語を使う」のが目的なら、そんな点数を上げるための努力はしなくていいだろうなとは思ったので、英語を使う、特に「話す」ための要点をまとめてみます。 僕自身、国際学会などで海外に行く機会は年に何回かありますが、そこでのトークを聞くと、中国系の人、インド系の人、東南アジア系の人、ヨーロッパ系の人とで、それぞれ発音の仕方が全然違うことがわかります。中でもインド系の人の発音はあまりブレス音を使わないせいか、慣れないうちは本当に英語を話しているのか?と耳を疑うほどです。日本語の方言をイメージすると、この状況がわかりやすいと思います。東北弁などは、聞き慣れない人にとってはまるで外国語のように聞こえますよね。 発音は違えど、皆、英語という共通語を通して、コミュニケーションをと
(長かったので前エントリを分割しました) 久々に本郷をお散歩してきました。東大の本郷キャンパス周辺のアカデミックな雰囲気がとても好きなんです。カフェに入ってもなにやら難しそうな英語の文献を読んでいる人が多かったりと。今日は、新しくできたUT Cafe(赤門入ってすぐ)に行ってきました。 最近の東大はとってもおしゃれですね。店内も赤をアクセントに使ったりと、表参道の通りのカフェみたいな雰囲気。お茶をしながら、研究のことを考えノートに マインドマップを描いていました。何もない静かな部屋に一人でいるよりも、人の動きのある中で自分の場所が持てるカフェのような環境の方が、かえって集中 できるので好きです。 博士課程のころは、部屋に一人ぼっちで寂しいことが多かったので、その孤独を乗り越えるためにカフェの存在は必須で した。最近はカフェで作業することもほとんどなくなったので、昔を懐かしみつつ、ノートひと
今学期は、久々に大学の講義に参加してみています。 講義の形態は、学生が毎回発表するというもの。 修士1年の学生さんが多いせいか、覇気が足りない。。。 課題を与えられたら、与えられた文献しか読んでこない人とか、それすら読みこなせていないというのがちらほら。自分が発表したときは資料探しから始まって、何百ページもある資料にいくつも目を通して、基本を学んで、実験評価もして、と相当時間を費やして望んだのに、他の人からそれくらいの気概が感じられなくて、悲しい限り。(東大生なんだから1週間もあれば英語で100ページくらい読んできてよ! というのが本音) もちろん、プレゼンテーション技術が未熟なこともあるのだけれど、それ以前に、一つのトピックをわかりやすく紹介するには、そのトピックだけでなくて、トピックを含むもっと広い分野の知識が必要という認識がまだない様子。 それだから、プレゼンを聞いていると、この研究
先日のエントリで少し話したのですが、僕が在学していたときの東大にはデータベースを学ぶためのコースというものがありませんでした(DB関係の授業は年に1つか2つある程度。現在はどうなんだろう?)。そんなときに役だったのは、やはり教科書。読みやすいものから順に紹介していきます。(とはいってもすべて英語の本です。あしからず) 一番のお薦めは、Raghu Ramakrishnan先生 (現在は、Yahoo! Research) の「Database Management Systems (3rd Edition)」。初学者から研究者まで幅広く使えます。データベース管理システム(DBMS)の基本概念から、問い合わせ最適化、トランザクション管理など、これらを実装・評価するために必要な、「DBの世界での常識」が、丁寧な語り口でふんだんに盛り込まれています。この1冊を読んでおけば、DBの世界で議論するための
以下の記事を読んで、これは大学としての文化が違うのだなと感じました。 大学ってもっとすごいところだと思っていた。 なんかこう、毎日が発見に溢れていて大学じゃなきゃ知り得ないことがたくさんあって・・・ そんな素晴らしい世界だと思っていたのに・・・。 大学で秘伝を習うたった1つの方法 対価を支払っていないから秘伝を知り得ていないのだ。そこにいる人たちの中で、賢い人たちは全員秘伝を知っているし、その取得方法もわかっている。 とりあえず自分が、秘伝を教えてもらえるのにふさわしい対価を払えるようになろう。さすれば、自然と大学にある知の秘伝があなたのものになる。 どうやら大学には「秘伝」なるものがあって、それは「対価」を払って「教わる」か「引き出す」ものらしいです。「対価」として考えられるのは、学生さんのポテンシャルであったり、議論していてわくわくさせてくれるような「きらりと光る何か」だと思います。そ
先日、ACM SIGMODの日本支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。 この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。
► 2015 (2) ► 9月 (2) ► 2011 (4) ► 12月 (2) ► 11月 (2) ► 2010 (2) ► 1月 (2) ► 2009 (45) ► 12月 (1) ► 10月 (2) ► 9月 (4) ► 8月 (4) ► 7月 (3) ► 6月 (5) ► 5月 (6) ► 4月 (5) ► 3月 (5) ► 2月 (1) ► 1月 (9) ▼ 2008 (48) ▼ 12月 (7) XML時代の終焉 ~ XMLから再びCoddへ Gmailのショートカットキーが覚えられないときは [講演案内] Relational-Style XML Query Michael Crichtonの思い出 Googleで論文が書けるか? はてなブックマークレットのデザインを変更する SQLite JDBC 3.6.6.2 リリース ► 11月 (15) ► 10月 (6) ► 9月
sshでサーバーをいくつか経由して、目的のサーバーに接続する方法です。 sshで、server(Bとする)に接続したいけれど、severBは、serverAを経由しないとアクセスできない位置に設置されているとします。 localhost -> serverA -> serverB ssh serverA ssh serverB と実行すれば一応接続できるのですが、ssh (remote host) (command ...)という構文で、コマンドを実行するだけなので、serverBにログインした後、すぐconnectionが切断されてしまいます。 rsyncなどは、この形式でも、以下のように使えば、serverBのデータを取得できます。 rsync -av -e 'ssh serverA ssh' serverB:./(src) (dest) 本題のsshですが、 ssh -t serve
A common question I get is "How hard is it to publish at Google?" I want to dispel the myth that it is hard. It is easy to publish, easy to put code into open source, easy to give talks, etc. But it is also easy for great research to become great engineering, and that is an incredible lure. (よく受ける質問が、「Googleで論文を書くのは難しい?」というもの。実際難しくはないし、コードをオープンソースにしたり、発表したりするのも問題ない。それに、いい研究をいい製品にもしやすい。それがGoogleの魅力
梅田さんが、なぜ、それも日本ではなくシリコンバレーにおいて、「弾さんは英語が出来てうらやましい」と、ふと軽く、しかし底知れぬ諦念をもって嘆息したのかが。 まず、本書は英訳されねばならない。皮肉かもしれないが、それが著者の願いを成就させる最短距離である。そのために、私も出来ることをしたい。残念ながら私の英語力は本書を訳出するにはあまりに不十分であり、それ以前に日本語、そして文学の教養が足りなさ過ぎる。と、文学的作品を書くレベルの英語力に至らないことを認めています。御二方とも、実用上の英語には困らないほどの力を持っていることは十分伺えますが。弾さんの場合は、日本語コンプレックスと言うべきものもあるようで。あれだけの日本語の読解力があり魅力的な文章を書ける人なのに、不思議。人の悩み・コンプレックスを推し量るのは難しいということですね。
以前のエントリ「知性が失われてはじめて言語が「亡びる」」では敢えて「知性」とは何かを定義しないで話をしています。「丁寧な文体」が「知性」と同一だとは言っておりませんので、あしからず。それゆえ、リンク先での「知性」とは何かという議論に反論する理由はなくて、実際、そのとおりだと思います。 少なくとも、僕ら研究者は「知性」を育て「知性」を見出す仕事をしています。つまりは現場の人間です。言葉がつたなくても、対話的にその人の持っている可能性などの「知性」を見出すのが大学という場であり教師の仕事なら、「知性」を持っていることを自らが外に伝えるのが論文です。論文の場合、表現やプレゼンテーションなど、「知性」を伝える力も含めて「知性」と考えます。 もちろん、中身がからっぽでいいかげんなら、きれいな文章でいくら取り繕ってもだめです。 論文を書くということは、自分の知性を他に認めてもらう行為です。but, b
XMLデータベースの研究しているのになんですが、僕個人としては XML形式でデータを管理することはお勧めしません。 XMLデータを手で記述するなんていう作業はもってのほかです。 XMLは一部を間違って操作するだけで、全体がよくわからないデータになります。 Gmailで動的データ通信に使われているAJAXという技術もあって、この最後のXはXMLのことなのですが、データのやりとりはXMLでいいけれど、データの操作はXMLでないほうがいいとさえ思っています。 けれど、これをお勧めできるようにする技術の研究をしています。 企業の方などで、XMLデータベースを導入しようとしている考えている方は、 それよりも、まずrelational databaseのことを学んでください。今のrelational databaseにできなくて、XMLにできることは、そう多くはありません。逆にXMLにできないことの方
論文が読みやすいとしたら、それは良く練られているからだ。そもそも、わかりやすい表現が良いというのは、日本語、英語の区別がない。文章を吟味することから「逃げ」て済むなら良いが、それでは投稿してもろくに読まれないから身を滅ぼす。安易にこのような考えに同調する人がいるのがとても心配だ。 日本人が書いた日本語論文であっても読みにくい例の枚挙には暇がない。口語の方がわかりやすい?口語中心のブログでも読みにくい文章はうんざりするほどある。(例えば、「日本語が亡びるとき」の書評を批難したり、あるいは水村美苗本人を攻撃するときに、読みやすく、かつ、知性をうかがわせる文章で応えた人はほとんど見受けられない) もし世界の標準が「日本語」で、皆が日本語で論文を書くようになったとしたらどうだろう。段落ごとに「てにをは」や「漢字」の間違いが出てくるような論文は、すぐに読む気がなくなってしまうのではないだろうか。 崩
といいました。・・・可憐なディズニープリンセス(シンデレラや白雪姫、ジャスミンなど)の絵なのに、「ぱわふる」?
► 2015 (2) ► 9月 (2) ► 2011 (4) ► 12月 (2) ► 11月 (2) ► 2010 (2) ► 1月 (2) ► 2009 (45) ► 12月 (1) ► 10月 (2) ► 9月 (4) ► 8月 (4) ► 7月 (3) ► 6月 (5) ► 5月 (6) ► 4月 (5) ► 3月 (5) ► 2月 (1) ► 1月 (9) ▼ 2008 (48) ► 12月 (7) ▼ 11月 (15) 論文を書く前に知ってほしい「言葉」の大切さ 知性が失われて初めて言語が「亡びる」 こどもから教えてもらった「日本語が亡びるとき」 AdSenseをやってみた - 追記 - AdSenseをやってみた エジソンのお箸 21歳からのハローワーク (政治家編) 21歳からのハローワーク (ブロガー編) 21歳からのハローワーク (プログラマ編) 21歳からのハローワーク
次のページ
このページを最初にブックマークしてみませんか?
『Leo's Chronicle』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く