タグ

2008年5月3日のブックマーク (3件)

  • Музыка | Катя Чехова

  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

    zee8
    zee8 2008/05/03
  • 会社と個人の関係の日本とカナダでの違い

    ではなぜ、会社の存在感がなぜ日とカナダ(多分北米)でそうも違うのか。 会社と人との関係を比較すると、以下のように喩えるのがいいかもしれない。 日の場合は、やはり土着の農耕民族に喩えられる。 重要なものは、土地とそこに住む人である。なので、村での人の出入りがあまり無いほうが好ましい。 村には、必ず重鎮がいる。重鎮の言うことは絶対である。 昔豊作だった時代のことをいつまでも忘れていないので、その経験を元に判断する。 若い世代は、それではうまく農作物が育たないことが分かっているのだが、なかなかそれをうまく伝えられない。 とりあえず、足しげく田畑に通って、収穫率の低い農作物を丁寧に育てるしかない。 儲からないのは分かっているが、将来にわたって安定した収入が得られることがもっとも安心できる。この安心感が最重要である。 だから米を作っていた人が、減反によって、野菜を作ったりというような方向転換を行

    会社と個人の関係の日本とカナダでの違い
    zee8
    zee8 2008/05/03
    海外に住んだことないけど、「そこまでやらないと続かない田畑なら潰せば?」と思ってしまうなあ。