Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日本語では、単語の境界はそれほど自明ではないため、日本語特有の処理をする必要があります。 日本語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ
ではなぜ、会社の存在感がなぜ日本とカナダ(多分北米)でそうも違うのか。 会社と人との関係を比較すると、以下のように喩えるのがいいかもしれない。 日本の場合は、やはり土着の農耕民族に喩えられる。 重要なものは、土地とそこに住む人である。なので、村での人の出入りがあまり無いほうが好ましい。 村には、必ず重鎮がいる。重鎮の言うことは絶対である。 昔豊作だった時代のことをいつまでも忘れていないので、その経験を元に判断する。 若い世代は、それではうまく農作物が育たないことが分かっているのだが、なかなかそれをうまく伝えられない。 とりあえず、足しげく田畑に通って、収穫率の低い農作物を丁寧に育てるしかない。 儲からないのは分かっているが、将来にわたって安定した収入が得られることがもっとも安心できる。この安心感が最重要である。 だから米を作っていた人が、減反によって、野菜を作ったりというような方向転換を行
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く