タグ

2008年5月4日のブックマーク (4件)

  • MORI LOG ACADEMY: 再び「すぎ」について

    WEB Davinci Last update 20 Jun,2004. WuƂɂ͏cDɊ҂BvԊO WuguKN̍hɕqȕ|͂ǂꂾHvԊO eWB fڎ҂ɂ͒IŐ}v[gI ̃v`i{ 6/5UP cȐ̖{oł�Â錻݁A ̒{ɂ낢{ɏo̂͂ȂȂނB vĂǎ҂݂̂ȂɁA_EB`ҏW Acホテル東京銀座 東京都 Anaインターコンチネンタルホテル東京 東京都 Bulgari Hotel 東京都 The Aoyama Grand Hotel 東京都 THE GATE HOTEL 東京 by HULIC 東京都 ウェスティンホテル東京 東京都 キンプトン 新宿東京 東京都 グランドプリンスホテル新高輪 東京都 ザ・キタノホテル東京 東京都 ザ・キャピトルホテル東急 東京都 ザ・プリンスギャラリー 東京紀尾井町, ラグジュアリーコレクションホテル 東京都 シェラトン・グランデ・トーキョーベイ・ホ

  • MORI LOG ACADEMY: 本当に考えたの?

    WEB Davinci Last update 20 Jun,2004. WuƂɂ͏cDɊ҂BvԊO WuguKN̍hɕqȕ|͂ǂꂾHvԊO eWB fڎ҂ɂ͒IŐ}v[gI ̃v`i{ 6/5UP cȐ̖{oł�Â錻݁A ̒{ɂ낢{ɏo̂͂ȂȂނB vĂǎ҂݂̂ȂɁA_EB`ҏW Acホテル東京銀座 東京都 Anaインターコンチネンタルホテル東京 東京都 Bulgari Hotel 東京都 The Aoyama Grand Hotel 東京都 THE GATE HOTEL 東京 by HULIC 東京都 ウェスティンホテル東京 東京都 キンプトン 新宿東京 東京都 グランドプリンスホテル新高輪 東京都 ザ・キタノホテル東京 東京都 ザ・キャピトルホテル東急 東京都 ザ・プリンスギャラリー 東京紀尾井町, ラグジュアリーコレクションホテル 東京都 シェラトン・グランデ・トーキョーベイ・ホ

  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ