タグ

検索と技術に関するloca1982のブックマーク (7)

  • Google のインデックスやランク付けなどに関する、10 の誤解

    +1 ボタン 2 AMP 11 API 3 App Indexing 8 CAPTCHA 1 Chrome 2 First Click Free 1 Google アシスタント 1 Google ニュース 1 Google プレイス 2 Javascript 1 Lighthouse 4 Merchant Center 8 NoHacked 4 PageSpeed Insights 1 reCAPTCHA v3 1 Search Console 101 speed 1 イベント 25 ウェブマスターガイドライン 57 ウェブマスタークイズ 2 ウェブマスターツール 83 ウェブマスターフォーラム 10 オートコンプリート 1 お知らせ 69 クロールとインデックス 75 サイトクリニック 4 サイトマップ 15 しごと検索 1 スマートフォン 11 セーフブラウジング 5 セキュリティ 1

    Google のインデックスやランク付けなどに関する、10 の誤解
  • できないならやるなよ

    はてなブックマーク。 全文検索に対応したっていうから、後で使いそうなページをひたすらブックマークしてきた。 タグ付けは他の人に任せてとにかく蓄積だけしておいて、必要な時に検索で引っ張り出そうとしていたのだけど。 検索に成功することの方が少ないってのはどういうことよ。 インクリメンタル検索でさんざん待たされたあげく、「○○に一致する結果はありませんでした」。いっつもこれだ。 すぐ下に「『○○』を自分のブックマークから全文検索する」ってあるから、「お、代替手段は用意しているのか」と思ってクリックしてみたら今度は403 Forbiddenとか出るし。 どんな仕組みでやってるのかは知らないし大した興味もないが、ウリにしている機能が全く使い物にならないのはどうにも腹が立つ。 負荷で落ちるなら、インクリメンタルなんて百害あって一理なしだ。普通の検索でいい。 どっしりとしたクラウド作ってからそういうこと

    できないならやるなよ
    loca1982
    loca1982 2009/08/25
    たしかにもっと早くならないもんかね、と思うことが多い。検索もなんかいまいちなんだけどうまく言葉にできない。ちょっと考えてみよう
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    loca1982
    loca1982 2009/05/25
    あるあるあ・・・・りすぎて困る / タイピングミスを考察 名前の付け方がいい感じ
  • Googleが目指す最高の検索UI

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    Googleが目指す最高の検索UI
    loca1982
    loca1982 2009/05/21
    ひろゆきが著書で言っていた「インフラに強いGoogle」ってのはこういうのも指すのかなぁと感じた / 地道な技術者の努力ってのは外からでは見えないもんだ アピールも大切だとは思うけどね
  • http://www.perlcodesample.com/perltut/tocviewer.html

  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

  • 1