タグ

検索に関するanimistのブックマーク (11)

  • 誰でもわかる全文検索入門

    全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。 インターネット検索の例 たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。 検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。 なお、この図では索引の単語の並び方が適当ですが、実際にはと同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。 索引にない単語 この仕組みの場合、索引にある単

    誰でもわかる全文検索入門
  • Twitter APIで取得したつぶやきが「truncated=true」で切れてしまう! - やったこと

    この前ツイッターAPIでつぶやきを取得したら、長いつぶやきの全文を取得できませんでした。 つぶやきの末尾が「・・・」となってしまって省略されてしまっていたんです(truncatedというフィールドにはtrueがセットされていました・・) 最近ツイッター公式側の対応で、長いつぶやきはちょん切れて、省略されてしまう仕様になったそうです。 ↓ Upcoming changes to Tweets — Twitter Developers 省略されていないつぶやきを取得するためには、ツイッターAPIのURLの最後に「tweet_mode=extended」というクエリーを付けること。 すなわち「https://api.twitter.com/1.1/statuses/show.json?tweet_mode=extended」 といったURLに要求を送ると「text」フィールドの代わりに「full

    Twitter APIで取得したつぶやきが「truncated=true」で切れてしまう! - やったこと
  • Twitterの検索API & Twitterでの検索術

    gistfile1.md twitterの検索術 (search/tweets と search/universal) 注 search/tweets では一週間以上前のツイートは検索できないので注意 search/universal は公式のConsumerKey/ConsumerSecretでないと使用できない 当方では一切の責任を負いません 使いそうなクエリ群 "島風 かわいい" - 島風 かわいいが含まれるツイートの検索 島風 OR 天津風 - 島風か天津風が含まれるツイートの検索 島風 -天津風 - 島風が含まれ天津風が含まれないツイートの検索 #島風 - ハッシュタグ島風が含まれるツイートの検索 from:user - ユーザーuserのツイートを検索 to:user - 宛先がユーザーuserのツイートを検索 @user - リプライ@userが含まれるツイートの検索 島風

    Twitterの検索API & Twitterでの検索術
  • Twitterでテキスト検索するときにRTを除外する方法 - Qiita

    twitterからtweetの収集する際、普通にGetSearchを叩くと、RTされたツイートはそれぞれRTに対してidが振られ、別々のツイートとして認識されてしまうため、検索結果に複数同じテキストのtweetが出てきてしまう。 テキスト分析をするにしては不都合なのでRTされたツイートを一つのツイートとして検索するためにはクエリにexclude:retweetsをつけることで除外できる。 In [1]: tweet = Api.GetSearch("湘南藤沢キャンパス") In [2]: for a in tweet: print "ID: "+str(a.id) print "text: \""+a.text+ "\"" ...: ID: 739627160470704128 text: "I'm at 慶應義塾大学 湘南藤沢キャンパス (SFC) - @keio_univ_pr in

    Twitterでテキスト検索するときにRTを除外する方法 - Qiita
  • “ググれカス”は“ググってもカス”に--情報を引き出すための検索リテラシー

    皆さんは検索したとき、思う通りの情報を引き出せているだろうか。もちろん、Google検索で必要なキーワードを入れれば、誰もが簡単に何らかの情報を拾うことはできる。しかしその結果、得られる情報に不満を覚えることも少ないのではないだろうか。 「いくらググっても満足できる結果が得られない」。そう不満に感じているのであればまだいい。情報の精度や内容についての見極めができず鵜呑みにし、誤った知識を”常識”だと認識しているという可能性も考慮すべきだろう。 “Google検索は故障しているも同然”とまでは言わないが、ページビューを集めることで収益を得られるビジネスが多い中、ごく当たり前にキーワードを入力しているだけでは情報の質に力を入れず、検索流入の増加のみにフォーカスしたサイトが増えていることは否定できない。 まったく異なるサイトの情報なのに、内容はほとんど同じ。しかも、一般論が不必要に長く書かれてい

    “ググれカス”は“ググってもカス”に--情報を引き出すための検索リテラシー
    animist
    animist 2017/08/18
    こういう小手先のテクニックはすぐに対策されてまたノイズまみれになったりするんじゃないかな、とも思うけどね。site:ac.jp とかはそうそう汚せないと思うけど。
  • 検索結果でサイトリンクを表示させるために知っておきたいこと | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

    こんにちは。いいオフィス支配人のセコです。 皆さんはサイトリンクというワードを知っていますか? Googleで検索している方は見たことがあると思います。 つまりここのこと。 今回は、このサイトリンクの出し方に関して書きたいと思います。 サイトリンクとは サイトリンク Google の検索結果で一部のサイトの下部に表示されるリンクはサイトリンクと呼ばれ、ユーザーがそのサイトに移動する際に役立ちます。Google では、サイトのリンク構造を解析して、情報を迅速に見つけるために役立つショートカットを検出します。 引用元:サイトリンク – ウェブマスター ツール ヘルプ https://support.google.com/webmasters/answer/47334 サイトリンクが出ているサイトは、その他のサイトより検索結果時に画面占有率が高く、何が掲載されているのかわかりやすくなっているのが

    検索結果でサイトリンクを表示させるために知っておきたいこと | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
  • 大流行中・Slackの使い方【検索の小ワザ】隅々まで徹底解説!(保存版・8/全10回) | SELECK

    2016年5月にDAU300万を突破した、チームコミュニケーションアプリ「Slack(スラック)」の使い方を徹底解説するシリーズの、8回目です! 今日は検索です!チャットツールって、日々使うがゆえにどんどんログがたまっていくんですよね。過去の投稿を見たい時、それにPinなどをしていればいいのですが、そうではない時。なかなか探している投稿が見つけられず、ムキーとなることはないでしょうか。私は昔、超ありました。 「Slackは検索性がイケてない」っていう声もけっこう聞くんですよね。でも、いざいろいろ調べてみたところ、全然そんなことありませんでした。むしろチャットツールにしては相当イケてると思います。 というわけで、今回は検索に関する便利機能をご紹介します。この記事を読むと、こんなことができるようになります。 自分が探している投稿を、素早く簡単に見つけることができる。 これに尽きる。 ▼このシリ

    大流行中・Slackの使い方【検索の小ワザ】隅々まで徹底解説!(保存版・8/全10回) | SELECK
  • もうGoogle検索ってダメかもね: - ふくゆきブログ

    要するに上記の表のとおりです。クリックすると拡大します。だんだん情報の質的でない部分が検索の順位に影響してきて、検索しても見つけたい情報がさらに見つかりにくくなってくるかもしれません。要するにyahoo知恵袋やアメブロやニュース記事ばかり上位に来て、質的に正しい情報は上位に来ないようになります。もともとはpage rankというシンプルな方針で検索順位を決めていたのが、googleさまが頑張って頑張って多くのSEO対策を施した結果、よくわかんない基準で検索順位が決まるようになってしまいました。SEO業者の結果が埋まるよりマシなんですけど、難しいところです。もちろん、上記以外の基準もたくさんあります。しかし、上記のように情報の質的でない基準も多いです。 特に、AMPというモバイルで高速に表示するjavascriptモジュールをgoogle様が提供していただいたのは素晴らしいのですが、最

    もうGoogle検索ってダメかもね: - ふくゆきブログ
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • Senna 組み込み型全文検索エンジン - Senna 組み込み型全文検索エンジン

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 東京都公立図書館横断検索

    条件項目は館により無効の場合があります 詳細 検索結果は別画面に表示されます。 検索した資料の利用方法についてはこちらを必ずお読みください。 検索した資料の利用については、資料の所蔵館ではなく、 ふだん利用されている図書館にお尋ねください。

    animist
    animist 2008/10/03
    おっそろしく便利なものがあったんだなぁ。知らなかったのが悔やまれる
  • 1