並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 895件

新着順 人気順

インデックスの検索結果201 - 240 件 / 895件

  • 形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - ZOZO TECH BLOG

    こんにちは、バックエンドエンジニアの塩崎です。 今まではiQONの全文検索用のインデックスには形態素解析だけを用いていましたが、先日Ngramも併用することで検索を改善しました。 その結果、検索結果のヒット数が向上し、なおかつ検索ノイズの増加を軽微なものに抑えることができました。 この記事では、Ngramを併用することのメリット、およびそれをApache Solrで利用する方法について紹介します。 欲しい情報が見つからないとは そもそも、「検索したけど欲しい情報が見つからない状態」とはどのような状態でしょうか? ここではその状態を以下の2つの状態に分解して考えてみます。 欲しい情報の数が少ない 1つ目の状態は「欲しい情報が検索結果中に少ない」状態です。 例えば、旅行情報サイトで「東京」と検索した時にDBの中には数千件のデータがあるのに検索結果数がわずか数件しかないような状態です。 欲しくな

      形態素解析とNgramを併用したハイブリッド検索をSolrで実現する方法 - ZOZO TECH BLOG
    • My RSS 管理人 ブログ : URL のパラメータに http:// が含まれているものは検索エンジンにインデックスされないんじゃないか

      SEO的には常識なのかもしれないけど、いろいろ調べてしまったのでメモ。 これだけ盛り上がっているはてなブックマークのページが Google にほとんどインデックスされていない。 ⇒ Google検索: site:b.hatena.ne.jp/entry/ の検索結果は たった 数百件 (他:allinurl: b.hatena.ne.jp/entry/ ) 数百件も良く見ると b.hatena.ne.jp/entry/775288 のような短縮形式のものだけになっていたり。 一方、はてなブックマークのキーワードはそんなことはない。 ⇒ Google検索: site:b.hatena.ne.jp/keyword/ の検索結果は 96,800件 意図的に b.hatena.ne.jp/entry/http://~ の URL をもつものだけがインデックスされていないみたい。 はてなブックマーク

      • 民事再生のインデックス:事業譲渡でセガなど20社から打診、月内選定 - Bloomberg

        Connecting decision makers to a dynamic network of information, people and ideas, Bloomberg quickly and accurately delivers business and financial information, news and insight around the world.

          民事再生のインデックス:事業譲渡でセガなど20社から打診、月内選定 - Bloomberg
        • http://www.yktk.org/diary/20060310.html

          • robots.txt とは? - とほほのWWW入門

            robots.txt とは、goo、Google、Lycos などのロボット型検索エンジンに対する命令を記述するためのファイルです。自分のページが、検索エンジンのデータベースに登録されないように指示します。 ただ、この指定は強制的なものではなく、この指定を行っても検索してしまう検索エンジンはあるかもしれません。goo、Google、Lycos は大丈夫のようです。 robots.txt ファイルは、そのサイトのトップに置かなくてはなりません。 ○ http://www.xxx.zzz/robots.txt × http://www.xxx.zzz/~tohoho/robots.txt robots.txt の中には次のように記述します。これは、すべて(*)のロボットに対して、/ ではじまるファイル(つまりはすべてのファイル)を検索データベースに登録することを禁止するものです。 User-a

            • 10分でPandasを学ぶ - Qiita

              DataFrameを作る DataFrameの作成方法も幾つかあるので、その整理。 まずは、DataFrameをnumpyで行列を作り、インデックスとラベルを貼り付けるパターン。 インデックスの作成。 #Create a index dates = pd.date_range("20130101", periods=6) dates <class 'pandas.tseries.index.DatetimeIndex'> [2013-01-01, ..., 2013-01-06] Length: 6, Freq: D, Timezone: None #Create a DatFrame df = pd.DataFrame(np.random.randn(6,4),index = dates, columns = list("ABCD")) df A B C D 2013-01-01 0.7

                10分でPandasを学ぶ - Qiita
              • InnoDBのログとテーブルスペースの関係

                InnoDBのデータ領域はログファイルとテーブルスペースという、切っても切れない2種類のファイルから構成されている。ログファイルは名前からするとただのログだから削除しても平気かな?と思って削除してしまうという問題が後を絶たない。そこで、今日はログファイルとテーブルスペースの関係について説明しようと思う。 InnoDBのログファイルは、別名WAL - Write Ahead Logと呼ばれるもので、名前を日本語に直すと「前もって書き込んでおくためのログ」とでも呼べるだろうか。InnoDBのテーブルに対して行われた更新は、全ていったんログに書き込まれるのである。トランザクションがコミットされると、innodb_flush_log_at_trx_commit=1が設定されていればログファイルに書き込みが行われる。0または2の場合には、ログバッファと呼ばれる領域にデータが保持される。その後、時間を

                  InnoDBのログとテーブルスペースの関係
                • 仔猫の遊び場-心理学

                  ここは、わたしの専門である心理学のコーナーです。 わたしが大学院入試で使った心理学のノートを公開していきたいと思います。 心理系大学院や公務員の心理職を目指す人、また、大学の授業の復習などに利用してください。 (このページで使用した引用文献・参考文献は「心理学参考書」を参照してください。) ご意見・ご質問等ございましたら、掲示板もしくはメールフォーム、 またはxkana@oak.dti.ne.jpまでお願いいたします。 ("@"は半角に直してください)

                  • MySQLパフォーマンスチューニングのためのクエリの基礎知識 - プログラマーkkの勉強/成長ブログ@ライブレボリューション(モバイル広告代理店)

                    前回書いたMySQLパフォーマンスチューニングのためのインデックスの基礎知識に引き続き、MySQLのパフォーマンスチューニングについて学んだことをまとめ。 MySQLを使っていると、クエリが遅い理由をつきとめる必要が出てくる。 どうやって遅いクエリをつきとめ、改善すればよいかについて学んだのでまとめた。 下記のような基礎知識があればパフォーマンスチューニングをうまくやれる、と思う。 クエリ処理の基礎 MySQLがクエリを処理する手順 まずはMySQLがクエリを処理する手順を知っておく必要がある。 処理は以下のような流れで進む。 クエリキャッシュの中からクエリの結果を探す。見つかればそれを返す。 クエリを解析して構成要素に分解する。 クエリの構文が正しいことを確認 クエリについて基本情報を収集する。 クエリを基本的な要素に分解した後、何を実行すべきかを判断する。 クエリオプティマイザが動き始

                      MySQLパフォーマンスチューニングのためのクエリの基礎知識 - プログラマーkkの勉強/成長ブログ@ライブレボリューション(モバイル広告代理店)
                    • TechCrunch | Startup and Technology News

                      A data protection taskforce that’s spent over a year considering how the European Union’s data protection rulebook applies to OpenAI’s viral chatbot, ChatGPT, reported preliminary conclusions Friday. The top-line takeaway…

                        TechCrunch | Startup and Technology News
                      • link要素「rel="canonical"」のまとめ

                        link要素のrel="canonical"について調べてみました。 以下、主にGoogleの「rel="canonical" 属性について」の記載を引用しながら、FAQ形式で書いていますが、認識誤りがありましたらどこかでつぶやいてください。 1.利用目的は? 「検索エンジンのインデックス内での重複コンテンツ問題」解消のためです。 下の図で示すURLは、同じページにアクセスしているにもかかわらず、検索エンジンでは別のURLとしてインデックスされます。 検索エンジンのインデックス内での重複コンテンツ問題 link要素の「rel="canonical"」を利用することで、URLの正規化が行われ、重複コンテンツ問題を解消します。 解消イメージ 2009年2月、Google、Yahoo!、Microosftの大手検索エンジン企業が、URLの正規化に対応する共通の取り組みとして、「rel="cano

                        • ITmedia News:アルゴリズム検索はもう限界か

                          インターネットの進化を振り返ると、その発展の過程はニューヨークのマンハッタン島の歴史とよく似ている。どちらも最初に住所システムが作られた。片や碁盤目状のストリート(東西方向)とアベニュー(南北方向)、片や8ビットの数字で表されるツリー構造のIPネットとサブネットだ。この2つの体系的な住所システムは、どちらも後に、名前による場所の表記が組み合わされた。前者では地下鉄の駅名、後者ではDNSディレクトリだ。 だが現状では、この豊かで多様などちらの空間でも、そこに詳しい人以外が一般に目にするものは、そのリソースのごく一部に限られてしまっている。よそからニューヨークを訪れる人は観光ガイドに相談するし、一般のインターネットユーザーは、Googleが検索結果の最初のページに表示するものしか見ないからだ(4月26日の記事参照)。どちらの場合も、見えない力が選択肢を狭め、ほとんどのユーザーは排除された選択肢

                            ITmedia News:アルゴリズム検索はもう限界か
                          • MySQLオフィシャルトレーニング お申込みのご案内

                            サイトリニューアルのお知らせ サイトリニューアルに伴い、URLが変更となりました。 新URLはこちらとなります。 https://www.scsk.jp/sp/usize/service/mysql.html 個人情報保護への取り組み|情報セキュリティ基本方針|会社情報 Copyright (C) SCSK Corporation. All Rights Reserved.

                            • Google、Flashをインデックスできる新アルゴリズム公開

                              Googleは6月30日、Flashに含まれるテキストコンテンツをインデックスできる新しい検索エンジンのアルゴリズムを開発したことを発表した。これによりFlashメニューやボタン、バナー、Flashで構築されたサイトなどがGoogleにインデックスされるようになった。 これまでサイト開発にFlashを選択することは、検索エンジンにインデックスされにくいという点で懸念されていたが、Googleの新しいアルゴリズムにより、ビジュアルに優れたウェブコンテンツと、より良い検索結果を同時に手に入れることができるようになる。 Flashコンテンツのインデックスについて詳細なQ&Aは、Googleの「Webmaster Central blog」に掲載されている。

                                Google、Flashをインデックスできる新アルゴリズム公開
                              • インデックス化されているのは何ページ? 本当に役立つ数字を5ステップで簡単に得る方法 | Moz - SEOとインバウンドマーケティングの実践情報

                                  インデックス化されているのは何ページ? 本当に役立つ数字を5ステップで簡単に得る方法 | Moz - SEOとインバウンドマーケティングの実践情報
                                • Atlus-ch : 【雑記】強く不快感を感じた!インデックス(アトラス)会社説明会レポート

                                  【インデックスに行ってまいりました】 私は現在、新卒生として就職活動を行っております。 その立場を利用し、また、就活の箸休めとして、入りたくなくてもちょっと興味のある企業などを多々訪問しております。その中の一つとして、ゲームブランド"アトラス"を保有する(株)インデックスに行ってまいりました。 【キャロットタワー15階】 東急田園都市線、三軒茶屋駅から徒歩1分にある、 キャロットタワーオフィス棟15Fにインデックス本社はあります。 オフィスの受付に入ると、女神転生・ペルソナ・キャサリン・イナイレのPOPが並んでおり、ゲーム会社に来たなーという感じです。 少し待つと、キャサリンに出てきそうな茶髪のキツイねえちゃんが 出席を取りにやってきました。 ねえちゃん「えっと~・・・」 ねえちゃん「・・・していただきますぅ~」 …………お前よく社会人やってるな!!! 【説明会開始

                                  • 1年先までタスク丸わかり。簡単なのに最強のアナログ手帳「バレットジャーナル」がすごい - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習

                                    「もう少し細かくスケジュール設定ができたらいいんだけど……」 「今年のイベントをひとめで確認できたらいいのに……」 日々のスケジュールやタスク管理に不可欠な「手帳」について、こうした悩みをもった経験のある人もきっと多いはず。 いま使っている手帳になんらかの物足りなさを感じている人は、「バレットジャーナル」と呼ばれる手帳術を試してみてはいかがでしょうか? 今回は、バレットジャーナルのつくり方を、筆者による実践談を交えながらご紹介しましょう。 箇条書きの要領で書く「バレットジャーナル」 バレットジャーナルは、アメリカのデジタル製品デザイナーであるライダー・キャロル氏が2013年に発表した手帳術。自分のことを主体的に整理できる最強のアナログメソッドとして、世界中で注目されているそうです。 バレットジャーナルでは、「コンテンツ」と「キー」というふたつの要素を組み合わせ、好きなノートやペンを用いて自

                                      1年先までタスク丸わかり。簡単なのに最強のアナログ手帳「バレットジャーナル」がすごい - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習
                                    • B-treeインデックス入門 - Qiita

                                      B-treeがMySQLで使用されている背景から、B-treeインデックスの構造、そしてそれに基づいたインデックスの使用方法の入門編です。以下の流れに沿ってまとめていきます。 インデックスってなに? B-treeってなんでインデックスに使われているの? B-treeインデックスの構造 インデックスの使用方法 ※ 勉強をかねてまとめていることもあり、間違っている箇所がございましたら教えていただけると嬉しいです。 インデックスってなに? 全体の内容の中から特定部分を探すために使用する、本の索引のような概念のことです。これを用いることで、検索を高速化することができます。 特定の項目が本のどこに載っているかを確認するために索引を調べることで、全ページを順に調べなくても、その項目が登場するページ番号がわかる MySQLのストレージエンジンでも、インデックスが同様の方法で利用されており、インデックスの

                                        B-treeインデックス入門 - Qiita
                                      • robots.txt の概要とガイド | Google 検索セントラル  |  ドキュメント  |  Google for Developers

                                        フィードバックを送信 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 robots.txt の概要 robots.txt ファイルとは、検索エンジンのクローラーに対して、サイトのどの URL にアクセスしてよいかを伝えるものです。これは主に、サイトでのリクエストのオーバーロードを避けるために使用するもので、Google にウェブページが表示されないようにするためのメカニズムではありません。Google にウェブページが表示されないようにするには、noindex を使用してインデックス登録をブロックするか、パスワードでページを保護します。 robots.txt ファイルの使用目的 robots.txt ファイルは、基本的にはサイトに対するクローラーのトラフィックを管理するために使用され、通常は、ファイル形式に応じて Google に対して非公開にするファイル

                                          robots.txt の概要とガイド | Google 検索セントラル  |  ドキュメント  |  Google for Developers
                                        • SQLを速くする!インデックス入門

                                          配信動画はこちら https://www.youtube.com/watch?v=OsIxUT7D728&feature=youtu.be もし良かったらムーザルちゃんねるのチャンネル登録お願いします! https://www.youtube.com/channel/UCLPHXwLp90A5R69Eltxo-sg Twitter でもプログラミングネタをつぶやいているのでフォローお待ちしております。 ムー https://twitter.com/mu_vpoe zaru https://twitter.com/zaru

                                            SQLを速くする!インデックス入門
                                          • 他銀行へ無料振込できる全14の銀行まとめ(2012年8月更新版)

                                            Image: FreeDigitalPhotos.net 他の銀行口座への振込が無料でできる銀行はたくさんあります。 特別な条件もなく月数回無料振込できる銀行もあれば、資産残高の条件を満たすことで無料振込の特典がもらえる銀行もあります。 今回は1年前の記事 知らないと損する12の振込手数料無料の銀行 の情報をアップデートします。 ソニー銀行とSBJ銀行を追加し、各銀行に関連する情報や記事も追加しました。 (各銀行毎の画像クリックで、各銀行の振込手数料について記載されたページが開きます) (以下の情報の最新更新日は、2014年5月6日です。)

                                              他銀行へ無料振込できる全14の銀行まとめ(2012年8月更新版)
                                            • MySQLについて 伍 - インデックスについて

                                              通常、MySQLでは、selectコマンドを実行した場合、1レコード目から最終レコードまで、シーケンシャルに検索を行っていきます。 しかしながら、レコード数が大量になってくると、検索速度の問題が生じます。 そこで、より高速な検索を行うために、インデックスを作成するのが一般的です。 インデックスを作成することによって、検索速度は劇的に改善されます。 但し、MySQLでは、1,000件以下であればシーケンシャルに検索した方が速いとされています。 さて、インデックスとはどのようなものであるかというと、直感的には、図書の巻末に付されている索引(インデックス)と同じです。 索引語はアイウエオ順、あるいは、アルファベット順に並べられていて、各々の索引語には、その索引語が登場するページ数(位置情報)が示されています。 読者はその位置情報を頼りに、ページを捲って、目的のキーワードのある部分を読

                                              • http://edmaps.co/udacity/course/cs101.html

                                                • 俺の脳内彼女が実は腐女子でIT系でやおい小説を書いていた

                                                  最近、世間では腐女子ブームみたいだが、俺の脳内彼女に限って腐女子ってことはないだろうと思っていたわけよ。 ところが、この間、ハードディスクを整理していたら、何やらえらく階層の深いフォルダをみつけてだな。 怪しく思って開いてみると、脳内彼女の書くやおい小説の原稿が出てきたんだよ…! チームリーダーのAと今年2年目の新米B君はいつも一緒に行動している。 毎日いちゃいちゃとペアプロしてて、A AND Bって論理積をとったらいつもTRUEが返ってくる感じ。 B「先輩、このメソッドに引数をうまく渡せなくて…」 A「ああん?配列なのか。順に舐めてやって順に突っ込んでやれよ」 B「頭からだとインデックスがずれちゃって…」 A「だったらケツから舐めて突っ込んでやればいいだろうが」 B「先輩…」 俺の脳内彼女が何を考えているんだかわからない。 俺が何を考えているんだかもわからない。

                                                    俺の脳内彼女が実は腐女子でIT系でやおい小説を書いていた
                                                  • Webアプリ開発者のための MySQL 基礎研修の資料を公開します : DSAS開発者の部屋

                                                    新卒や海外拠点の新しい Web プログラマーに MySQL のインデックスや explain, トランザクションと MVCC について説明するための研修資料を作りました。特に社内情報が含まれていないのでそのまま公開します。 MySQL Bootcamp 他人に講師役を任せたり、ある程度独習もできるようにしたつもりなので、よかったらご活用ください。

                                                      Webアプリ開発者のための MySQL 基礎研修の資料を公開します : DSAS開発者の部屋
                                                    • Covering Index と self-join と MySQL - blog.nomadscafe.jp

                                                      某サービスのクエリチューニングのお話。 ブログとか日記とかそういうサービス系で次のようなテーブルがあったとします。 CREATE TABLE entries ( id INT UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT, user_id INT UNSIGNED NOT NULL, posted_by TINYINT UNSIGNED NOT NULL, --#PC、mobileなどどこから投稿されたかのフラグ title VARCHAR(512) NOT NULL, body TEXT NOT NULL, created_at DATETIME NOT NULL, updated_at TIMESTAMP NOT NULL, status TINYINT UNSIGNED NOT NULL, INDEX (user_id,created_at

                                                      • 図解 DB インデックス

                                                        DB インデックスの基礎知識を、図をたくさん使って整理します。 この Book は、暗記をおしまいにしてこんな疑問を自力解決できるようになることを目指します。 「どんなインデックス作ればいいんだっけ?」 「なんで作りすぎちゃだめなんだっけ?」 「この場合インデックスって効くっけ?」 「インデックスでどれくらい速くなるの?」 この本は筆者の理解に連動して追記修正される可能性があります。

                                                          図解 DB インデックス
                                                        • Ajaxコンテンツを検索エンジン(Google)にクロール・インデックスさせる方法

                                                          [対象: 上級] Ajax利用したコンテンツをGoogleにクロール可能・インデックス可能にさせるための設定方法を今日は取り上げます。 すでにAjaxを理解している人向けなのと自分へのメモを兼ねているのでAjaxに対する細かな説明や用語解説は省きます。 「#」(ハッシュ)がURLに含まれている場合、#以下のURLをGoogleを含む検索エンジンはインデックスしません。 A. http://www.suzukikenichi.com/ajax.html#abc B. http://www.suzukikenichi.com/ajax.html#xyz 上のAとBはどちらも、http://www.suzukikenichi.com/ajax.html というURLをクロールしてインデックスするだけです。 #付きのURLをインデックスすることはありません(終わりに補足説明あり)。 Ajaxでは、

                                                            Ajaxコンテンツを検索エンジン(Google)にクロール・インデックスさせる方法
                                                          • 大規模ログ分析におけるAmazon Web Servicesの活用

                                                            第27回TokyoWebmining 講演資料 http://tokyowebmining27.eventbrite.com/ バンダイナムコスタジオのログ集計・分析基盤”Greco”では、Amazon RDSとEMR、そして最近では様々なデータウェアハウスを検証した上でRedshiftを活用しています。OLTPとOLAP、双方のニーズに応えるためにどんなシステム構成を取っているか、また分析に耐えうる正確なログ出力のためにどんな工夫が必要か、の2点を重点的にお伝えします。 Read less

                                                              大規模ログ分析におけるAmazon Web Servicesの活用
                                                            • 【翻訳】 On Uber’s Choice of Databases (データベースにおけるUberの選択について)

                                                              数日前、Uberのブログで「Why Uber Engineering Switched from Postgres to MySQL」というエントリが公開されました。 Why Uber Engineering Switched from Postgres to MySQL - Uber Engineering Blog https://eng.uber.com/mysql-migration/ それに対して、PostgreSQLコミュニティ界隈でもいろいろなブログエントリが公開されました。 Robert Haas: Uber's move away from PostgreSQL http://rhaas.blogspot.jp/2016/08/ubers-move-away-from-postgresql.html On Uber’s Choice of Databases http:/

                                                                【翻訳】 On Uber’s Choice of Databases (データベースにおけるUberの選択について)
                                                              • Google、次世代検索エンジン「Caffeine」導入 インデックスの更新がより早く

                                                                米Googleは6月8日、次世代検索エンジン「Caffeine」を全世界で導入した。これまでよりも検索インデックスの更新が早くなるという。 Caffeineは従来の検索インデックスとは異なる構造をしているため更新が早く、検索結果が「従来より50%新しい」とGoogleは述べている。従来の検索インデックスは複数のレイヤーで構成されており、メインのレイヤーは数週間おきに更新されていた。レイヤーを更新するためには、Web全体の解析しなければならないため、Webページが検索インデックスに反映されるまでに時間がかかっていた。CaffeineではWebを小さな部分に分けて解析し、検索インデックスを絶えずアップデートしているため、新しいWebページや、既存のページの新しい情報を発見したときにそのままインデックスに追加できるという。 Caffeineは処理能力も拡大しており、1秒間に数十万ページを並行して

                                                                  Google、次世代検索エンジン「Caffeine」導入 インデックスの更新がより早く
                                                                • 物理サーバを選定する際のポイント – Eureka Engineering – Medium

                                                                  Eureka EngineeringLearn about Eureka’s engineering efforts, product developments and more.

                                                                    物理サーバを選定する際のポイント – Eureka Engineering – Medium
                                                                  • Ring

                                                                    Ringとは、リクルートグループ会社従業員を対象にした新規事業提案制度です。 『ゼクシィ』『R25』『スタディサプリ』など数多くの事業を生み出してきた新規事業制度は、 1982年に「RING」としてスタートし、1990年「New RING」と改定、そして2018年「Ring」にリニューアルしました。 リクルートグループの従業員は誰でも自由に参加することができ、 テーマはリクルートの既存領域に限らず、ありとあらゆる領域が対象です。 リクルートにとって、Ringとは「新しい価値の創造」というグループ経営理念を体現する場であり、 従業員が自分の意思で新規事業を提案・実現できる機会です。 Ringフロー その後の事業開発手法 Ringを通過した案件は、事業化を検討する権利を得て、事業開発を行います。 さまざまな事業開発の手法がありますが、例えば既存領域での事業開発の場合は、 担当事業会社内で予算や

                                                                    • 第3回 Elasticsearch 入門 ドキュメント管理は意外と高度なことができる | DevelopersIO

                                                                      今回は「ドキュメント管理は意外と高度なことができる」というテーマで、そのドキュメントを追加・更新・削除する操作について解説します。 きっと、他の検索エンジンと比べ、その高機能ぶりに驚くはずです。 直感的に分かりやす API Elasticsearch は検索をはじめ、各種設定やサーバの状態取得など、ほとんどの操作を API として提供しています。もちろんドキュメントの追加・参照・更新・削除の API も提供していて、その仕様はとてもシンプルで直感的に使いこなすことができます。 ドキュメントをあらわす URL スキーマは以下のようになっています。 /{index}/{type}/{id} 基本的には、各種ドキュメントのエンドポイントに対して、GET PUT POST DELETE HEAD メソッドで追加・更新・削除などの操作が可能です。 例えば、posts というタイプを持つ blog イ

                                                                        第3回 Elasticsearch 入門 ドキュメント管理は意外と高度なことができる | DevelopersIO
                                                                      • Kibana+Elasticsearchで文字列の完全一致と部分一致検索の両方を実現する - Qiita

                                                                        Elasticsearchはデフォルトで文字列を要素解析して保存する。これによって部分一致検索ができるようになるのだが、完全一致検索が難しくなる。 便利なTermsがうまくいかない KibanaにはTermsという値の上位10件とかを表示してくれるパネルがある。次のようなデータを入れているとする。 { "@timestamp": "2013-12-17T10:12:40+09:00", "remote_addr": "203.0.113.10", "country_code": "JP", "request_uri": "/index.php", "user_agent": "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)" } すると、いまアクセスされている国の比率とかを見たければ、count

                                                                          Kibana+Elasticsearchで文字列の完全一致と部分一致検索の両方を実現する - Qiita
                                                                        • Googleは平均ページ読み込み時間を順位決定に含める予定 - PubCon 2009より | Moz - SEOとインバウンドマーケティングの実践情報

                                                                          ※Web担編注:記事タイトルの「Googleは平均ページ読み込み時間を順位決定に含める予定」に関連する話題は、記事の最後(2ページ目)をご覧ください。 グーグルのマット・カッツ氏も参加するSEMを中心としたイベント「PubCon 2009」から、読者の役に立つ情報をお届けする。 1日目:ユニバーサル検索およびパーソナル検索に向けての最適化これは貴重な情報が満載のすばらしいセッションだった。私にとって最大の収穫は、Bruce Clayの最高経営責任者(CEO)であるブルース・クレイ氏から得たものだった。クレイ氏は、画像コンテンツと動画コンテンツというきわめて限定的なテーマだけに絞って、いかにインデックス化するかについて説明した。 これについてはたくさんの質問が寄せられているテーマなので、画像と動画をインデックスに登録させる興味深い方法について、具体的な情報が得らたのはとてもうれしかった。実際

                                                                            Googleは平均ページ読み込み時間を順位決定に含める予定 - PubCon 2009より | Moz - SEOとインバウンドマーケティングの実践情報
                                                                          • Engadget | Technology News & Reviews

                                                                            Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

                                                                              Engadget | Technology News & Reviews
                                                                            • あなたのブログが継続してGoogleにインデックスされているかを調べる方法 | Lifehacking.jp

                                                                              ずっと背後でいろいろとブログをいじくっています。その一つが「より検索エンジンを意識したサイト作り」です。 いかにツイッターやFacebook、Google+といったソーシャルメディアが大切になったといっても、ウェブサイトやブログにトラフィックを運んでくれる大きな「土台」は検索エンジンです。 当ブログでも、24時間いつでも約50%のトラフィックは検索経由となっていて、瞬間的にアクセスが増える人気記事があったとしても、時間で積分した場合は検索経由に敵いません。 でも自分のブログで毎日書いている記事がちゃんとGoogleにインデックスされているのか、誰もが気になるところだと思います。こうした情報を確認するために使うのがGoogleの提供している「ウェブマスターツール」ですが、とりわけ大切な、「Googleにいくつのページがインデックスされているか」という情報を一覧表示できる「インデックス・ステー

                                                                                あなたのブログが継続してGoogleにインデックスされているかを調べる方法 | Lifehacking.jp
                                                                              • 社説・コラム : YOMIURI ONLINE(読売新聞)

                                                                                【読売新聞】読売新聞の社説(主張、オピニオン)を読むことができます。

                                                                                  社説・コラム : YOMIURI ONLINE(読売新聞)
                                                                                • MySQLのインデックスを学ぶ (1) - 刺身☆ブーメランのはてなダイアリー

                                                                                  実践ハイパフォーマンスMySQL 第2版とLinux-DBシステム構築運用入門を読んで、 MySQL のインデックスについて勉強しなおしている。理解が曖昧だった部分の知識を深められたり、自分の間違いに気づけたりして、とても収穫が多い。 フルテーブルスキャンとフルインデックススキャン Linux-DBシステム構築運用入門 P185 に書いてあるケース。インデックスを利用してても対象レコード数が多いとランダムI/Oが大量に発生して遅くなる。読むべきレコード数が多いのならばフルテーブルスキャンのほうがI/O一回で多くのブロックを読み込めるので速い。 IGNORE INDEX ヒントを与えてパフォーマンスを改善するという例があった。 マルチカラムインデックスと範囲検索 SELECT * FROM users WHERE a = ? AND b >= ? and (c IS NULL OR c >=

                                                                                    MySQLのインデックスを学ぶ (1) - 刺身☆ブーメランのはてなダイアリー