2014年4月14日のブックマーク (3件)

  • Mroongaを使って全文検索Webサービスを作ったときにはまったこと(第1回) - CreateField Blog

    前回のエントリに書いたように、1年半ほどをかけて、独学で特許の全文検索サービスを開発しました。 PatentField | 無料特許検索 最初は、MySQLを使ったこともない状態だったこともあり、かなり紆余曲折しました。Groonga開発チームの懇切な対応もあって、専用サーバ1台で最大で1千万レコード超、400GiB以上のサイズのテキストデータを高速に検索できるようになりました。 今後、何回かにわけて、Mroonga(Groonga)を使って全文検索Webサービスを作ったときにはまったこと、学んだことを全て書き出したいと思います。 全文検索エンジンMroongaとは? Mroongaは全文検索エンジンであるGroongaをベースとしたMySQL用のストレージエンジンです。Mroongaは、MySQLが使える人であれば、簡単に高速な全文検索機能が使えます。MariaDB10.0系にもバンドル

    Mroongaを使って全文検索Webサービスを作ったときにはまったこと(第1回) - CreateField Blog
  • 電子書籍を集めて知識のネットワークを強化する - ブログのおんがえし

    なんでHonyomiを作ったのか、という話です。 端的に言うと「もっと電子書籍を便利に使いたい」 具体的には以下の2点になる。 検索可能な独自の情報ソースを作る インターネットを使うという行為がほとんどの人にとってに当たり前のことになり、今も参加するプレイヤーが増え続けている。それが何を意味するのかというと「インターネットに転がっているほとんどの情報は自分にとっては不要なもの」ということだ。 今後必要になっていくのは「自分にとって」有益な情報源を集めた専用の情報ソースを作ることではないだろうか。価値のある情報ソースを上手く構築する能力は技術者にとって今後ますます大切なスキルになっていくと思われる。 どうやって情報ソースを構築していくかについては様々な方法が生まれてくると思うけど、現時点で有用なものとして「」を使わない訳にはいかない。大抵の作者は何らかの強い動機があってを書いている人がほ

    電子書籍を集めて知識のネットワークを強化する - ブログのおんがえし
  • Mroongaのラッパーモードからストレージモードに変えた理由 - CreateField Blog

    前回は、全文検索Webサービスを作ったときにはまったことの第1回という記事を書きました。 今回は、Mroongaを使って全文検索Webサービスを作ったときにはまったことの第2回として、ラッパーモードからストレージモードに変えた理由について書きたいと思います。 なお、かなり長く、MySQL、Groongaについて前提知識がないと理解できない部分が多々含まれている可能性があります。 ラッパーモードとは 全文検索Mroongaストレージエンジンでは、全文検索するためにラッパーモードとストレージモードの2つのモードが用意されています。 (引用) ラッパーモードでは全文検索機能のみGroongaの機能を利用し、データストアはInnoDBなど既存のストレージエンジンを利用します。ラッパーモードを利用することにより、ストレージエンジンとして多くの利用実績のあるInnoDBに全文検索エンジンとして実績のあ

    Mroongaのラッパーモードからストレージモードに変えた理由 - CreateField Blog
    naoa_y
    naoa_y 2014/04/14
    記事書きました