タグ

ブックマーク / blog.livedoor.jp/techblog (7)

  • livedoor Techブログ : 全文検索エンジン lucene(ルシーン) を使ってみた

    こんにちは 。 検索 関連 を 担当 して いる やましー です 。 今回は livedoor で提供しているサービスの中の「検索関連」について書きます。 このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。 その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を(特にクロスプラットフォームで)必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋 インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作

  • livedoor Developers Blog:チケット駆動開発の研究と実践 - livedoor Blog(ブログ)

    こんにちは、そろそろ花粉のシーズンが近づいてきて戦々恐々としている金子です。 今年も花粉対策グッズの CM に注目しているのですが、花粉鼻でブロックがいいんじゃないか?と思っています。 花粉症のくしゃみ鼻水は、人が辛いのはもちろんですが周囲にとっても気分の良いものではありませんよね。エチケットとしても花粉対策は怠らないようにしたいものです。 チケットついでに今回はチケット駆動開発の話をします。想定読者は Trac をリポジトリブラウザとして利用しているがチケットは使ったことがない人です。Trac、 Issue Tracking System という用語に馴染みのない方は、それぞれ関連リンクを用意しましたのでそちらをご覧ください。 以下、僕の経験に基づき「チケット駆動開発とは何か」「何が目的か」「どう実践したか」「結果が出たか」についてレポートします。だいたいここ二週間くらい、チームではな

  • livedoor Techブログ : DB(MySQL)をファイルシステムのかわりにする Apache モジュール

    こんにちは池邉です。 今回は実験的なApacheモジュールを公開してみたいと思います。。 どういう事をするモジュールかというと、あらゆるデータを MySQL に入れておき、ファイルシステムのかわりに使ってしまうモジュールです。 以下のようなテーブルを用意します。 CREATE TABLE vfs ( id INT UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT, path CHAR(100) NOT NULL, type CHAR(32) DEFAULT 'text/plain' NOT NULL, content MEDIUMBLOB, created_on DATETIME NOT NULL, updated_on TIMESTAMP, UNIQUE KEY(path) ) ENGINE=InnoDB; Apache の httpd.conf

  • livedoor Techブログ : Hyper Estraier で検索

    はじめまして。ライブドアの山です。 弊社は最近 CGMコンテンツに注力しています。 データがたまってくると、ユーザーが必要な情報をすばやく得られるように検索機能を実装する必要がでてきます。 各コンテンツそれぞれで検索機能を実装しているのですが、mysql から直接引いたり、Namazu や SUFARY などの検索エンジンもかなり使ったりしています。 今回は某コンテンツの検索エンジンとして使用している HyperEstraier のちょっとした導入方法をご紹介します。 HyperEstraier は平林幹雄さんが開発された検索エンジンで、次のような特徴があります。 * インデックスを使った高速な検索ができます。 * 大量の文書のインデックスを短時間で作成できます。 * N-gram方式による漏れのない検索ができます。 * 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます

  • livedoor Techブログ : モブログに潜んでいる不具合

    今回はモブログに潜んでいる不具合を紹介してみたいと思います。 モブログと言ってもブログサービスに限った話ではなく、SNS の日記などを携帯から投稿したり、送信するメールに写真を添付してフォトストレージサービスにアップロードしたり、その仕組みは様々なサービスに応用されています。 では、その様々なサービスに潜んでいる不具合の内容からご説明しましょう。 ・件名を「サークルKサンクス」など「全角半角英数全角」としてモブログ。 ・投稿された記事のタイトルが「サークルK サンクス」となる。 「サークルK」と「サンクス」の間に半角スペースが入る。 ・AU、SoftBank の端末ではこの不具合は起こらない。 こんな感じ。 なぜこの不具合が起こるか、を説明する前に RFC2822(822) の Section 2 に目を通しておいた方がよいかもしれません。 とは言うものの、英文で量も少なくないので大事な部

  • livedoor Techブログ : coLinux あれこれ

    はじめまして。ライブドアで開発をやっておりますにぽたんと申します。 すいません。なんか書けって言われてスッカリ忘れてまして、書き忘れてました。 唐突ですが、皆さんは coLinux って使ってたりしますか? 私は主に開発する環境を coLinux + debian という環境に置いてあります。 のですが、昔は TAP や WinPcap とかを使って、ややこしい設定をチマチマやって coLinux からネットに接続していましたが、会社で接続したり、自宅から接続したりすると、どうもうまく認識してくれなかったりして、その都度 coLinux を再起動させたりしていましたので、非常に面倒でした。 最近の coLinux には SLiRP というネットワークインターフェースがあって、以前はとても不安定でしたが今ではかなり安定して接続することが可能なので、最近はもっぱら SLiRP にしています。

  • Technologies for UI

    Technologies for UI List view Topics copyright livedoor 上下カーソルキーでスライドを切り替えられます。 表示されない場合はこちらから

  • 1