タグ

ブックマーク / blog.livedoor.jp/techblog (6)

  • livedoor Techブログ : CNAMEの間違った使い方

    情報環境技術研究室の永井です。 今日はDNSのCNAMEの間違った使い方のお話です。 その間違った使い方がうちのサービスで使用されているかもっ!? DNSって? Domain Name System(ドメイン ネーム システム、DNS)はインターネットを使った階層的な分散型データベースシステムである。 1983年に情報科学研究所 (ISI) のポール・モカペトリスとジョン・ポステルにより開発された。 Wikipediaより一部抜粋 http://ja.wikipedia.org/wiki/Domain_Name_System 例えば、ライブドアのポータルサイトといえば「http://www.livedoor.com/」ですが、実際には「http://125.6.172.15/」というIPアドレスがインターネット上の住所になります。でも、こんな数字の羅列を一々覚えていられないので、DNSとい

    perezvon
    perezvon 2013/08/08
    CNAMEについて
  • livedoor Techブログ : YAPC::Asia 2008 で発表してきました

    こんにちは。nabokov7 です。YAPC::Asia 2008で発表してきましたので、その資料を公開します。 ライブドアでは、各サービスで共通に使える内部サービスをいくつか独自開発しています。そのうちのひとつが、今回紹介した共通スパムフィルタ「スパムちゃんぷるー」です。ライブドアブログやライブドアwiki、したらば掲示板などのスパム書き込みのフィルタリングを共通化するために開発したものです。 これにより、スパム判定のロジックが一元化され、統計情報、ブラックリスト、ホワイトリストなどが共有できるようになります。また、過去の判定結果から学習する機能もあります。 スパム判定の基準は各サービス、あるいはユーザ毎の設定によっても変わってくるので、判定ロジックはプラグイン形式になっており、判定時にはこれらのプラグインが並列で動作する仕組みになっています。リクエスト時に必要なプラグインを指定し、任意

  • livedoor Developers Blog:String::Trigram でテキストの類似度を測る - livedoor Blog(ブログ)

    こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日語版の解説

  • 上位端末向けケータイサイトを作ってみた - livedoor Blog(ブログ)

    こんにちは。モバイル担当の小森谷です。 ケータイユーザーで流行っていると言われるプロフサイトなるものを作ってみました。 プチプロフ 今回はこちらのプロフサイトの仕組みをモバイル部分を中心に紹介したいと思います。 ■ターゲット 10代〜20代の男女のケータイユーザーを中心に向けて仕様やデザインを検討してみました。また、その辺りの年代の人たちはDoCoMoのmovaやEZの非win端末を使用する割合は低いだろうと見てXHTMLや画像サイズは大きめに取る上位端末向けサイトとして作成しました。 もちろんPCからの閲覧も可能ですが、現段階ではオープンしたばかりでケータイユーザーをメインに据えていますので、PCでのインターフェースなど使いづらい部分もあるかと思いますがご了承ください。 ■環境 ・CentOS4 ・Apache2.0 + WebDAV, Apache1.3 + mod_perl ・MyS

  • livedoor Techブログ : Hyper Estraier で検索

    はじめまして。ライブドアの山です。 弊社は最近 CGMコンテンツに注力しています。 データがたまってくると、ユーザーが必要な情報をすばやく得られるように検索機能を実装する必要がでてきます。 各コンテンツそれぞれで検索機能を実装しているのですが、mysql から直接引いたり、Namazu や SUFARY などの検索エンジンもかなり使ったりしています。 今回は某コンテンツの検索エンジンとして使用している HyperEstraier のちょっとした導入方法をご紹介します。 HyperEstraier は平林幹雄さんが開発された検索エンジンで、次のような特徴があります。 * インデックスを使った高速な検索ができます。 * 大量の文書のインデックスを短時間で作成できます。 * N-gram方式による漏れのない検索ができます。 * 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます

  • livedoor Techブログ : モブログに潜んでいる不具合

    今回はモブログに潜んでいる不具合を紹介してみたいと思います。 モブログと言ってもブログサービスに限った話ではなく、SNS の日記などを携帯から投稿したり、送信するメールに写真を添付してフォトストレージサービスにアップロードしたり、その仕組みは様々なサービスに応用されています。 では、その様々なサービスに潜んでいる不具合の内容からご説明しましょう。 ・件名を「サークルKサンクス」など「全角半角英数全角」としてモブログ。 ・投稿された記事のタイトルが「サークルK サンクス」となる。 「サークルK」と「サンクス」の間に半角スペースが入る。 ・AU、SoftBank の端末ではこの不具合は起こらない。 こんな感じ。 なぜこの不具合が起こるか、を説明する前に RFC2822(822) の Section 2 に目を通しておいた方がよいかもしれません。 とは言うものの、英文で量も少なくないので大事な部

  • 1