タグ

2015年1月21日のブックマーク (3件)

  • FluentdでURL付きツイートを漏れなく収集する方法 - Y-Ken Studio

    Twitterで言及されている様々な記事のURLを収集したいと考えた時、次の方法が選択肢となります。 定期的にAPIを叩く ストリーミングAPIを使う 前者の方法では単位時間毎のAPIコール制限を容易に超えてしまうので避けたいところですね。 そこでストリーミングAPIを使いたい所ですが、URLのトラッキングを行う方法がわかりにくかったので調べてみました。 ストリーミングAPIでのURLトラッキング方法 その方法は意外なほどシンプルでした。 ドットやスラッシュなどの記号を半角スペースにして、コンマに並べるというものです。 例えば、"example com"と指定すると、次のパターンにマッチします。 example.com www.example.com foo.example.com foo.example.com/bar I hope my startup isn’t merely ano

    FluentdでURL付きツイートを漏れなく収集する方法 - Y-Ken Studio
    pcod
    pcod 2015/01/21
  • Groonga 4.0.1リリース

    Groonga 4.0.1リリース 2月9日のメジャーアップデート以来しばらく間があきましたが、 Groonga 4.0.1 をリリースしました! それぞれの環境毎のインストール方法: インストール 今回、データベースの肥大化解消のために非互換な変更がはいっています。その恩恵を受けるためにはデータベースのつくりなおしが必要です。 これにともない、新しいGroongaで一度でもデータベースを開くと、古いGroongaではデータベースを開けなくなることに注意してください。 データベースの肥大化を解消できるようになりました 今回のリリースでは、データベースの肥大化を解消する仕組みが有効になりました。 前にもそんなことを聞いた気がする人がいるかもしれないので、前回までの肥大化抑制のとりくみをおさらいしてみましょう。 3.1.0でGRN_JA_SKIP_SAME_VALUE_PUTを追加 同じ値なら

    Groonga 4.0.1リリース
    pcod
    pcod 2015/01/21
    adjuster機能すごいです
  • Solr Redis Plugin Use Cases and Performance Tests - Sematext

    The Solr Redis Plugin is an extension for Solr that provides a query parser that uses data stored in Redis. It is open-sourced on Github by Sematext. This tool is basically a QParserPlugin that establishes a connection to Redis and takes data stored in SET, ZRANGE and other Redis data structures in order to build a query. Data fetched from Redis is used in RedisQParser and is responsible for build

    Solr Redis Plugin Use Cases and Performance Tests - Sematext
    pcod
    pcod 2015/01/21