タグ

ブックマーク / kaiseh.hatenadiary.org (9)

  • ソーシャル・ニュースリーダー『Crowsnest』のベータ版を開始しました - kaisehのブログ

    追記: Crowsnestは、2011年10月3日より正式公開されています。Twitter IDをお持ちであれば、どなたでもお使いいただけます。 僕が今年から働いている株式会社Rmakeのプロダクトとして、Twitterのタイムラインを自動でまとめるソーシャル・ニュースリーダー『Crowsnest』のベータ版を開始しました。 追記: 2011年12月時点の最新のスクリーンショットは以下になります。 Crowsnestとは Crowsnestは、日々Twitterにつぶやかれる大量のURLを収集し、ユーザのタイムラインに基づいてまとめ直し、時系列に並べて閲覧することができるサービスです。 TwitterやFacebookのようなソーシャルメディアが勢いを増す中で、インターネット上の情報収集手段は、RSSリーダーやソーシャルブックマークといった従来のツールから、ソーシャルメディアベースへと徐々

    nilab
    nilab 2011/08/19
    「えもにゅ」っぽいサービスはもうちょっとあってもいいと思う。「リンクに対する感情の共有」「「キモチ」という顔文字を付けられる機能」ソーシャル・ニュースリーダー『Crowsnest』のベータ版を開始しました
  • 『Blogopolisの裏側』発表資料 - kaisehのブログ

    昨日のSeasar Conference 2009 Autumnで発表させていただいた『Blogopolisの裏側』の資料を公開します。 Blogopolisの裏側View more documents from kaiseh. 資料の28枚目に、重み付きボロノイ図の重心ベースレイアウトの説明用動画がありました。その動画は以下にアップしました。 講演者の皆さん、運営の皆様、当にお疲れ様でした! 追記 id:mi-changさん p14ででてる「頂点数」、「多角形数」って何を意味してるんだろう?頂点数が多いということはより多くのタグと結びついているってこと? これは、1つ1つのエントリーやブログ、地区(カテゴリ)に対応する土地の幾何データのことです。例えば、5角形の土地の場合は5個の頂点座標が必要になります。土地の頂点数はレイアウト上の理由で決まるもので、タグとは直接関係はありません。

    『Blogopolisの裏側』発表資料 - kaisehのブログ
    nilab
    nilab 2009/09/24
    『Blogopolisの裏側』CentOS 5.3,Xen Server(4CPUs),Apache(RAM512MB),mod_proxy_balancer,Tomcat(3.2GB)x2,MySQL(4GB),Solr(1.5GB):Javaクラス359個,AS3クラス73個:ブログ23万:記事30万:DB9GB:ブクマタグでクラスタリングK-means:幾何lib自作:pv3d:自作Material人の温もり
  • ビジュアルブログ検索エンジン『Blogopolis』を公開しました - kaisehのブログ

    ブログランキングサービス『TopHatenar』に登録された20万件超のブログを3Dの仮想都市景観に凝縮したサイト、『Blogopolis』を公開しました。 Blogopolis Blogopolisとは Blogopolisは、昨年6月に公開したはてなダイアリーの勢力地図『HatenarMaps』のコンセプトを継承したサイトです。HatenarMapsの初版は、1000ユーザ×5エントリーの土地から構成された「はてな村」の地図でしたが、Blogopolisは20万人超のユーザと30万件近くのエントリーを収容する「メガロポリス」です。 Blogopolisは、TopHatenarが収集している全ブログのデータ(はてなブックマークにおけるエントリー、ブックマーク数、ブックマークタグ、livedoor Reader購読者数)を活用して、3Dの都市景観を自動生成しています。 ブックマークエントリ

    ビジュアルブログ検索エンジン『Blogopolis』を公開しました - kaisehのブログ
    nilab
    nilab 2009/08/28
    ビジュアルブログ検索エンジン『Blogopolis』を公開しました - kaisehのブログ:3Dの都市空間を閲覧:1つのブクマクエントリーが1つの建物:土地の面積はブクマ数に比例:ルーフペイント機能 ビルの屋上にテクスチャを貼れる
  • グラフ理論ライブラリのJGraphTを使ってみた - kaisehのブログ

    JGraphT JGraphTは、Javaのグラフライブラリです。グラフの描画ではなく、グラフ理論のモデルとアルゴリズムの方にフォーカスしています。とても使いやすかったので、紹介してみます。 無向グラフ UndirectedGraph<String, DefaultEdge> g = new SimpleGraph<String, DefaultEdge>( DefaultEdge.class); g.addVertex("a"); g.addVertex("b"); g.addVertex("c"); g.addEdge("a", "b"); g.addEdge("b", "c"); System.out.println(g.vertexSet()); System.out.println(g.edgeSet()); System.out.println(g.edgesOf("c"));

    グラフ理論ライブラリのJGraphTを使ってみた - kaisehのブログ
    nilab
    nilab 2009/04/20
    グラフ理論ライブラリのJGraphTを使ってみた - kaisehのブログ
  • Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ

    Luceneは、こちらのベンチマークなどを見る限り、Sennaなど他の全文検索エンジンに比べて相当遅いとされているようです。 上記ページのベンチマークではLucene 2.0が使われています。僕も数年前にLucene 2.0を使ったことがあって、それ以降はLuceneに触れていなかったんですが、最近のバージョンはパフォーマンスが大幅に改善されているそうなので、どれくらい速くなったのか、インデックス作成速度を比較してみました。 比較に使ったのはLucene 2.4.1(2009/03)とLucene 2.0.0(2006/05)です。以下の条件でインデックス作成時間を計測しました。 データ: 日語版Wikipediaのダンプから先頭20万記事 インデックス形式: 記事タイトル: Store.YES, Index.ANALYZED(元文字列+インデックス) 記事文: Store.COMPR

    Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ
    nilab
    nilab 2009/04/02
    Lucene 2.4とLucene 2.0のインデックス構築速度比較 - kaisehのブログ : 「Lucene 2.4.1の方が2.6倍も速い」
  • エラーを含んだXMLをルーズにパースする - kaisehのブログ

    各種ブログのRSSのようなWeb上のXMLリソースをdom4jやJDOMなどで読み込むと、パースに失敗するケースがとても多いです。というのも、こういうXMLは基的に、validであることをあまり期待できないからです(エスケープ漏れがあったり、"<!--"で始まったコメントの直後に"-"が来たりする[追記: これはinvalidな例じゃなく非well-formedな例でした])。ひどいときはwell-formedですらないこともあります。 こういう問題がある場合、HTMLであれば、MayaaやS2JSFでも採用されているNekoHTMLというライブラリを使って、エラーを出さずにルーズにパースできます。このNekoHTMLを、HTMLではなくXMLに適用する方法を調べたので、メモしておきます。 パーサを以下のような構成にすると、XMLの解析に適した状態になります。 NekoHTML側ではなく

    エラーを含んだXMLをルーズにパースする - kaisehのブログ
    nilab
    nilab 2009/03/11
    エラーを含んだXMLをルーズにパースする - kaisehのブログ:NekoHTML側ではなくXerces側のDOMParserを使う:DOMParserで"elems"と"attrs"プロパティを"default"にする:DOMParserで"balance-tags"機能をオフにする:DOMParserで"filters"プロパティを空にする
  • TopHatenar+HatenarMapsのシステム構成 - kaisehのブログ

    TopHatenarとHatenarMapsのシステム構成が、バージョンアップの度に複雑化してきて、自分でも把握しづらくなってきたので、整理する意味で図を作ってみました。 図に示したように、HatenarMapsは、S2RMIを使ってTopHatenarと協調動作しています。はてなダイアリーとはてなブックマークに関するデータをクロールしているのは、TopHatenarの側です。HatenarMapsの側では、TopHatenarのService層をS2RMI経由でコールして、集計済みのはてブ情報を取得し、クラスタリング処理の後にポリゴンを計算しています。その他、HatenarMaps上でコメントビームの表示等がリクエストされる度に、TopHatenarをコールしています。よって、HatenarMaps側のDBには、基的にポリゴンデータしか入っていません。 以下、図中に出てくるフレームワー

    TopHatenar+HatenarMapsのシステム構成 - kaisehのブログ
    nilab
    nilab 2009/01/09
    TopHatenar+HatenarMapsのシステム構成 - kaisehのブログ : いろいろ有用なライブラリ
  • JavaからWin32 APIを簡単に呼べるnlinkを使ってみた - kaisehのブログ

    Windowsのファイルにhidden属性を付けたかったんですが、Pure Javaではそのようなことができないので、JavaからWin32 APIを呼び出せるnlinkを使ってみたら、ものすごく簡単でした。これは便利! 以下のようにするだけで使えます。 MSDNとかで、呼びたいAPIのシグネチャを調べる。 APIのDLLと同名のインタフェースを作って@DllClassアノテーションを付ける。 シグネチャに合わせたメソッドを定義して@DllMethodアノテーションを付ける。 NLink.create()でインタフェースのプロキシを生成して呼び出す。 ファイルにhidden属性を付けるコードは、次のようになります。 Kernel32.java @DllClass public interface Kernel32 { public static final int FILE_ATTRIBU

    JavaからWin32 APIを簡単に呼べるnlinkを使ってみた - kaisehのブログ
    nilab
    nilab 2008/06/11
    JavaからWin32 APIを簡単に呼べるnlinkを使ってみた - kaisehのブログ
  • はてな村の地図『HatenarMaps』を公開しました - kaisehのブログ

    はてな村』のアナロジーを当に地図にできたら面白いだろうなと思って、週末を潰して作ってみました。TopHatenarが蓄積しているDBを一部活用したサービスになっています。 Blogopolis このサービスを簡単に説明すると、はてなダイアリーのユーザに、獲得ブクマ数に応じた領土面積を割り当て、さらに似た者同士の領土を隣接させるという試みです。 地図の全体を見渡すことで、はてダの大まかなトレンドを掴むこともできるし、スケールを拡大していけば個別記事に到達することもできます。さらに、Google Mapsで検索するような感覚ではてなidやキーワードを入力して地図を探索したり、「去年と今年で勢力図がどう変わったか」を調べることもできます。 HatenarMapsはTopHatenarと同様、Javaで開発しました。フレームワーク構成もTopHatenarと一緒で、Cubby+Mayaa+S2

    nilab
    nilab 2008/06/11
    はてな村の地図『HatenarMaps』を公開しました - kaisehのブログ
  • 1