タグ

2009年1月6日のブックマーク (3件)

  • エクスブリッジ、携帯サイトの解析にGoogle Analyticsを使うためのライブラリ公開 | OSDN Magazine

    エクスブリッジ(社:名古屋市)は2009年1月5日、グーグルのSaaS型アクセス解析サービス「Google Analytics」を利用して携帯サイトのアクセス解析を行うためのライブラリ「SELENE.GA4K」をオープンソースソフトとして公開したと発表した。非商用の場合はMITライセンスで利用できる。商用利用の場合の価格はオープン。 Google Analyticsでサイト解析を行うにはJavaScriptによる解析コードを埋め込む必要があるため、JavaScriptが動作しない携帯サイトでは、これまで利用できなかった。SELENE.GA4Kは、JavaScriptに代わってPHPのサーバサイド処理を行い、グーグル提供のAPI経由でアクセス解析できるようにした。 PCサイトと携帯サイトの解析データの一元管理が可能で、ユーザー分析からキャリア別のアクセス解析までに対応。SSIを利用すればH

    エクスブリッジ、携帯サイトの解析にGoogle Analyticsを使うためのライブラリ公開 | OSDN Magazine
  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    boxheadroom
    boxheadroom 2009/01/06
    本文抽出
  • Chomsky random text generator « Python recipes « ActiveState Code

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 """CHOMSKY is an aid to writing linguist

    boxheadroom
    boxheadroom 2009/01/06
    Pythonにチョムスキーっぽいことを言わせてみるプログラム。らしい。