タグ

2009年1月15日のブックマーク (4件)

  • FirefoxのhtmlparserをXPCOM経由で呼び出して壊れたHTMLを修復する - bits and bytes

    dapper のように、ブラウザでクリックをしたところをスクレイプする、というときにはXPathが向いています。ブラウザでクリックした部分のXPathをサーバに保存しておけば、あとで保存したXPathに従ってドキュメントからエレメントを取り出すことができます。 しかし実際にHTMLからXPathを使ってエレメントを取り出すときに大きな問題になるのが、ウェブページの大半(体感で70%くらい)は記述されているHTMLが構造的に壊れているという事実です。タグを開いたまま閉じていなかったり、開いていないものを閉じていたり、ドキュメントの最後に</body></html>が二重に入っていたり、壊れかたは様々ですが、とにかくウェブ上のHTMLは大半が壊れています。壊れているHTMLが大半だからなのか、壊れているHTMLでもブラウザが適当に解釈して表示してくれるからなのか、とにかく世の中のヘージの大半

  • K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ

    K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。 以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。 この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+

    K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ
  • 【涼宮ハルヒの憂鬱MAD】 ハレ晴レユカイ(リメイク風.ver)‐ニコニコ動画(ββ)

    三人娘によるハルヒダンスの再収録&メイキング映像的なMAD・・・と言うと大げさですが、ようは背景を変えただけです。例によって大きな嘘から小さな嘘まで突っ込みどころ満載となっております。生暖かい目で見逃して頂けると助かります。元映像の尺図に合わせて短いMADになったので最後にオマケを入れました。■技術的な補足です動画で合成をやったことがある方なら疑問に思われるかも知れないので補足します。この動画はうp主が全コマ手作業で切抜いた訳ではありません。AE+自前プラグインでキーイングしています。実はこっちの開発がメインでこのMADはその副産物だったりします。うpしたハルヒMAD:⇒mylist/7644594

    tarao
    tarao 2009/01/15
  • Eine Schippe RSS-Icons

    18 Video-Tutorials: So setzt du deine Produkte perfekt in Szene Deine Produkte im besten Licht zu zeigen. Darum geht es in der Produktfotografie. Du willst verkaufsfördernd präsentieren, ganz gleich ob im Online-Shop, auf der Website oder im Katalog. Und das es bei dieser Sparte der Fotografie zahlreiche Tricks und Kniffe zu entdecken gibt, zeigen die folgenden Video-Anleitungen. Die meisten der f

    Eine Schippe RSS-Icons
    tarao
    tarao 2009/01/15