タグ

2009年11月2日のブックマーク (8件)

  • はてなブログ | 無料ブログを作成しよう

    うまくいかない日に仕込むラペ 「あぁ、今日のわたしダメダメだ…」 そういう日は何かで取り返したくなる。長々と夜更かししてを読んだり、刺繍をしたり…日中の自分のミスを取り戻すが如く、意味のあることをしたくなるのです。 うまくいかなかった日のわたしの最近のリベンジ方法。美味しいラペを…

    はてなブログ | 無料ブログを作成しよう
    hiromark
    hiromark 2009/11/02
    使いどころあるかも、一応メモ。
  • 系列ラベリングアルゴリズムの比較 - 松本研研究日誌

    今日の DMLA 勉強会は松先生で Nam Nguyen and Yunsong GuoComparisons of Sequence Labeling Algorithms and ExtensionsICML-2007の紹介。SVM^struct/SVM^multiclass/CRF/HMM/Averaged perceptron/SEARN/M^3Nといったいろいろなアルゴリズムで品詞タグづけ問題を解くという話。提案手法はensemble learningで複数の手法の重み付けによる分類器を作ると、単体で一番成績がよかったSVM^structよりさらによくなりますよ、とのこと。なんか CRF が予想外に悪かった(松先生も首を傾げていた)のだが、なんなんだろうか。 SEARN (Search-based Structured Prediction)というのは元論文は Search

    hiromark
    hiromark 2009/11/02
    系列ラベリングって昔ちょろっと勉強したけどあんまりきちんと覚えてない。復習がてら調べてみる。
  • bsfilter / bayesian spam filter / ベイジアン スパム フィルタ

    Subscribe to our newsletter to get daily updates about Programming and Spam Filtering.

  • Kazuho@Cybozu Labs: フレンド・タイムライン処理の原理と実践

    « MySQL のクエリ最適化における、もうひとつの検証方法 | メイン | MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話 » 2008年06月09日 フレンド・タイムライン処理の原理と実践 MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話に続きます。 Twitter が注目されるようになって久しい今日この頃ですが、友人の投稿を時系列に並べて表示する、というのは、Twitter に限らず Mixi の「マイミクシィ最新日記」やはてなブックマークの「お気に入り」等、ソーシャルなウェブサービスにおいては一般的な手法です。ですが、この処理 (以下「フレンド・タイムライン」と呼ぶ) は、一見簡単そうに見えて、実装には様々な困難が伴います。記事では、「フレンド・タイムライン」を実現する、プッシュ型とプル型の二種類の手法について、その原

  • 現代的なPerlの記述方法一覧 - Perl入門ゼミ

    Perl › here Perl5.8以降における標準的なPerlの書き方を解説します。 インターネットで検索するとPerl4のころの古い記述がたくさんあります。また書籍などの多くもPerl4の記法で書かれています。Perl4の記法は複雑になりやすく間違いを生みやすいのでこれからPerlを書く人はPerl5の現代的な記法で記述することを強くお勧めします。 strictプラグマとwarningsプラグマ (必須) strictプラグマとwarningsプラグマを有効にします。 use strict; use warnings; use strict;とuse warnings;の2行はスクリプトの最初に必ず記述してください。これらはPerlの文法チェックを厳しくするためのものです。面倒だという軽い気持ちでこれを記述しないと後々当に面倒なことになります。 use strict;とuse wa

    現代的なPerlの記述方法一覧 - Perl入門ゼミ
    hiromark
    hiromark 2009/11/02
    Perl ってちょっとした試作でたまに使う程度なのであんまり意識してなかった。
  • 工学ナビの中の人の研究と周辺 良い研究を行うためのいくつかのルール

    ・良い研究は,良い問題発見からはじまる ・「問題」「方法」「結果」のいずれかが新しければ,研究として新規性が認められる ・アイデアをよくする最も良い方法は,人に話して意見をもらうこと ・ヒントはその辺にたくさん転がっているが,「問題」に悩んでいる状態でなければ その存在に気づくことはできない ・「方法」から「問題」を考えるのは難しい 「問題」に対して「方法」は無数にある.他の方法に対して有利な「問題」を考えるのは楽なことではない. ・どんなに良いアイデアでも,論文の書き方とプレゼン次第で台無しになる (逆もまたしかり) ・研究している人がドキドキしない研究は,他の人が見てドキドキするはずがない ・良い研究者は,素人のように考え,玄人として実行する ・できることだけ考えているうちは新しいことはできない 良い研究者は,できないことを考えて,それをできるようにする方法を考える ・良い研究をして

    hiromark
    hiromark 2009/11/02
    研究以外にも当てはまること多い。
  • Blogger

    Google のウェブログ公開ツールを使って、テキスト、写真、動画を共有できます。

  • 全文検索エンジン Miniseをリリース + WEB+DBで全文検索の特集記事 - DO++

    全文検索エンジンの Minise: MIni Search Engineをリリースしました. このエンジンは全文検索の基的な機能をサポートしたもので,索引手法は逐次検索(索引無),N-gram,転置ファイル,接尾辞配列をサポートしており,そこそこ最適化を行ってます.Wikipedia語版を実験で使ったもので20万文書で構築時間が500秒前後,検索時間が一クエリあたり数msとなっています. BSDライセンスで公開しています. 割りきって,機能を絞ってシンプルな構成にしていますので改造したりしやすいようになっています。まだ、ドキュメントはないですが、C++ APIとして利用しやすいようにもなっていますので、研究用途などで新しい索引やランキングとかでの利用も想定しています(実際に研究用で使ってます). --- 今回の全文検索ライブラリを開発する機会になったのが,私が担当した今月号のWEB+

    全文検索エンジン Miniseをリリース + WEB+DBで全文検索の特集記事 - DO++
    hiromark
    hiromark 2009/11/02
    すげっ。