タグ

2011年8月25日のブックマーク (12件)

  • livedoor Techブログ : wikipediaのデータや顔文字辞書からmecabのユーザ辞書を作成するフレームワーク

    突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語

    rti7743
    rti7743 2011/08/25
    めも
  • - よくきたWiki

    † SRPMS/ +---*.src.rpm # mkdir -p /var/www/html/yum/repos/fc4/i386 † # /bin/cp -p /usr/src/redhat/RPMS/i386/htop-0.5.2-1.i386.rpm /var/www/html/yum/repos/fc4/i386/. † # cd /var/www/html/yum/repos/fc4/i386 # /usr/bin/createrepo $PWD 1/1 - htop-0.5.2-1.i386.rpm Saving Primary metadata Saving file lists metadata Saving other metadata *1 † [my] name=Fedora Core $releasever - $basearch - My Repository

    rti7743
    rti7743 2011/08/25
    めも
  • CafeChantant.com is for sale | HugeDomains

    Working with hugedomains.com was a quick and easy process. We got to speak to multiple real people located in Colorado without having to wait on hold! Our only complaint was we felt we had to overpay more than this particular domain was worth, and we weren't able to negotiate it down to a level that we felt was fair. However, payment and delivery were seamless, and within a few hours we had all of

    CafeChantant.com is for sale | HugeDomains
    rti7743
    rti7743 2011/08/25
    めも
  • Creating Speech Recognition Grammars from Regular Expressions for Alphanumeric Concepts - Microsoft Research

    rti7743
    rti7743 2011/08/25
    めも
  • PHPでネイティブ関数を含むコードのテスタビリティを上げるもう1つの方法 - Do You PHP はてブロ

    via. PHPでネイティブ関数を含むコードのテスタビリティを上げる2つの方法 - 絶品ゆどうふのタレ こういう"PHPでどこまでできるか"ネタっていいですね。 また、PHP 5.4で盛り上がってるご時世にPHP 5.3な話をしちゃってて相変わらず空気読めてないけどそこはスルーで。 すみません。まだPHP5.2系です。。。 PECL:runkitを使う なんでもありなrunkitに既存関数をオーバーライド(というか、関数の再定義)する関数があります。 PHP: runkit_function_redefine - Manual ただし、ユーザー定義関数以外を再定義する場合、php.iniの設定に runkit.internal_override=1を追加する必要があります。 で、次のような感じでテストを書くことができます。今回使用したのは、PHP5.2.17+runkit1.0.0-dev

    PHPでネイティブ関数を含むコードのテスタビリティを上げるもう1つの方法 - Do You PHP はてブロ
    rti7743
    rti7743 2011/08/25
    めも
  • test_helpers拡張モジュール - Do You PHP はてブロ

    気がついたら、PHPUnitの作者であるSebastian Bergmann氏が"test_helpers"なる拡張モジュールを公開していたようです。 GitHub - php-test-helpers/php-test-helpers: An extension for the PHP Interpreter to ease testing of PHP code. コンセプトとしては、ユニットテストを書けないようなレガシーコードで、ユニットテストを楽に書けるようにするための拡張モジュールのようで、ざっと機能をまとめてみると、 exit/die関数の無効化やコールバックを指定できる newオペレータの実行時にコールバックを指定できる 関数の改名 な感じです。感覚的には、PECL :: Package :: runkitに近い感じです。 とりあえず、README.markdownを訳してみ

    test_helpers拡張モジュール - Do You PHP はてブロ
    rti7743
    rti7743 2011/08/25
    めも
  • PHPでネイティブ関数を含むコードのテスタビリティを上げる2つの方法 - 絶品ゆどうふのタレ

    PHPでテストケースを作成する場合、ネイティブ関数を使っているようなコードに対してテストを実行しようとすると、どうしても環境に依存したり、実リソースにアクセスする必要が出てしまうことがあります。 この記事では、そのような問題に対する対処法を提示します。 経緯みたいなもの 先日もWeb APIをコールするPHPライブラリを書いていたのですが、HTTPをたたく部分のテストを切り離せず、もやもやしていました。 ちょっと前にPerlのTest::Timeというライブラリを教わって感動していたのですが、PHPでもネイティブ関数をオーバーライドできたらどんなにすばらしいだろう、などとぼやいていたのです。 そんなときに、@takimoにPHP 5.3ならオーバーライドできるよねって言われて、ハッと思い立ってテストに組み込む方法を考えてみたところ、割とスマートに実現できそうな方法が見つかったので、方法論の

    PHPでネイティブ関数を含むコードのテスタビリティを上げる2つの方法 - 絶品ゆどうふのタレ
  • チューニンガソンで優勝してきました : DSAS開発者の部屋

    7/9(土)にチューニンガソン というイベントに参加して優勝してきたので、その報告と、何を考えてどんなチューニングをしたのかを 記憶の範囲で公開したいと思います。 今回のチューニンガソンのお題は、WordPress(ja) + php + Apache + MySQL で、 ab を使って wp-comment.php 経由でコメントのポストをすることで計測が行われました。 MySQLとApacheを立ち上げたらWordPressが動く環境が渡され、そのWordPress自体は設定ファイルを含めて 改造が一切禁止、WordPressの実行をショートカットするチートも禁止です。 0. 試合前日 環境がAWSとAMI Linuxということは事前に公開されていたため、前日にAWSに登録して少しだけAMI Linuxを 触ってみました。yumベースだけどCentOSと違って結構新しいバージョンが用

    チューニンガソンで優勝してきました : DSAS開発者の部屋
  • Windows8ではコピー機能がめちゃくちゃ強化されることが明らかに

    マイクロソフトがWindows7ユーザーの遠隔測定データ(何億人分ものユーザーデータを匿名で提供してもらう仕組みらしい)に基づいて調査した結果、コピー・移動・名前の変更・削除といったエクスプローラ経由のファイル操作が全体の50%であり、次期ウインドウズである「Windows 8」ではこれら一連のファイル操作を「コピージョブ(コピー作業)」と定義し、大きな改善を施すことを公式ブログで明らかにしました。 Improving our file management basics: copy, move, rename, and delete http://blogs.msdn.com/b/b8/archive/2011/08/23/improving-our-file-management-basics-copy-move-rename-and-delete.aspx コピー作業全体の50%は1

    Windows8ではコピー機能がめちゃくちゃ強化されることが明らかに
    rti7743
    rti7743 2011/08/25
    windows95から16年にしてやっとかって感じだな・・・  それと事前に全部上書きオプションとかも提供してほしいな。
  • 最近の起業家は気持ち悪い、そしてそもそも起業家ではない。

    最近日のスタートアップが活気づいている。学生を含め、 多くの若者が会社を立ち上げ、明日のザッカバーグの夢を見ている。 (その夢の姿は往々にして『ソーシャル・ネットワーク』そのままだ。) だがきっとその夢は一生叶うことはない。残念ながら。 グレアムの言葉にしたがって楽天家を演じている日起業家の皆さんは 私に向かってこう言うだろう。「どうして君はそんなこと言うんだ? 俺たちは世界を変えるんだ。大変かもしれないがそれは不可能ではない。Facebookを見ろ。」 オーケー、オーケー、確かに起業家は世界を変える力を持つ。それはすばらしいことだ。 だがそもそもあなた方は起業家なのか?ザッカバーグなのか? 自問してみよう。残念ながら違うことに気づく筈だ。あんた方はただの”タレント”だ。 日のスタートアップ環境は極めて特殊である。 そもそもスタートアップと言って良いのかさえ分からない。 それはこう

    最近の起業家は気持ち悪い、そしてそもそも起業家ではない。
    rti7743
    rti7743 2011/08/25
  • wikipediaは6回リンクを辿ればどのページでもいけるらしいwww:ハムスター速報

    wikipediaは6回リンクを辿ればどのページでもいけるらしいwww Tweet カテゴリ☆☆☆☆ 1:以下、名無しにかわりましてVIPがお送りします:2011/08/24(水) 19:56:59.47ID:fGOf/vHu0 絶対うそだろwwwwwwwwwwwwwwwwww 2:以下、名無しにかわりましてVIPがお送りします:2011/08/24(水) 19:57:49.62ID:gsQnOI/n0 ガンダムからは6回リンクを辿っても胡麻に行けない 34:以下、名無しにかわりましてVIPがお送りします:2011/08/24(水) 20:22:29.18ID:eedl+ifE0 >>2 ガンダム→ナパーム弾→パーム油→揚げる→ごま油→ゴマ(胡麻) 105:以下、名無しにかわりましてVIPがお送りします:2011/08/24(水) 20:53:42.50ID:mhoZV/Sb0 >>34天

    rti7743
    rti7743 2011/08/25
    リンクにおける スモールワールド みたいな感じ? wikipedia のリンク階層を視覚化したらとんでもない蜘蛛の巣になっているんだろうな。
  • 奇跡の1分オフ@福井駅

    まめち @m0mch1 I'm at JR 三ノ宮駅 (Sannomiya Sta.) (布引町4丁目, 神戸市中央区) w/ 4 others http://t.co/C54k90g

    奇跡の1分オフ@福井駅
    rti7743
    rti7743 2011/08/25
    1分オフとかありえなさすぎwww すげえ。