タグ

2014年6月23日のブックマーク (10件)

  • ノンパラメトリックベイズ言語モデルによる コーパス内トピック抽出 2010年6月22日 知識工学部 阿部裕介 CLML-HDP-LDAパッケージを用いたコーパス分析例 概要 1. トピックとは? 2. ベイズ統

    ノンパラメトリックベイズ言語モデルによる コーパス内トピック抽出 2010年6月22日 知識工学部 阿部裕介 CLML-HDP-LDAパッケージを用いたコーパス分析例 概要 1. トピックとは? 2. ベイズ統計言語モデル 3. コーパスからのトピック抽出例 4. 問題点  トピックとは? 文書集合(コーパス)の単語出現頻度は 時期・分野・地域…etcの影響を受けて変動する (例)円高…経済記事では出現頻度が高いが       芸能記事では少ない    …1月の新聞記事では出現頻度が高いが      8月の記事では少ない  トピックとは? (2) トピック = 単語出現頻度を変動させる       (潜在的な)要因 問題:コーパスのみが与えられている状況で、各文書の単 語出現頻度から、そのコーパスに潜在しているトピックに したがって、コーパス内の各単語を分類・クラスタリング し、その結

    yass
    yass 2014/06/23
  • Selenium2でつくるテストケースの構成について

    2. なにを発表するの?  最近、Selenium2 + Ruby + RSpec でブラウザ テストの自動化に取り組んでます  「ブラウザテスト」?  ここでは「テスターがブラウザを操作して眼で結果 を確認する行為」という意味で使います  具体的にどんなことをやってるのかを紹介し ます。 (主にテストケースの構成について話します) 4. Slenium2って何?  OSSのブラウザテストツール  プログラム言語でテストスクリプトを書いて使う  何ができるの?  手動テストの代替  手動テストで行うのと同様に、実際にWebブラウザを起 動して操作できる  ボタン押したり、文字列を入力したり取得したりetc  特徴・メリット  ブラウザテストツールのデファクトスタンダード  情報&使用経験者の数が多い  開発が活発  幅広いOS/ブラウザ/言語に対応

    Selenium2でつくるテストケースの構成について
  • 10 Best Practices for Better RESTful API | Thinking Mobile

    Do not use verbs: /getAllCars /createNewCar /deleteAllRedCars 2. GET method and query parameters should not alter the state Use PUT, POST and DELETE methods  instead of the GET method to alter the state. Do not use GET for state changes: GET /users/711?activate or GET /users/711/activate 3. Use plural nouns Do not mix up singular and plural nouns. Keep it simple and use only plural nouns for all r

    10 Best Practices for Better RESTful API | Thinking Mobile
  • 細かすぎて伝わらないmdbm

    おまけ話として、mdbmはLinear Hashingと呼ばれるハッシュアルゴリズムの影響を強く受けています。 Linear Hashingの詳細はwikipediaをご覧ください。 http://en.wikipedia.org/wiki/Linear_hashing このアルゴリズムによりmdbmは、扱うデータサイズが大きくなれば、動的にHashTableを拡大することができる非常に便利な特性を持っています。 しかし、冷静になって考えてみてみましょう。このLinear Hasingの管理用のテーブルを走査する計算コストは可能なら避けるべきです。 mdbmをはじめ、多くのKVSでは最終的なデータのサイズの予想がつくのであれば、あらかじめ大きめのサイズでデータベースファイルを作成する方が好ましいでしょう。 この辺の話に興味がありましたら、コードの「hashval_to_pagenum()」

    細かすぎて伝わらないmdbm
    yass
    yass 2014/06/23
    " mdbmはLinear Hashingと呼ばれるハッシュアルゴリズムの影響を強く受けています / このアルゴリズムによりmdbmは、扱うデータサイズが大きくなれば、動的にHashTableを拡大することができる非常に便利な特性を持っています "
  • Linux カーネルと FreeBSD カーネルの割り込み処理

    わけあって、 Linux カーネルと FreeBSD カーネルの双方で仕事をした結果、 二つのカーネルで割り込み処理の実装方法が大きく異なっていることに気づきました。 ここでは、それぞれの割り込み処理の仕組みについて、 調べたことを書いてみたいと思います。 割り込みとは、主に入出力ハードウェアによって CPU に送られる処理要求のことです。 一般に、 CPU は入出力ハードウェアよりもずっと高速に動作するので、 入出力処理を行う際に、ハードウェアの動作を待つよりも、 CPU では別の処理を行なっておき、 必要になった時にハードウェア側からの通知を受けて対応する処理を行う方が、 CPU を有効に活用できます。この入出力ハードウェア側からの通知が、割り込みと呼ばれます。 割り込みは、 CPU で動作するカーネルによって処理されることとなります。 ここで、一つの割り込み処理に時間がかかると、他の

    yass
    yass 2014/06/23
    " Linux の方式は、メモリ空間が切り替わらないため、 コンテキストスイッチの必要がなく、効率上の利点があります。"
  • 「すごい Erlang ゆかいに学ぼう!」という本が7月に出ます - kuenishi's blog

    すごいErlangゆかいに学ぼう! 作者: Fred Hebert,山口能迪出版社/メーカー: オーム社発売日: 2014/07/26メディア: 単行(ソフトカバー)この商品を含むブログを見る いままでいろんな観点からErlang/OTPに関するが出てきたが、このはそのErlangの技術の集大成といっていいだ。コレ一冊読んでおけば間違いない。他のは忘れてもいい。あえていうなら、これを読んだ後にもっと詳しい作者自身の哲学を知りたい場合だけ、戦闘機を読めばよい。だが他のは別にいらない。内容が古かったりツールを網羅していなかったりするためだ。 原著は Herokuエンジニア Fred Hebert のWeb記事をもとにしただ。 Learn You Some Erlang for Great Good!: A Beginner's Guide 作者: Fred Hebert出版

    「すごい Erlang ゆかいに学ぼう!」という本が7月に出ます - kuenishi's blog
    yass
    yass 2014/06/23
    " コレ一冊読んでおけば間違いない。他の本は忘れてもいい。あえていうなら、これを読んだ後にもっと詳しい作者自身の哲学を知りたい場合だけ、戦闘機本を読めばよい。"
  • chmodやchownのreferenceオプションを知った時は目から鱗だった話

    人間とウェブの未来(旧) 「ウェブの歴史は人類の歴史の繰り返し」という観点から色々勉強しています。2014年までの人間とウェブの未来の旧ブログです。 元々ホスティング会社で働いていたので、その特性上ownerやpermissionを色々と弄る事が多く、数年前の社会人時代にchmodやchownをもっと楽に使えないかなぁと調べた時に目から鱗だったのがchmodやchownのreferenceオプションでした。 今回は単にreferenceオプション楽ですよね、という記事なのでご存知の方は退屈な記事だと思いますが、まわりに聞いてみた所意外と知られていなかったりしたので、ブログエントリにしておこうと思います。 referenceオプションを使うと、任意のファイルを指定することで、変更対象のownerやpermissionを指定したファイルと同じ設定にすることができます。 例えば、/bin/pin

    chmodやchownのreferenceオプションを知った時は目から鱗だった話
    yass
    yass 2014/06/23
    " referenceオプションを使うと、任意のファイルを指定することで、変更対象のownerやpermissionを指定したファイルと同じ設定にすることができます。"
  • maxlengthを使ってはいけない。特にパスワード入力欄で使っちゃ駄目! - Qiita

    今日自分が体験したトラブル事例に、ユーザビリティ向上のための気づきがあったのでメモしておきます。 ※文よりまず、このコメント、こっちに言いたいことが集約されてるのでまずはこっちを読むと早いです。 ※文よりまず、このコメント、こっちに言いたいことが集約されてるのでまずはこっちを読むと早いです。 ※文よりまず、このコメント、こっちに言いたいことが集約されてるのでまずはこっちを読むと早いです。 事例:登録時のパスワードでログイン出来ない!? 今日、とあるWEBサイトでユーザ登録を行った際に、登録時に入力したパスワードでログイン出来ないというトラブルがありました。 普通は自分の入力ミスを疑うところですが、登録もログインもコピペで入力しているので入力ミスはありえ無いと思っていました。 お問い合わせフォームからバグ報告 というわけでこれはバグだろうと、お問い合せフォームから以下のような内容の報告

    maxlengthを使ってはいけない。特にパスワード入力欄で使っちゃ駄目! - Qiita
  • samulife.com - このウェブサイトは販売用です! - samulife リソースおよび情報

    このウェブサイトは販売用です! samulife.com は、あなたがお探しの情報の全ての最新かつ最適なソースです。一般トピックからここから検索できる内容は、samulife.comが全てとなります。あなたがお探しの内容が見つかることを願っています!

    samulife.com - このウェブサイトは販売用です! - samulife リソースおよび情報
    yass
    yass 2014/06/23
  • In search of the perfect URL validation regex

    To clarify, I’m looking for a decent regular expression to validate URLs that were entered as user input with. I have no interest in parsing a list of URLs from a given string of text (even though some of the regexes on this page are capable of doing that). I also don’t want to allow every possible technically valid URL — quite the opposite. See the URL Standard if you’re looking to parse URLs in

    yass
    yass 2014/06/23