タグ

2012年2月5日のブックマーク (8件)

  • N-gramモデルを利用したテキスト分析 ―インデックスページ―

    ↑ページ先頭 N-gramモデルを利用した事例 あるテキストから、任意のN-gram単位で共起頻度を集計し(N-gram統計を取る)、その結果を利用してテキストや言語の性格を見いだす研究によく利用される。 N-gramモデルで、ある文字列の直後に、特定の別な文字列は出現する確率を求める。 「an」の後には、必ず母音(aiueo)で始まる単語が結びつく確率が100% 「q」の後には、「u」が結びつく可能性が高い。 『論語』では「子」の後に「曰」が結びつく可能性が高い。 「百人一首」を平仮名に開いた場合の延べ数は、上位十五位までで全体の五割の使用量を占める(全部で六十八種の異なる平仮名(濁点含む)が使われている) 音声認識やOCR(原稿読みとりソフト)での利用 読みにくい文字でも、共起頻度の発生確率を考慮すれば、正しく原稿を可読出来る ↑ページ先頭 人文学的へのN-gramモデル導入 近藤みゆ

  • マルコフ連鎖してみた - hitode909の日記

    だいぶ前にはじめてのAIプログラミングというを読んで、N-Gramを作ってみた。 N-gramしてみた - hitode909のダイアリー 今日少し時間があったからマルコフ連鎖もやってみた。 はじめてのAIプログラミング―C言語で作る人工知能と人工無能 作者: 小高知宏出版社/メーカー: オーム社発売日: 2006/10メディア: 単行 クリック: 85回この商品を含むブログ (23件) を見る マルコフ連鎖を使った文の生成 ある文章を解析して、ある単語が出現した次にどの単語が出現することがあるかを調べる 文の開始となる単語を1つ選ぶ その単語に続く単語を確率的に選択していく 3をしばらく繰り返す こうすると、文っぽいものができるらしい。 あまり覚えていないけど、マルコフ連鎖というのは、次の要素が直前の要素のみによって決まる、という性質がある言語で、その性質を使って、文を作ることができ

    マルコフ連鎖してみた - hitode909の日記
  • 要チェックのRails関連情報源はここ!

    Ruby on Rails英語なら情報が豊富にあります。ただ、そもそもどこを見ていいのか分からないという方も多いのではないでしょうか。ここでは重要な情報源となり得るサイトを紹介します(この記事はRailsDevCon2010で西村が行った発表をベースにしています)。 家サイトは“ガイド”が要チェック まず当然、Ruby on Railsの公式サイトがあります。ここはRuby処理系や関連ライブラリのダウンロードページへのリンクやドキュメント、入門解説、ブログを始め、スクリーンキャストなどがあります。新バージョンのリリースやセキュリティ情報などは、やはり家ブログが第一の情報源です。 この後にも優良なスクリーンキャストサイトを紹介しますが、ここを起点にするのも良いでしょう。「15分でブログを作る」という、Rails一躍有名にしたプレゼンテーション動画も見られます。最初にDHH(Rails

    要チェックのRails関連情報源はここ!
  • 最近やってるRailsプロジェクトのテスト方法 - #詰んでる日記

    Railsエンジニアになってから1年半くらいが経ち、社内のRailsプロジェクトを全部で5つくらい触って、今やってるAbilie*1でようやく人並みにテストを書いてる気がしてきたので、現時点でやってるテストの方法をまとめておく。 テストのルール的なの rspecでは必ずモデルのテストは書くようにしてる。ヘルパーも大体書いてるけど、コントローラやルーティングのテストはあまり書いてない。 というのも、コントローラーのコードを極力短くしてモデルを太らせているのでコントローラのテストはあんまり意味が無い気がしていて、その代わりにCapybaraでテストを書いておけば十分なんじゃないかなと思ってきたから。Capybaraは書いてるので、そういう意味では書いてるとも言える。 社内の管理者だけが使える管理画面も作ってるけど、そっちはテストあんまり書いてない。ここは動かなくなっても一般ユーザーには影響が

    最近やってるRailsプロジェクトのテスト方法 - #詰んでる日記
  • Dropboxベータテスト参加で追加5GBを獲得するための手っ取り早い方法

    Dropboxクライアントのベータ版をインストールし、ベータ版のみにある「Dropbox camera import」という機能で画像や動画を転送すると、最大5GB分Dropboxの容量が増えるって話です。 ベータクライアントは、以下からダウンロードできます。 そう言われると5GB分容量を増やしてみたいですが、いきなり5GBと言われても、さあ、5GB分何を用意したもんやらと困惑することでしょう。(続きは[Read More]から) そこで登場するのが、このダミーファイル。 DUMMY_FILES.zip (5MB) 僕は素直?に1GB な dd で作った .mp4を5個アップしました. RT @hitoriblog: 4.6GBの偽JPEG、SDカードにコピーできない — Hiroshi SHIRATSUCHI (@epkg) February 4, 2012 小さな5MBのzipファイル

    Dropboxベータテスト参加で追加5GBを獲得するための手っ取り早い方法
    komlow
    komlow 2012/02/05
  • ドメイン駆動設計入門 - Digital Romanticism

    "Beautiful Develpment"(10/27 DevLOVE)の講演資料と原稿 はじめに 日(10/27)、DevLOVE様主催で、"Beautiful Develoment"と題されたイベントが開催されました。これは「ドメイン駆動設計("DDD:Domain-Driven Design")」を題材に、入門から実践までを語り尽くすというコンセプトのものです。このイベントにおける講演のトップバッターとして、ドメイン駆動設計の根底にある基的な考え方についてお話しさせて頂きましたので、講演資料と原稿を公開いたします*1。 スライドはこちら アジェンダは以下の通りです。 導入 オブジェクトとは? モデルとは? ドメイン駆動設計とは? まずは、ドメイン駆動設計のベースとなっている、「オブジェクト指向」や「モデル」について整理した上で、実際にドメイン駆動設計とはどういうものかを見ていき

    ドメイン駆動設計入門 - Digital Romanticism
  • マルコフ連鎖モンテカルロ法入門-1

    ※ここで解説しているお天気推移モデルはオリジナルなものですので、数値・計算等にミスがある可能性が否めませんので、もし間違いを見かけた方は優しく教えていただけると助かります。 お天気推移モデルで理解するマルコフ連鎖モンテカルロ法。2状態離散モデルの解説を中心に、メトロポリス法の解説まで行った。 次は連続モデルや熱浴法・メトロポリスヘイスティング法の解説資料も作成したい⇒完成。以下のLINKを参照下さい。http://www.slideshare.net/teramonagi/ss-5344006 誤字を修正(2010/11/01)Read less

    マルコフ連鎖モンテカルロ法入門-1
  • ネットが守るべき言論の自由とはなにか? - はてなポイント3万を使い切るまで死なない日記

    ネットでわんこ☆そば氏なるひとのブログに面白い記事がのった。 ドワンゴ川上会長「中国のようにネット言論は国で規制すべし」 - SKiCCO JOURNAL そこだけ読むと、多くのひとがこのひとは無茶苦茶いっているなと反感を持つような見出しである。ネットではこういうように自分が都合がいいように情報を切り出して加工して、架空の敵をつくって攻撃をするということがよく行われる。 ちなみに面白いことに、このブログをさらに引用したニュース記事があって、タイトルはこんな風になる。 『ネットの意見は国が封殺すべし!』ドワンゴ川上会長の驚き発言 - 楽天ソーシャルニュース 要するに読者を刺激する、できるだけ読者が怒り出すようなタイトルをがんばってつけようとしているのだ。そしてネット民はそういう情報を取捨選択かつ判断する賢さはあまりもっていないひとが多いから、そういう作られたイメージでどんどん空想の議論を発展

    ネットが守るべき言論の自由とはなにか? - はてなポイント3万を使い切るまで死なない日記