タグ

テキストと文章に関するorticaのブックマーク (4)

  • Text Classification with CEEK.JP NEWS

    CEEK.JP NEWS の2009年1月から2011年12月の記事データを基に、テキストの分類を行います。対応しているカテゴリーは「社会」「政治」「国際」「経済」「電脳」「スポーツ」「エンターテイメント」「サイエンス」の8つです。 ナイーブベイズ(Naive Bayes)分類法を用いており、概ね80%の精度で分類できます。 コンフュージョン・マトリックス(学習:2005年7月 / 判定:2005年8月) http://labs.ceek.jp/classify/cm.pdf 表の縦(グラフ)は、推定分野。表の横は、正解分野。 参考資料: 情報意味論(第8回) ベイズ学習 (櫻井研究室 情報意味論の講義資料) Tackling the Poor Assumptions of Naive Bayes Text Classifiers

    ortica
    ortica 2013/04/20
    [h:keyword:Text Classification]
  • 「書き手だけが読む特殊な形式」と「誰もが読む一般的な形式」の違い - ohnosakiko’s blog

    マクルーハンの説明はこうです。紙に印刷して読むとき──つまり、反射光で文字を読むとき、私たちの受容モードは自動的に、そして脳生理学的に「分析モード」になり、心理的モードは「批判モード」に切り替わる。したがって、ミスプリントを見つけやすい。 [中略] つまり、発光型デバイスであるモニタを見るときには、脳はパタン認識・くつろぎモードになるため、文書を見ても全体を絵柄として捉え細部に注意がいかなくなり、ぼんやりとくつろいで見ることになり間違いに気づきにくくなる。一方、紙にプリントアウトすると、それは反射光となるため、脳は分析・批評モードに切り替わり、文書を細部まで細かくチェックすることが可能となる。そのため、間違いに気づきやすいというわけだ。文章をチェックするときに、一旦紙にプリントアウトして見ることは、理に適った行動なのだ。 プリントアウトした方が間違いに気づきやすいワケ - A Succes

    「書き手だけが読む特殊な形式」と「誰もが読む一般的な形式」の違い - ohnosakiko’s blog
  • カフカ『変身』はラノベよりもずっと読みやすい←日本語難易度推定をやってみた

    語彙学習を最適化するために、自分のレベルにあった文章を探すにはどうすればいいのだろう? 自分の語彙数は、 「語彙数推定テスト」( NTTコミュニケーション科学基礎研究所) http://www.kecl.ntt.co.jp/icl/lirg/resources/goitokusei/goi-test.html 語彙推定テスト で分かった。 それから語彙を増やすには読書が一番ということ、それも分からない言葉だらけのものより、出てくるほとんどの言葉は分かるが、その中に少しだけ知らない単語が入っているようなものを読むのがもっとも学習効率がよいらしいことも できる子はできない子の4.6倍のボキャブラリーがあるー日語の語彙の測る/増やす方法 読書猿Classic: between / beyond readers で触れた。 あとは自分のレベルに合ったものを読むだけなのだが、今日はそれに役立つウェ

    カフカ『変身』はラノベよりもずっと読みやすい←日本語難易度推定をやってみた
    ortica
    ortica 2012/07/13
    [h:keyword:リーダビリティ]
  • naoyaのはてなダイアリー - 文章を書くときに段落のまとまりの見た目を意識するかどうか

    いつだったか id:jkondo あたりと話をしていて、blog などのテキストコンテンツで、アウトプットされる文章の見た目を意識するかどうか、という話をしました。突然思い出した。 一時期流行ったテキストサイトの、フォントの大きさや改行を使った演出みたいなのとはちょっと違う話。この日記のように、テキストにエフェクトをかけたりとかはしておらず、普通に書いてますというもので、アウトプットの見た目を意識するかどうかということ。ちょっとニュアンスが伝えづらいのですが。 で、意識しているかについて YES/NO でいくと僕は YES。ひとつの段落にまとめたときにいい見た目の塩梅になる文字数とか、空行が適度に入るように段落わけするとか、そういうのを意識しています。わざわざ綺麗にまとまるように文章を付け足したり削ったり、構成を変えたりということをすることもあります。なんとなくこう、あるんですよ、このぐら

    naoyaのはてなダイアリー - 文章を書くときに段落のまとまりの見た目を意識するかどうか
  • 1