ここでは、テキストファイルに含まれる単語数を数えるスクリプトを作ってみる。 ただ、半角のスペースで split を使って分けて数えるだけなら、たのしい Ruby とかにもあるように、とても簡単なスクリプトになる。でも、それだと、記号と単語の区別はなく言語分析には全く向かないので、そういうことを考慮したものにしたい。 あと、ここにあるスクリプトは 1.8.7 で書いたので、1.9.x を使っている方は文字コードあたりの変更が必要かもしれない。ここでは、文字コードを UTF-8 に限定して扱うので、$KCODE = "UTF-8" をはじめに指定する。ほかの文字コードを扱いたい場合は変更する。Yosemite からは 2.0.0 なので、文字コードの指定の方法が別になるほか、ちょっと変更を加えたスクリプトも最後に追加しました。 ファイルの読み込み まずは、単語を数えるファイルを選ぶ。細かい説明
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く