MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解
ちょっとしたイラストが描けたらなぁ。なんて思うこと多いですが、デジタルならではの方法で簡単に描く方法が公開されていたので、簡単ですが訳したいと思います。詳細はオリジナル記事であるHow to Draw Cute Thingsを御覧ください。 最初に好きなネコとかハムスターとかナマケモノなどの動物の画像を用意する。基本的に何でも良いけど、慣れるまではモフモフ系がやりやすいみたい。トカゲとか蛇はむずい。 選んだ動物を円の集合にする 円じゃなく三角や四角を使ってもよい。動物をシンプルにする工程。画像ソフトのシェイプから選んでね。 できた形の輪郭を描く 必要のない線を消す。余裕あったら脇の下を細めたり足の重なりを上手に書いたりしてみる。 全体のバランスを変形してかわいくする 頭大きくしたり、胴体縮めたり、太らせたりしてかわいくする。ここはセンス。 可愛さは目に宿る 目が一番大事。サンプルを参考に。
本稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く