タグ

ブックマーク / blog.unnono.net (3)

  • 日本語で読める自然言語処理のチュートリアルスライドまとめ

    先日、自然言語処理の講演などをしていたときに、そもそも私なんかが話すよりも公開されているチュートリアルスライドを集めたほうが有用なんではないかと思い立って、これから自然言語処理を学びたい人や、ちょっと新しい分野を知りたい人向けに、日語で読めるチュートリアルスライドを分野別にまとめてみました。 主に、学会のチュートリアルや招待講演、それから研究者の方のWebページなどを参照しながら作りました。 自然言語処理全般系の資料や、少し境界的なテーマは入っていません。 また、ぱっと読めるスライドだけにしています。 幾つか手前味噌な資料も載せてます・・。 頑張って集めてみましたが、思ったほど集まりませんでした。 作っていてわかったのですが、意外とスライドを公開している人は少ないようです。 埋もれてしまうのはもったいないですね。 いずれ、英語で読めるスライドを集めてみようと思います。 そっちはそっちで、

  • 第6回さくさくテキストマイニングで発表しました

    内容は、技術的な内容をかなり省いて、機械学習自体のチュートリアル、Jubatusが既存の機械学習ライブラリと何が違うのか、どういう応用ができそうかという点に絞りました。最近、もっと世の中の人に機械学習の恩恵を受けて欲しいと、割りと真面目に考えるようになったので、いろんな所でキャンペーンしています。機械学習だとか自然言語処理だとかは、個人的には明らかに便利な面があるのですが、まだ研究者のツールを抜け出て無い印象があって、そこのブレークスルーを作れればもっと新しいアイデアが出てくるんじゃないかと思います。 今回発表することになった発端は、前職の先輩である那須川さんの著書を、この勉強会の教科書に指定されていたので、そもそも那須川さんに話してもらったらいいんじゃないかということでボクが声をかけました。この書籍も、テキストマイニングに対する世の中のニーズや、利用シーンなどがよくまとまっていておすすめ

    第6回さくさくテキストマイニングで発表しました
  • 社内セミナーで形態素解析について話しました

    持ち回りの社内セミナーが自分の番になったので、形態素解析についてまとめてみて、発表しました。係り受け解析入門に引き続き、自然言語処理チュートリアルシリーズ第2弾になります。結構ボリュームがあって、力作になってます。 今回の狙いは3つくらいありました。 ひとつは自分自身昔の文献などを読んだことがなかったので読んでみたこと。見ると、昔は多くの論文を企業の人が書いていて驚きます。初期の文献で引用したものはほとんどが企業系研究者の方の論文です。日本語入力の文脈で研究されていたからなのかな、という気がします。 もうひとつは現在の問題点と問題意識をまとめる。書いたとおり、アプリケーションに対して最適なことをすべき、という思いがあります。それは単にアプリケーションごとに形態素解析器を作るべき、ということではないです。そもそも形態素解析というソリューションは適切ですか?という問いかけです。実際に弊社では、

  • 1