ブックマーク / qiita.com/knknkn1162 (2)

  • データサイエンティストはエンジニアなのか? - Qiita

    TL;DR データサイエンティストはエンジニアではなく、コンサルタントである。なので、エンジニアの延長線上としてデータサイエンティストを考えるべきではない。 データサイエンティストは、「データ分析をすることで、顧客に当に価値を提供できるのか」を(時にはビジネスサイドよりも)気で向き合う必要がある。なぜならビジネスサイドはデータの見方に熟知しているわけではないからだ。 課題に向き合うときは、なぜその課題を解決する必要があるのか、から出発して、課題の難易度を下げることに注力しよう。あなたのミッションは難易度の高い問題を解くことではない。 (プロダクションの実装時に)機械学習の手法を採用するデメリットを述べられないならば、特に運用面で他のエンジニアに迷惑をかけることになるだろう。 ちょっと言い方きついですが、へこまないでね あくまで、一個人としての意見でありポエムです。 はじめに いつもは、

    データサイエンティストはエンジニアなのか? - Qiita
  • MeCabをブーストさせよう - Qiita

    はじめに MeCabとは日語の形態素解析器をいいます。ここで、形態素というのは言語で意味を持つ最小単位のことです。分割された単語をベクトル化したり、各語彙の頻度を調べたりするために、最小単位に分割するモチベーションが生じます。 そもそもなぜ、形態素解析なんかやるの?っていう動機については、http://qiita.com/Hironsan/items/2466fe0f344115aff177 とかに書かれている通り、(上記の記事では、単語の分割が形態素解析に当たります)、分割された単語をベクトル化したり、各語彙の頻度を調べたりするためです。今回は、MeCabを用いて、できるだけ、精度高く分かち書きできるように頑張ります。1 追記) もう一つのMecabをブーストさせよう(Google Search Console編: https://qiita.com/knknkn1162/items/

    MeCabをブーストさせよう - Qiita
  • 1