ブックマーク / qiita.com/n_uchida (3)

  • 【転職会議】クチコミをword2vecで自然言語処理して会社を分類してみる - Qiita

    はじめに LivesenseAdventCalendar 2016 の20日目を担当する @naotaka1128 です。 現在、転職会議という転職クチコミサービスのデータアナリストを担当しております。 転職会議は会社のクチコミが数百万件集まっている日最大級の転職クチコミサービスです。現状はクチコミや評点を表示しているだけなのですが、今後はクチコミを自然言語処理などで分析して今までは手に入らなかったような有益な情報を世の中に提供していきたいと思っております。 今回はその取っ掛かりとして word2vec および doc2vec という自然言語処理の技術を用いてクチコミを分析し、会社の分類などを行ってみようと思います。 使用する自然言語処理技術 昨今、word2vecという自然言語処理の技術が話題です。ご存じの方も多いかと思いますが、大量の文章をもちいて単語をベクトル表現で数値化し、以下の

    【転職会議】クチコミをword2vecで自然言語処理して会社を分類してみる - Qiita
    masa-wo
    masa-wo 2016/12/21
  • 【Python】自然言語処理でラーメン屋を分類してみる - Qiita

    はじめに こんにちは、コピペデータサイエンティストです。 3年ぐらい前に「ラーメンと自然言語処理」というおちゃらけLTをしたのですが、今見ると恥ずかしいぐらいショボいので、Pythonで作りなおしてみました。 長くなったので3行でまとめると Web上に転がっている口コミとか紹介文を Pythonのライブラリを用いて解析することで 好きなラーメン屋に似たラーメン屋を見つける手法を構築した 方法 統計的潜在意味解析という手法を用います。ざっくり言うと、文書がどんなトピックを持っているか、何に関する文書なのか、を推定してくれるものです。 以下の様なイメージで各トピックに割り振られる割合を算出できるため、以下の例ではAとBが近い、ということを計算することが可能です。 ラーメン屋A: [0.75, 0.15, 0.10] ラーメン屋B: [0.60, 0.15, 0.15] ラーメン屋C: [0.0

    【Python】自然言語処理でラーメン屋を分類してみる - Qiita
    masa-wo
    masa-wo 2016/07/24
  • 新米エンジニアが月300万PVのサイトを作った時に役立ったGem20選(+SEOの小技) - Qiita

    はじめに 皆様こんにちは。@naotaka1128と申します。 データサイエンティスト(?)としてWEB広告のアトリビューション分析などを担当してます。 リブセンスでは今までSEO担当/WEBマーケター/WEBディレクターもしてました。 え?なにやってる奴かよくわかんない? 僕も正直わかんないです。 そんな僕ですが、個人の趣味Ruby on Rails 勉強してサイト作ってます。 個人サイトのアクセス伸ばすのが最近の密かなマイブーム(死語)です。 ますます意味わかんないですね。 プロエンジニアの皆様の足元にも及ばない新米素人エンジニア(?)なので、 サイト制作は全面的にライブラリに頼りっぱなしです。 初めてサイト制作した時は「サイト制作に必要な Gem まとめ」とかなくて ググりまくりながら作ったものです。凄く時間が掛かったのを今でも覚えてます。 (その分、新しい発見をするたびに嬉しか

    新米エンジニアが月300万PVのサイトを作った時に役立ったGem20選(+SEOの小技) - Qiita
    masa-wo
    masa-wo 2015/12/12
  • 1