タグ

Qiitaと自然言語処理に関するrabbit2goのブックマーク (3)

  • Outlookから日報メールを取得してネガポジ判定をしてみた。 - Qiita

    ■概要 テキストデータのネガポジ判定の手法を学んだので、 試しに昨年新卒入社した時の日報でネガポジ判定を行ってみました。 書いたソースコードの紹介と共に、 「日報の提出時間が遅くなるにつれて、所感部分の文字数が減り、またPN値も下がるのでは」 という疑問を解明して参ります。 ■環境 OS: Windows10 言語: Python 3.10.4 IDE: Visual Studio Code (バージョン 1.69.2) ■分析の流れ 以下の手順で日報データの分析を行いました。 Outlookのフォルダから自分の送った日報のデータを取得、CSVファイルとして保存。 CSVファイルを読み込んで、DataFrameの整形 極性辞書の読み込み、PN値の算出 外れ値の処理 データ可視化1,2 結果と考察 ■ソースコード紹介 では早速、用いたコードを紹介して参ります。 0.モジュール、オブジェクトの

    Outlookから日報メールを取得してネガポジ判定をしてみた。 - Qiita
  • 【Python】自然言語処理でラーメン屋を分類してみる - Qiita

    はじめに こんにちは、コピペデータサイエンティストです。 3年ぐらい前に「ラーメンと自然言語処理」というおちゃらけLTをしたのですが、今見ると恥ずかしいぐらいショボいので、Pythonで作りなおしてみました。 長くなったので3行でまとめると Web上に転がっている口コミとか紹介文を Pythonのライブラリを用いて解析することで 好きなラーメン屋に似たラーメン屋を見つける手法を構築した 方法 統計的潜在意味解析という手法を用います。ざっくり言うと、文書がどんなトピックを持っているか、何に関する文書なのか、を推定してくれるものです。 以下の様なイメージで各トピックに割り振られる割合を算出できるため、以下の例ではAとBが近い、ということを計算することが可能です。 ラーメン屋A: [0.75, 0.15, 0.10] ラーメン屋B: [0.60, 0.15, 0.15] ラーメン屋C: [0.0

    【Python】自然言語処理でラーメン屋を分類してみる - Qiita
  • テキスト前処理と可視化が楽チンな『Texthero』使ってみた - Qiita

    はじめに テキストデータの前処理や可視化を簡単に行うことができるTextheroを使ってみたので、使い方をまとめました。 目次 はじめに 目次 Textheroとは Textheroの使い方 前処理 可視化 データの準備 word cloud 散布図 注釈 参考文献 Textheroとは 「texthero(テキストヒーロー)」とは、テキストデータの前処理やベクトル化、表現および可視化を行うことができるオープンソースのライブラリです。 非常に新しいライブラリで、現在β版としてリリースされています(2021/03/09時点)。 Pythonによる数行の簡単な実装で、様々な自然言語処理のタスクを行うことが可能です。 今回は、使い方を学ぶという目的で、英語を対象にテキスト解析してみます。 ※公式ページによると、今後日語をはじめ多言語に対応予定とのことです。 Textheroの使い方 ※以下、言

    テキスト前処理と可視化が楽チンな『Texthero』使ってみた - Qiita
  • 1