[B! Qiita][自然言語処理] rabbit2goのブックマーク

rabbit2go id:rabbit2go

Qiitaと自然言語処理に関するrabbit2goのブックマーク (3)

Outlookから日報メールを取得してネガポジ判定をしてみた。 - Qiita
■概要テキストデータのネガポジ判定の手法を学んだので、試しに昨年新卒入社した時の日報でネガポジ判定を行ってみました。書いたソースコードの紹介と共に、「日報の提出時間が遅くなるにつれて、所感部分の文字数が減り、またPN値も下がるのでは」という疑問を解明して参ります。 ■環境 OS: Windows10 言語: Python 3.10.4 IDE: Visual Studio Code (バージョン 1.69.2) ■分析の流れ以下の手順で日報データの分析を行いました。 Outlookのフォルダから自分の送った日報のデータを取得、CSVファイルとして保存。 CSVファイルを読み込んで、DataFrameの整形極性辞書の読み込み、PN値の算出外れ値の処理データ可視化1,2 結果と考察 ■ソースコード紹介では早速、用いたコードを紹介して参ります。 0.モジュール、オブジェクトの
rabbit2go 2022/08/11
Python

Outlook

メール

Qiita

自然言語処理
リンク
【Python】自然言語処理でラーメン屋を分類してみる - Qiita
はじめにこんにちは、コピペデータサイエンティストです。 3年ぐらい前に「ラーメンと自然言語処理」というおちゃらけLTをしたのですが、今見ると恥ずかしいぐらいショボいので、Pythonで作りなおしてみました。長くなったので3行でまとめると Web上に転がっている口コミとか紹介文を Pythonのライブラリを用いて解析することで好きなラーメン屋に似たラーメン屋を見つける手法を構築した方法統計的潜在意味解析という手法を用います。ざっくり言うと、文書がどんなトピックを持っているか、何に関する文書なのか、を推定してくれるものです。以下の様なイメージで各トピックに割り振られる割合を算出できるため、以下の例ではAとBが近い、ということを計算することが可能です。ラーメン屋A： [0.75, 0.15, 0.10] ラーメン屋B： [0.60, 0.15, 0.15] ラーメン屋C： [0.0
rabbit2go 2021/04/04
自然言語処理

機械学習

Qiita
リンク
テキスト前処理と可視化が楽チンな『Texthero』使ってみた - Qiita
はじめにテキストデータの前処理や可視化を簡単に行うことができるTextheroを使ってみたので、使い方をまとめました。目次はじめに目次 Textheroとは Textheroの使い方前処理可視化データの準備 word cloud 散布図注釈参考文献 Textheroとは「texthero（テキストヒーロー）」とは、テキストデータの前処理やベクトル化、表現および可視化を行うことができるオープンソースのライブラリです。非常に新しいライブラリで、現在β版としてリリースされています（2021/03/09時点）。 Pythonによる数行の簡単な実装で、様々な自然言語処理のタスクを行うことが可能です。今回は、使い方を学ぶという目的で、英語を対象にテキスト解析してみます。 ※公式ページによると、今後日本語をはじめ多言語に対応予定とのことです。 Textheroの使い方 ※以下、言
rabbit2go 2021/03/13
Python

Qiita

自然言語処理

Texthero
リンク
1