Colab notebooks for various tasks in NLP
2023/03/20 追記 Studio Ousia様によるLUKEモデルをベースに学習したSentence-LUKEモデルを公開しました。 Sentence-LUKEモデル: https://huggingface.co/sonoisa/sentence-luke-japanese-base-lite 手元の非公開データセットでは、日本語Sentence-BERTモデル(バージョン2)と比べて定量的な精度が同等〜0.5pt程度高く、定性的な精度は本モデルの方が高い結果でした。 2021/12/14 追記 MultipleNegativesRankingLossを用いて学習した改良版モデルを公開しました。 改良版(バージョン2)のモデル: https://huggingface.co/sonoisa/sentence-bert-base-ja-mean-tokens-v2 手元の非公開デー
会社で機械学習の勉強会をしていたときに感情分析の話が挙がったので、Twitterランドの住人の感情を分析しました。 お品書き やったこと Twitterの発言を大量に感情分析し、Twitter民の普遍的な感情を調べた 手順 大量のツイートを取得 各ツイートの感情を分析し、最大スコアの感情のみ抽出 happy:スコア10、sad:スコア10、disgust:スコア9ならhappyとsadのみ抽出 抽出した感情をカウント どの感情がもっとも多いかを調べる 感情分析をするために sentiment_ja を使用 Twitterの発言を取得するために twitterscraper を使用 感情は6分類 (ポール・エクマンの 表情の分類 に準拠) happy(幸福感) sad(悲しみ) disgust(嫌悪) angry(怒り) fear(恐れ) surprise(驚き) 計測期間は 2019-01
はじめに 自然言語処理技術が口コミ等の解析に活用されるケースが一般的になりつつありますが、「感情分析」に関して日本語言語処理に関する具体的な手法を解説しているサイトは本記事を執筆した時点とても少ない印象です。 qiita内でも感情辞書を使って単語レベルで判断する記事は見かけますが、もう一歩踏み込んだガチな感情分析をやっているケースはありませんでした。 上記のような状況のため私自身論文を漁ったりしながら手探りで進めた結果、非常に苦労しましたので、自分なりに感情分析のやり方を備忘録としてまとめました。 至らない点も多々あるかと思いますので、コメントにてご指摘いただけますと幸いです。 【2021.1111追記】 本記事の感情分析コードを希望される方は個別にご連絡ください。 記事内やgit等では公開はしておりません。 【2021.0909追記】 手っ取り早く感情分析にチャレンジしたい方はこちらの記
佐藤 元紀 (株式会社Preferred Networks) はじめに ニューラルネットワークは、時として僅かな入力の違いによって大きく異なる挙動になることが知られています。 図1 画像分野におけるAdversarial Example の(出典 : [Goodfellow et al.]より抜粋) 有名な例に [Goodfellow et al.] の図1があります。 左側の画像 x に対して、微小なノイズ(Adversarial Perturbation; 敵対的摂動)を足し合わせた結果が、右側の画像になっています。 左側の画像をCNNによる画像認識器に入力した時には正しく「パンダ (“panda”)」と予測されるものの、右側の画像を入力すると「テナガザル (“gibbon”)」と予測されています。 同じ見た目の画像にもかかわらず、ニューラルネットワークが誤認識するこのような事例は A
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く