エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Rで日本語の単語分散表現を使ったテキスト分類をやる
この記事でやること Emil Hvitfeldt氏によるTextrecipes series: Pretrained Word Embeddingを参考に、... この記事でやること Emil Hvitfeldt氏によるTextrecipes series: Pretrained Word Embeddingを参考に、日本語テキストについて単語分散表現を用いながら2値の分類問題を解きます。 単語分散表現は、chiVeのA単位語のみについて学習した資源のひとつであるchive-1.1-mc5-aunit.magnitudeを利用します。 データセットとしては、JRTEコーパスのrhr.tsvというデータを使います。これは、「また是非利用したいと思いました。」「近くにコンビニもあります。」といったようなごく短いテキスト列に対して、ホテルについての評判であるかどうかのラベルが付与されているデータです。 準備 JRTEコーパスは、ldccrで読み込むことができます。 rhr <- ldccr::read_jrte(keep_rhr = TRUE) #> Pa



2024/06/19 リンク