エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
形態素解析を使ってPostgreSQLに保存された文章データから話題を抽出する
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
形態素解析を使ってPostgreSQLに保存された文章データから話題を抽出する
PythonやPL/Python、PostgreSQLを使ってデータ分析をIn-Database処理させるのがマイブームです。 今回は... PythonやPL/Python、PostgreSQLを使ってデータ分析をIn-Database処理させるのがマイブームです。 今回は、データベース内に保存された文章のテキストデータから単語の出現頻度を使って話題になっているトピックを抽出する、という処理を行ってみます。 テキストを形態素解析する 形態素解析した結果をJSONBで取得する JSONBデータを対象に集計処理を行う 上記すべてをサーバサイドで実行する といったことをPostgreSQLを使って処理してみます。 ■データの準備 今回も東京カレンダーの「東京女子図鑑」からの文章をサンプルとして使ってみます。 31歳女性がするべき、銀座での“上質な”暮らし。大人の女の流儀とは?(1/2)[東京カレンダー] https://tokyo-calendar.jp/article/4640 今回は、docidという主キーとテキストを値としてd