はじめに 機械学習のシステム化に際して、データの前処理に要する時間やリソースを考慮し、設計に活かすノウハウが求められています。 本投稿では、自然言語を対象としたデータ前処理の概要と、感情極性分析の実装例であるchABSA-datasetにおけるデータ前処理を題材とした性能検証結果を紹介します。 投稿一覧 1. 自然言語処理とその前処理の概要 2. 自然言語処理におけるデータ前処理の性能検証 ... 本投稿 本投稿の目次は以下です。 3. 自然言語処理の前処理に必要となるリソースと処理時間の例 3.1 検証環境 3.2 実験内容 3.2.1 実験の流れ 3.2.2 分かち書きのライブラリ比較 (1) 依存ライブラリ (2) コード内での処理(関数)の呼び出し方 (3) コード内でのI/Oデータ形式 3.3 実験結果 3.4 実験結果の考察 まとめ 3. 自然言語処理の前処理に必要となるリソー