
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Python でテキストデータの会話文を1行に成型する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Python でテキストデータの会話文を1行に成型する - Qiita
テキストデータを自然言語処理する際に、会話文を抽出したかったが、テキストデータにおいて、1行に'「... テキストデータを自然言語処理する際に、会話文を抽出したかったが、テキストデータにおいて、1行に'「」'の対が複数あったり、逆に'「」'の対が複数行にまたがって存在していたりしており、成型がめんどうであった。 「」の対が1要素に収まっているリストを返す関数をメモ代わりに記載する。 # テキストファイルのパス path = 'hogehoge.txt' # 「」の対が1要素に収まっているリストを返す関数 def preprocessing(path): text = [] with open(path, mode='r', encoding='utf-8') as f: for line in f.readlines(): # text の list の要素に'「', '」'がそれぞれ1つ以下になるよう加工する line = line.replace('「','\n「') line = lin