サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Wikipedia
qiita.com/dzbt_dzbt
そうするとローカルに./000879/ディレクトリが作られます。 前処理(テキスト整形+保存) 以下のPythonスクリプトで、ダウンロードしたZIPファイルのまま一括でテキスト整形+前処理をしてTSVで保存します。 処理の概要は以下の通りです。各処理に関してはコメントに記載した通りです。クラス化してもよかったですが、とりあえず関数のみで動かします。 特定ディレクトリ配下のzipファイルを全て探索し、リストに格納 出力ディレクトリ作成 リスト順に1ファイルごとにループ処理(for) ZIP圧縮されたtxtをPandas DataFrameとして読込:save_cleanse_text() 元データをUTF-8に変換してテキストファイル保存 テキスト整形:text_cleanse_df() 2カラム目に作品名を付けて保存 import pandas as pd from pathlib im
このページを最初にブックマークしてみませんか?
『qiita.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く