タグ

2017年1月4日のブックマーク (2件)

  • 100 Must-Read NLP Papers

    100 Must-Read NLP Papers This is a list of 100 important natural language processing (NLP) papers that serious students and researchers working in the field should probably know about and read. View on GitHub 100 Must-Read NLP Papers This is a list of 100 important natural language processing (NLP) papers that serious students and researchers working in the field should probably know about and rea

  • MUFG の渋い支払明細 CSV をまともにする - Nekostack

    1. はじめにMUFG のカードの支払明細は CSV で取得できるのだが, あまり処理しやすいデータとはいえない. 通常払いご利用合計のような値だけがある行が突然出現する.備考欄が分割払いの詳細欄を兼ねている.分割払いについては備考の列に, 今回支払分・支払総額・手数料・支払残高がまとめて記録されている.一部の金額の値が全角で記録されている.上のようなフォーマットになっているので, 今月の支払いの内訳だけを眺めづらい. 2. 加工してまともにするスクリプトを書いた. scripts/sanitize_mufg_json.py · mitsuse/scripts やってることは, 以下の通り. 通常・分割の情報を各支払に明示的に持たせる.利用店舗名欄・備考欄の文字列内部の数値・空白を半角英数変換支払項目を表現してない行は取り除く.分割の今回支払分を抽出,「利用金額」とするCSV は個人的に嫌

    mitsuse
    mitsuse 2017/01/04
    家計にまつわる雑務情報です