OpenRefineを使ってデータをきれいにする方法 2020年3月31日 2020年6月24日 The Programming Historian 日本語訳 ソフトウェア, データクレンジング, 中級, 正規表現 dh_portal Seth van Hooland, Ruben Verborgh, Max De Wilde このチュートリアルでは、研究者がどのようにしてデータの正確性を診断し、それに基づいて行動するかに焦点を当てています。 目次 レッスンの目標歴史研究者はなぜデータの質を気にするべきなのかOpenRefineの概要演習の概要: パワーハウスミュージアムはじめに: OpenRefineのインストールとデータのインポートデータを知ろう空白の行を削除重複レコードの削除個別化(Atomization)ファセットとクラスタリング正規表現を利用したアドホックな変換整形済みデータの出