{"name":"hoge","age":30,"city":"tokyo"} {"name":"huga","age":41,"city":"chiba"} {"name":"hige","age":26,"city":"kanagawa"} 世の中的にはfluentdで飛んでくるログフォーマットがjsonだったりとかで、json形式で保存されたデータをHiveで集計したいってニーズは沢山あるみたい。例に漏れず当方もしたいので、やり方を調査。 Hiveではいくつかやり方があるみたいなので、それぞれをまとめてみる。 以降のサンプルはjson_tuple, get_json_objectを使う場合のtableは上記のようなjsonが1行1jsonという体で保存されていることとし、下記のように生成されている事とする。