epgrec が内部で使っているepgdumpというプログラムが、なんか引数にontv codeというのをとるので、これはontv japanをスクレイピングしているのかと思っていたが、その割にはtsファイルのパスも必要だしどうなってるんだと思ってよくよくソースを読んでみたら、tsファイルを解析していることがわかった。日本の地上デジタル放送はMPEG-2 TSという形式が採られていて、動画データや音声データのほかに時刻情報やら番組情報やら、いろんなメタデータが付加されている。そこらへんの仕様がデジタル放送に使用する番組配列情報(ARIB STD-B10)というARIBが公開している資料に書かれているということなので、読んでみることにした。 MPEG-2 TSファイルの内容はNHKの資料や朋栄IBEの資料に詳しい。すなわち、TSファイルは188バイトのパケットを1単位として構成されていて、パ