Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OSの実行形式バイナリなどの種類を瞬時に判別してくれます。 下記はコマンドラインとしてMagikaを実行した例で、フォルダ内のファイルの種類を出力しています。 特別に最適化された1MBのモデルでを用いて推論を実行 Magikaはファイルの判別に、Kerasを用いて特別に最適化されたディープラーニングによる、わずか1MBのモデルを用いていると説明されています。 このモデルは推論エンジンのOnnx上で実行されています。実行速度はGPUを用いずCPU上で処理されたとしても数
![Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開](https://cdn-ak-scissors.b.st-hatena.com/image/square/accb9599803e9ccc1c356ba5a1ba05ee4bdc4a93/height=288;version=1;width=512/https%3A%2F%2Fwww.publickey1.jp%2F2024%2Fgoogle_magika01.png)