Tweet アップルのSiriにも組み込まれてる音楽検索システムShazam、とても優秀ですよね。 Shazamなどがやってる仕事は一般的にAudio fingerprintingと呼ばれてます。強いノイズやダウンサンプリング、クエリ音声の短さ、膨大なデータベースに対する検索スピードの要求等、高いハードルを克服して楽曲をズバリ特定することが求められ、とても困難そうに見えますが、現在すでに業務レベルのパフォーマンスに達しているのは驚くべきことです。 もちろんShazamの完全な技術が公開されてるわけないですが、Shazamの基本技術となるLandmark-based fingerprintingを実装したシステムはgithubで公開されてます。 https://github.com/dpwe/audfprint 元論文はこれ A. Wang, An Industrial-Strength A