妻に「レタスを買ってきて」と頼まれてキャベツを買って帰って怒られることが頻繁にあったのでこの問題を何とか解決できないか考えていました。 そこで調べてみると、Appleが公式に交付している機械学習モデルにResnet50というものがあり、 説明:木、動物、食べ物、乗り物、人など、1000のカテゴリのセットから画像に存在する主要なオブジェクトを検出します。 この機械学習モデルを使って、レタスとキャベツの区別が出来れば今後妻に怒られることはないかもしれないと思い、一筋の希望を抱いてカメラ撮影を行い、そのフレーム内の画像を分類し表示するアプリを作ってみる事にしました。 作ったもの 環境 Xcode 12.5 Swift 5.4 処理の流れ ざっとの説明になりますが、 カメラでビデオ撮影 ビデオ撮影したものからフレームをキャプチャし、イメージを切り出す 切り出したイメージから機械学習モデルを使用し、
![【Swift】簡単なリアルタイムに画像を分類するアプリを作ってみた | DevelopersIO](https://cdn-ak-scissors.b.st-hatena.com/image/square/2b7903e8b10f20c6bb7794875fd2f7aa53db7f05/height=288;version=1;width=512/https%3A%2F%2Fdevio2023-media.developers.io%2Fwp-content%2Fuploads%2F2021%2F07%2Feyecatch-imageclassification.jpg)