タグ

deeplearningとライブラリに関するslay-tのブックマーク (3)

  • pytorch+yolov3を使ってマリオを物体検出してみた - Qiita

    Background [OpenCV][C++]テンプレートマッチングを使って複数検出してみた、ではOpenCVTemplateMatchingを使ってクリボーを検出していました。用意したクリボーの画像を上から下へ走査して形状が類似しているエリアを算出するのですが、上部の雲がクリボーと似ているらしくて雲とクリボーが一緒に出てくると雲の方が先に検出がかかってしまいました。 大雑把に類似度の高いエリアをトリミングして、その後でテンプレート画像とヒストグラムか背景差分を使って判定はできそうなのですが、今回は趣向を変えてyolov3を使った物体検出をしてみます。 Device CPU AMD Ryzan 5 1400 GPU GeForce GTX960 Mother Board MSI B450 GAMING PLUS MAX B450 Memory DDR4 8G × 4枚 = 32G CU

    pytorch+yolov3を使ってマリオを物体検出してみた - Qiita
  • リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました

    はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS(オープンソースソフトウェア)として公開しました。 ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。 好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。 それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。 そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。 声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。 既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。 一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま

  • ディープラーニング用周辺ツールの充実にも注目

    前編(Computer Weekly日語版 1月9日号掲載)では、GoogleMicrosoft、Facebookが提供しているディープラーニングフレームワークを紹介した。 後編では、その他のツールセットおよびディープラーニング関連ツール一覧を紹介する。 その他注目のツールセット 多数ある他の主要ライブラリとツールセットにも触れておかなければならない。「Caffe」はディープラーニング用オープンソースのフレームワークで、「畳み込みニューラルネットワーク」(CNN)の構築に使える。CNNは画像分類に使うのが一般的だ。Caffeは多種多様なソフトウェアアーキテクチャをサポートするため、一部の開発者に非常に人気がある。 「Deeplearning4j」はJava仮想マシン(JVM)用のオープンソース分散ディープラーニングライブラリだ。Python開発者には機械学習フレームワーク「scikit

    ディープラーニング用周辺ツールの充実にも注目
  • 1