タグ

勉強とシステムに関するtyosuke2011のブックマーク (4)

  • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

    誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
  • [4]Apache Spark/MLlibの歴史と特徴を学ぶ

    オープンソースフレームワークであるApache Spark、およびそのエコシステム(周辺ソフトウエア)であるMLlibを活用することで、高速かつ柔軟な機械学習処理を実現できる。稿では、Apache Sparkを用いた機械学習の特徴や歴史を紹介する。 Apache Sparkとは? 稿では、「ポストHadoop」の最右翼と言われているApache Sparkのエコシステムである、MLlibライブラリを用いた機械学習システムについて説明する。 オープンソースソフトウエアであるApache Sparkは、2014年2月にApacheのトップレベルプロジェクトに昇格したほか、ビッグデータ分野のリーディングカンパニーである米クラウデラがサポートを行うなど、安定的な発展が見込まれている。 Apache SparkはHadoopと同じく、計算処理を分散環境で並列実行するための基盤である。RDD(Re

    [4]Apache Spark/MLlibの歴史と特徴を学ぶ
  • 統計学入門

    さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その質が十分理解されているとはいい難いのが現状ではないでしょうか? 研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。 有意確率(p値)と「有意差あり」の意味 標準偏差(SD)と標準誤差(SE)の使い分け 多重比較の使用方法 これらは全て非常に初歩的かつ基的なことです。

  • もらえる経験値を最大化する「正しい努力」のまとめ - teruyastarはかく語りき

    人生は練習と思ってる所が番で、番と思ってる所はオマケだ。 http://d.hatena.ne.jp/teruyastar/20131207/1386476138 年末の記事に反響があったのですが、 「ずっと番って、その努力ほんとに報われるのか?」 という意見をもらいました。 あと関連で、 「基礎が大事」という当の意味を理解しているか? http://d.hatena.ne.jp/teruyastar/20110208/1297157480 「基礎を無意識のゼロに限りなく近づけるのが守破離の守、 といっても、いつになったら破・離へ移行するの?」 みたいな意見も。 なるほど、、基礎や準備こそ大事ではあるのですが、 これは確かにやみくもな努力へのミスリードに見えるかもしれません。 そうならないよう「正しい努力の仕方」を示す記事 をまとめてみました。 前提・7つの習慣における「第2領域」

    もらえる経験値を最大化する「正しい努力」のまとめ - teruyastarはかく語りき
  • 1