[B! DeepLearning] tkmcのブックマーク

強化学習 - 2020論文までの道のり(Q学習中心～R2D3, Agent57) - Qiita

強化学習の基礎から最近の論文までの道のりを繫ぎたいというモチベーションで，最初は強化学習の基礎の基礎の解説から，Q学習についてR2D3, Agent57あたりまで読んだ論文についてまとめてみました．Actor-Criticについては，Q学習との比較用にA3Cあたりを少しだけ書いています．あと，最後に軽くマルチエージェント強化学習(MARL)とオフライン強化学習(Offline RL)にも触れて紹介しています．基礎の基礎強化学習とは？教師あり学習，教師無し学習に並ぶ，機械学習の一分野．端的に言うと，エージェントと呼ばれる行動主体が，ある環境のなかで得られる報酬を最大化する最適化問題．ただし，報酬を得るためにどうしたらよいかというのは非自明な場合が多く，また，報酬のみではスパースで扱いにくいので，途中の過程ででてくる状態や，エージェントの行動に価値を付与し，その価値を最大化する問題に

tkmc 2021/05/26

リンク

2021年最強になるか！？最新の画像認識モデルEfficientNetV2を解説 - Qiita

その他層の数も探索空間に入れています。ここで拡張率とは、MBConvの最初のConvでチャネル数を何倍にするかの係数のことで、こちらでより詳しく解説しています。探索は精度$A$、ステップごとの学習時間$S$、パラメータサイズ$P$を用いて、$A\cdot S^w\cdot P^v$を最大化するように行われます。ここで$w=-0.07, v=-0.05$であり、これらの値は実験的に決定されています。 1.3.2 EfficientNetV2のアーキテクチャ下表がEfficientNetV2のSサイズのモデルになります。画像: "EfficientNetV2: Smaller Models and Faster Training", Tan, M., Le, Q., (2021) 比較のためにEfficientNet-B0(i.e. V1)のアーキテクチャも下に載せます。画像: "Ef

tkmc 2021/05/25

リンク

19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界｜DTMステーション

4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO（コエ・フォント・スタジオ）は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

tkmc 2021/05/08

リンク

ピアノの演奏動画から楽譜を自動作成　ディープラーニングで　京大が技術開発

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。京都大学の研究チームが開発した「Non-Local Musical Statistics as Guides for Audio-to-Score Piano Transcription」は、Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習（ディープラーニング）を用いた自動変換システムだ。システムは、3段階で構成される。1段階目は、入力された動画の音の信号に対してMIDIシーケンスを深層学習ネットワークで推定（Multipitch detection）する。ピッチ解析用とベロシティ推定用のネットワークを別々で学習し、その出力を組み合わせてMIDIシーケンスを合成する。2段

tkmc 2021/03/17

リンク

深層強化学習でAIマリオのクリアにチャレンジしてみた - Qiita

追記：マリオの全ステージクリアを目指します！(2021/12/30) 深層強化学習で学習したAIマリオで全ステージクリアを目指すプロジェクトをGitHub Pagesで立ち上げました！参加者募集中です！詳細は以下参照ください深層強化学習のPyTorchチュートリアルが日本語訳されて…ない！ PyTorch勉強中の人にとって助けになるのが公式のチュートリアルです。そんな公式チュートリアル @sugulu_Ogawa_ISID さんが日本語訳して公開してくださっています。今、深層強化学習に興味津々丸なので、早速確認してみました。すると… ない！ PyTorchのチュートリアル、マリオをプレイするものあって、めっちゃ面白そうなんですよね。というわけで、訳される前のPyTorchの深層強化学習のマリオチュートリアルをやってみました。ちなみに、PyTorchチュートリアル（日本語翻訳版）の

tkmc 2020/12/25

リンク

Neural EngineでCore MLの処理が行われているか調べる方法 - Qiita

Neural Engine（ニューラルエンジン）は、ニューラルネットワークの推論演算に特化した機構を持つことで、GPUよりもさらに高速な処理と消費電力の低下を両立するプロセッサ。A11 Bionicは毎秒6000億回、A12 Bionicではなんと毎秒5兆回の演算が可能とされている。いうまでもなくCore MLのポテンシャルを最大限引き出す鍵となるのがこのNeural Engineなのだが、実はNeural Engineを制御するフレームワークやAPIは存在せず1、Appleは開発者向けの情報もほとんど何も出してない。残念ながら先のWWDC 2020でもその状況はあまり変わらなかった。そんな中、書籍「Core ML Survival Guide」やOSS「CoreMLHelpers」でCore ML界隈で知らない人はいないMatthijs Hollemans氏が、GitHubでNeu

tkmc 2020/11/20

リンク

「生成Deep Learning」は久しぶりにワクワクするAI関係の本だった - karaage. [からあげ]

「生成Deep Learning」を読みました生成に特化したAIの本「生成Deep Learning」を読みました。生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする作者:David Foster発売日: 2020/10/05メディア: 単行本（ソフトカバー）独創力とは、思慮深い模倣以外の何ものでもないとは18世紀フランスの哲学者ヴォルテールの言葉とのことですが、AIによる模倣と創造の境界に関して考えさせられるような本でした。本の内容は、オートエンコーダからはじまりGANでの画像生成、文章生成、音楽生成。アテンション、強化学習の世界モデルまでとタイトル通り生成系のAI 技術を幅広くカバーしています。結構骨太で、AIの本は1冊目という人が読む本ではなくて、何冊かAI関係の書籍を読んで、ある程度自分で実践して、生成系のAI（Auto Encoderと

tkmc 2020/11/16

リンク

なぜGoogle Meetの背景ぼかしが最強なのか（一般公開版）

はじめに最近ついに、Google Meet に背景ぼかし機能が利用可能になりましたよね。日本語だとインプレスのケータイ Watchの記事などで紹介されてます。確か 2020 年 9 月末前後で順次リリースされていたと記憶しています。このときは「背景ぼかし」の機能しかなかったのですが、最近（私が気づいたのは 2020/10/30）更にアップデートされました。アップデートで「背景差し替え」機能が付いて、ぼかし機能もぼかし効果が強弱 2 つから選べるようになりました。まだ日本語のニュース記事は見てないですが、Googleによるアップデートの発表はちゃんとされています。そして、Google AI Blog でBackground Features in Google Meet, Powered by Web MLという記事が公開され、実装についての解説がされました。この記事はその解説記事を

tkmc 2020/11/01

リンク

誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。概要 Dwango Media Villageの廣芝です。誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。声の変換技術には、リアルタイム性と品質のトレードオフがあります。既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。品質を優先した声変換

tkmc 2020/09/15

リンク

https://scratch.mit.edu/projects/364481440

tkmc 2020/07/29

リンク

ディープラーニングさえあれば、競馬で回収率100%を超えられる - Qiita

pohotos by Ronnie Macdonald **「AIが人間の仕事を奪う」と言われ始めてしばらく経ちますが、今や「幻滅期に入った」**なんて言われ方もしています。おかげで僕は仕事を奪われることもなく、毎日満員電車に揺られています。奪う奪う詐欺もいいとこです。そんなAIの発展にはもう少し時間がかかりそうな一方で、学べる環境は簡単に手に入るようになりました。触るなら、皆が幻滅しかかっている今な気もします。ということで、今更ですがAIの力を知るべく、ディープラーニングに触れてみることにしました。いろいろ試したのですが、ここでは結果をメインに**「無知の状態から勉強しても、ディープラーニングでこれぐらいは楽しめるよ」**ということを伝えてみます。プログラムはお手本になるようなものではないので、見たい人だけに有料で公開してみます。 Kaggleでディープラーニングのお手並み拝見最初

tkmc 2020/07/14

リンク

Core MLとNeural Engineで自転車を探す

iOSの機械学習フレームワークCore MLと最近のiPhoneなどに備わるAIプロセッサNeural Engineを用いて映画から自転車を探したところ、驚くような結果を得た。プログラミング・コードを簡潔に記述できるとともに、その処理速度が随分と速い。これが毎日使う小さなiPhoneで行えるのだから、唖然としてしまう。Neural EngineはFace IDだけでなく、汎用的なAI処理に活用できるわけだ。これまでの自転車探索、正確にはオブジェクト検出はディープ・ラーニングのKeras-Yolo3を用いてきた。これをMacで実行すると恐ろしく時間がかかり、2時間の映画なら2〜3日はマシンを占有してしまう。神谷典孝が示したようにGPUを活用すれば実用的な速度となり、2〜3時間で処理が完了する。ただし、GPUはタワー型の大型PCを必要とし、随分と高価であり、消費電力が馬鹿にならないほど大き

tkmc 2020/04/08

リンク

Daisuke Okanohara on Twitter: "NeRFは座標と視点方向角を与えるとそこに物体が存在する確率と輝度を返すMLPを複数の位置視点付き画像から学習し、複雑なシーンの写実的な画像を任意の視点から生成できる。画像生成、空間表現でDCGANやGQN登場時並のインパクトがあ… https://t.co/1KC8jsny8Y"

tkmc 2020/03/21

リンク

ノンプログラマ＆文系&python初学者の効果的なAI/機械学習の学び方｜ぱいじー＠世界にデザインAIを！😎

どーも。ぱいじーです。今回は「ノンプログラマで文系のpython初学者の方がどうすれば効果的にAIや機械学習を学べるのか」について。2年程度で初心者が中級者手前くらいまで行くには、に絞って説明します。偉そうに言ってますが私も始めてまだ2年。しかも、スタート当時50才という初老。全くの初心者でしかも脳細胞劣化速度が著しく速いジジイが「日経Tech 特別賞」を受賞するまでの実力には達したので偉そうにさせてくださいな。 ※読了約5分まず、初めにどんな人が読むと良いか、ぱいじーのスペック（どーせ最初からできたんでしょ、を払拭します）、私の考える習熟度＝スキルレベルから。 0.ターゲットこんな人が読むと参考になるかなー、と思います。 ①　コードを見たことはあるけど実装経験のないノンプログラマ ②　pythonをやったことがない ③　機械学習やAIに興味がある ④　文系出身（理系の方もほか3点満

tkmc 2020/02/20

リンク

深層学習による非滑らかな関数の推定

3. 概要 Statistical Estimation for Non-Smooth Functions by Deep Neural Networks 今泉允聡（統計数理研究所）トピック深層学習（多層ニューラルネットワーク；DNN）目的 DNNが他手法より高い性能を発揮する原因を究明する・回帰（教師有り学習）の一手法・他手法より高い性能を発揮他手法：カーネル法・シリーズ法など...カーネル法・フーリエ法など 4. 概要 Statistical Estimation for Non-Smooth Functions by Deep Neural Networks 他手法の性能 << DNNの性能主張推定対象の関数がある非滑らかな性質を持つときアプローチ回帰関数の推定の理論解析関数の推定問題 Yi = f⇤ (Xi) + ✏i 未知関数を n 個の観測か

tkmc 2020/01/02

リンク

株AIを結構頑張ったら、儲かりそうな雰囲気が出ている - Qiita

ABEJA Advent Calendarの10日目です。はじめにのはじめに以下は、あくまでテストデータで上手く行ってるよという話で、本当にこれをやったら儲かるかというと、まだまだわかりませんのであしからず！あとネタがネタだけに、今回のはあくまで個人のやってみた記録であり、組織の取り組みとは関係ありません。はじめにお金が欲しい！無限に寿司が食いたい！株で儲けたい！研究やエンジニアリングをしながら生きてく上で、将来のキャリアや技術スタックについて日々考えてるんですが、よくよく原点に立ち返るとそもそも技術スタックとかどうでもよくて、好きなものを作って漫画読んで生きていきたいんです。つまり結局、世の中は金なんですよね金。なので、何とかして寝てても圧倒的に儲かる仕組みを作りたい！そんな気持ちで私利私欲のために機械学習を使ったという記録です。以下は、今回紹介する方法で実験したテストデータ

tkmc 2019/12/26

リンク

史上初めてAI開発契約の効力が争われた（模擬）裁判で裁判官を務めた話｜知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

■　はじめにユーザーが保有しているデータをAIベンダに提供し、AIベンダの技術力・ノウハウを利用して学習済みモデルを生成してユーザに納品するというAI開発は現在盛んに行われています。当事務所でもAI開発案件を多数法務サポートしておりますが、私の知る限り、AI開発のトラブルが裁判まで発展したケースはありませんでした。今回は、おそらく史上初めてAI開発契約の効力が争われた裁判をご紹介したいと思います。といっても、２０１９年１０月２８日に東京弁護士会主催で行われたAIシンポジウムの企画の一環として行われた模擬裁判のお話です。もちろん、弁護士会が主催する以上、模擬裁判と言ってもお遊びではありません。裁判長役には知財の世界では知らない者のいない超ビッグネーム三村量一先生を迎え、テーマは、「AI開発契約であるにもかかわらず、従前のシステム開発の契約書を利用して契約を締結した場合、どのような

tkmc 2019/11/04

リンク

リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました

はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS（オープンソースソフトウェア）として公開しました。ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま

tkmc 2019/09/28

リンク

高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉

こんにちは、あんどう（@t_andou）です。最近、自然言語処理のAIの一種であるBERTをよく触っています。今回はBERTのソースを読まなくてもサクッと試せる環境を用意しましたので、メモとして残しておきます。 BERTとはどういうものか画像引用：https://arxiv.org/pdf/1810.04805.pdf 凄くざっくりと説明すると、BERTとは2018年末にGoogleの人たちが開発した自然言語処理において汎用的に使えて精度の良いAIです。自然言語処理において精度を測るためにいくつかのタスクがあるのですが、発表された時点ではダントツの成績でした。仕組みなどの詳細については論文を読むか解説記事をググってください。 2019/09/22時点で既により精度の良い手法がどんどん発表されていますが、BERTの情報量と比べるとまだ少ないため、入門としてはBERTを触ってみるのが

tkmc 2019/09/22

リンク

【まとめ】ディープラーニングを使った異常検知 - Qiita

ディープラーニングを使った異常検知が進歩していますが、最新情報を追うのが大変です。ここでは、最新情報をまとめておきます（随時更新）。本稿では、以下の内容を記します。ディープラーニングを使った異常検知について、簡単に歴史をまとめます。最新の手法（2019年当時）について、ベンチマークを行います。歴史完全に独断と偏見で作った歴史です。全ての論文は読めていないので、ご了承ください。【～2017年】オートエンコーダによる異常検知オートエンコーダによる異常検知 2、3年前はオートエンコーダによる異常検知が主流でした。オートエンコーダでは、元画像と再構築画像との差をとって、その和が大きいとき異常と認識させています。Qiitaの記事でも、オートエンコーダによる異常検知はたくさんありますので、気になる人は探してみてください。 Variational AutoEocoder（VAE）による

tkmc 2019/08/06

DeepLearning

リンク

はてなブックマーク

タグ

関連タグで絞り込む (70)

DeepLearningに関するtkmcのブックマーク (321)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス