17 oct 2022に出たImagicという技術について、ペーパーとソースを見比べながら説明します。
巷で話題のStable Diffusion(以下SD)をファインチューニングする方法が公開されたので、早速やります。
いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。 ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント
はじめに こんにちは。富士通株式会社ICTシステム研究所のMLPerf HPC五人衆です。先週、国際学会SC’21 において、理化学研究所/富士通が共同で開発した新しいスーパーコンピュータ(スパコン)「富岳」がスパコンランキングで4期連続の4冠(TOP500, HPCG, HPL-AI, Graph500)を獲得しましたが、同会議で発表された、実際のディープラーニング(DL)学習処理に特化したMLPerfTM HPC ベンチマークにおいても世界一を獲得しました。 本ブログでは、このMLPerf HPCの一つのアプリケーションであるCosmoFlowの学習を「富岳」で大規模に行い世界一となった、その挑戦についてお話させてもらいます。 はじめに 背景 MLPerf HPCって何?(白幡) CosmoFlowって何?(田渕) 「富岳」って何?(田渕) プロセッサ 通信ネットワーク ストレージ 準
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
世界で最も客室数が多いホテルはマリオットだが、ヒルトンやインターコンチネンタルといった名だたる大手ホテルを押さえて、世界2位にランクインするホテルブランドが、創業からわずか6年のインド発のスタートアップ「OYO」であることをご存知だろうか。 日本ではヤフーとともに合弁会社を設立し、3月に家具家電付きで、敷金・礼金0円の賃貸アパートサービス「OYO LIFE」を開始したことでも話題になった同社だが、グローバルではホテル運営のユニコーン企業として知られている。 7月18日に都内で開催されたカンファレンス「SoftBank World 2019」の基調講演で登壇した、OYO創業者のリテシュ・アガルワル氏は「あと数カ月で世界一のホテルブランドになる」と自信を見せる。25歳という若さで、いかにして同氏は“ホテル王”へと登りつめたのか。様々なデータによってそれを証明した。 データ分析で物件獲得時間を“
Nintendo Switch 2: Everything we know about the coming release
Google、聴覚障害者向けリアルタイム字幕アプリ「Live Transcribe」と補聴アプリ「Sound Amplifier」 米Googleは2月4日(現地時間)、聴覚障害者向けAndroidアプリ「Live Transcribe」(β)と「Sound Amplifier」を発表した。 Live Transcribeは、ほぼリアルタイムで周囲の音声を自動的に画面に書き起こすアプリ。まだ申し込みが必要なβ版で、今後発売される「Pixel 3」にはプリインストールされる。Sound Amplifierは補聴器のように、ノイズを除去して人の声を聞き取りやすくするアプリだ。こちらもPixel 3にプリインストールされる他、本稿執筆現在、米国版Google Playストアで公開されており、筆者のPixel 3にインストールできた。Live TranscribeはAndroid 5以降、Soun
■AIの動向について 技術の発展について、特にタイミングまでをも正確に予測することは困難です。しかし、技術の発展の大よその方向性を考えるうえで、技術発展のロードマップをみておくことは有益なことだと思います。特に産業革命をも超える農業革命に匹敵するインパクトを人類に与える可能性があるという専門家もいる中でAIの動向は今後の社会環境やビジネス環境がどのように変化していくかの展望を持つためにも有用なのではないでしょか。 下記のイメージ図は、ディープラーニングをベースとしたAIの技術的発展のロードマップを示したものです。繰り返しになりますが、産業化のタイミングはハードウェアや社会制度の整備状況によって、2~3年かそれ以上の誤差が発生するとのことですので、タイミングはあくまでも参考情報に留めておき、AIの発展によりどのように社会が変わっていきそうなのかについて、ざっくりと考えてみたいと思います。 (
どうもあけましておめでとうございます、分散システム界の負け犬こと李徴・ザ・グレートタイガーです。どちらかというといきなり吠えつくよりも山に篭ってこじらせていくタイプです。新春からAWS,サーバレス,コンテナ,マシンラーニング …2017年のクラウドを占う:新春特別企画|gihyo.jp … 技術評論社という記事を目にし、「ウソはいけません」とコメントしたところ何が本当で何がウソか分からなくなってきたので、わたしも2017年のクラウドを占いつつ、件の記事の批評をしてささやかながら新年の書き初めとしたいと思います。 🔥🔥🔥🔥🔥 件の記事ではまず、 そしてこのデジタライゼーションの基盤にあるもっとも重要なテクノロジがクラウドコンピューティングです。 という言葉から理解できないのだが、デジタル化とは何を指すのか?一昔前には「OA化」という言葉が一斉を風靡した。どの企業でも小売なら会計はP
Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。 この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体本文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く