当サイト【スタビジ】の本記事では、昨今のAIの進化のきっかけになっているGPTシリーズについてまとめていきたいと思います。GPT-1から始まりGPT-2、GPT-3、そしてChatGPTであるGPT-3.5、GPT-4と進化してきました。この進化の軌跡と違いについて解説していきます。 こんにちは! データサイエンティストのウマたん(@statistics1012)です! この記事では最近のAIブームの火付け役になったGPTシリーズについて簡単にまとめていきたいと思います。
科学トピック(294) エネルギー・環境2(423) エネルギー・環境1(299) 太陽光発電・風力(149) 安全・事故(246) 地震・自然災害(426) 震災(東北・熊本)(317) 放射線・原発(205) 自動車・交通(510) 医学・薬学(229) 感染症・コロナ(748) 健康・寒暖対策(181) 生物・進化(283) 生命とは何か(78) 物理・天文(163) コンピュータ_04(495) コンピュータ_03(299) コンピュータ_02(296) コンピュータ_01(297) 文字規格(88) 一般(雑学)6(1106) 一般(雑学)5(300) 一般(雑学)4(299) 一般(雑学)3(297) 一般(雑学)2(299) 一般(雑学)1(297) 戦争・軍備(360) 東京五輪・万博(153) 将棋(59) STAP細胞(146) ごみ箱(288) ◆ 少子化:女性の自立
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
1.緒言 低い画質の画像を高画質に変える技術である”超解像”技術のライブラリである"Real-ESRGAN"ライブラリを紹介します。 公式より、Real-ESRGANの使用方法は下記3つがあり、とにかく簡単に試したいならOnline inferenceが便利であり「https://arc.tencent.com/en/ai-demos/imgRestore」からWebアプリベースで実施できます。 【Real-ESRGANの使用方法】 Online inference:Webアプリで簡単に実行できる Portable executable files (NCNN):ー Python script:今回の記事で作成した通りPythonで実行 2.環境構築 基本的な実装方法はGitHubの"Installation"を参照しました。 私のPC環境ではCUDAのメモリに乗らないためGoogle C
ぐああああッッッ!!!悪用対策ッッッ!!!!!!!転載禁止ッッッ!!!自作発言✕ッッッ!!!トレパク✕ッッッ!!!! …………AI学習禁止ッッッ!!??!?(???) ギャァァァァァァァァァァァァめんどくせえ""""ぇぇえええッヅッ!!!!!!!!!!!!!!!!!!""""" pic.twitter.com/82NGOLoRTD — おねね (@OneneChan) August 29, 2022 当たり前ですが、MA_turiの絵は ・無断転載禁止(Do not repost.) ・無断使用禁止(Do not use my works without my permission.) ・トレース禁止(No tracing) ・自作発言禁止 ・AI学習禁止 です。もし見かけましたらそれなりの罰を与えます。 — MA_turi (@MATURIMU66) August 29, 2022 転
クリエイティブ関連のAIサービスを手掛けるラディウス・ファイブ(東京都新宿区)は8月29日、AIイラストメーカー「mimic」(ミミック)β版の提供を開始した。同じイラストレーターが描いた15枚程度のイラストをもとに、絵の個性を反映したイラストを無限に生成できるとうたう。 mimicは、イラスト制作の参考資料やSNS/ファンコミュニティなどへの用途を想定したイラスト生成サービス。ディープラーニングを使い、少ない枚数から特定のイラストレーターの個性を捉えることを実現している。通常、サンプル数が少ないと、テイストが偏ったり、品質が低下するなどの問題が出るものの、学習パラメーターを細かく変更しながら多段的に進行させることで解決した。 学習用のイラストをアップロードすると、約2時間程度でAIイラストメーカーが完成する。最小学習枚数は15枚だが、枚数が多いほど精度は向上する。正面を向いている、ヘルメ
Web3の誇大広告は日本の政界にまで浸透し、大手メディアでは誤った説明が繰り返されている。バブル崩壊以降の30年間を経済停滞の中で過ごし、長期的なビジョンと計画に欠け、短期主義的な右往左往を繰り返してきた日本にとって、Web3への投資は船が再び誤った方向に進んだことのシグナルとなってしまうだろう。 自民党広報本部副本部長の平将明衆議院議員は、4月下旬に公開された暗号通貨メディアCoinDesk JapanのインタビューでWeb3の可能性を高らかに論じている。平議員の活動は今年に入り活発化し、独自のチームによるNFTに関するホワイトペーパーの作成を行い、Web3担当大臣の創設を内閣に要請するまでになった。彼はインタビューの中で「年金積立金管理運用独立行政法人(GPIF)の運用資産の0.5%にあたる1兆円でスタートアップ支援ファンドを作るのもいい」と発言している。 日本は世界第三位の経済規模を
はじめに NFT って何ですか? ブロックチェーン上に記録された一意なトークン識別子をその保有者のアドレスと紐付ける情報、およびそれを状態変数として保持するスマートコントラクトのこと。 以上。 え、それだけ? はい。 「デジタル資産に唯一無二性を付与するインターネット以来の革命」なんじゃないの? これを読んでください: speakerdeck.com なるほど。ところで、この記事は何? いま話題の NFT について、NFT の標準仕様である EIP-721 の仕様書と、それを実装しているスマートコントラクトのソースコードから読み解けることを解説する。一般向けの解説とは異なる視点から光を当てることで、ソフトウェアエンジニアに「あ、NFT って単にそういうことだったのか」と理解してもらえるようにすることを狙っている。 また、NFT がソフトウェアとして具体的にどう実装されているかを知ることは、
「プロフェッショナルIPv6 第2版」を無料配布します。2018年7月にプロフェッショナルIPv6初版を発売&無償配布開始しました(すごいIPv6本を無料配布)。初版発売開始から3年、さらにパワーアップした「プロフェッショナルIPv6 第2版」がついに完成しました! 本書を企画して、少しずつ文章を書き溜めはじめた2011年から10年近くかけて完成した488ページにおよぶ「プロフェッショナルIPv6 第2版」をお楽しみください。 プロフェッショナルIPv6第2版の構成 プロフェッショナルIPv6第2版は5部構成になっています。 第1部は「インターネットとIPv6の概要」というタイトルで、IPv6の視点からインターネット自体の仕組みを復習し、そのうえで、詳細の説明に入る前に把握しておくべきIPv6の概要として、次のような事項を解説しています。 従来のIPv4アドレスとは大きく異なるIPv6アド
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
1.はじめに ディープラーニングを学び始めた方にとって、東京大学/松尾教授の動画を見ることは、とても刺激的で勉強になり面白いものだと思います。今回、松尾教授の講演に加えて対談やパネルディスカッションも含めた動画のリンクをまとめましたので、よろしかったら見て下さい。 おすすめは、01, 05, 14, 16, 23, 27 です。 2.動画リンク 講演には★の表示がしてあります。 □2012年 ★01.Computer will be more clever than human beings 東京大学版TEDです(もちろん日本語です)。ウェブを利用した情報の利用と人工知能の可能性についてコンパクトにまとめています。ディープラーニングには触れていませんが、若々しい松尾教授の姿が見れて、内容も興味深いです。<おすすめです。>(15分) □2013年 02.IT融合シンポジウム ~企業・研究者に
名前:名無しさん投稿日:2018年06月03日 仕事柄調べてて最近すごいなって思ったのはアニメキャラクターの自動生成。 GAN(Generative Adversarial Network)という技術(機械学習の分野)があるんですけど、かなり精度の高いものを生み出す研究が進んでて面白いです。 動画はAI (GAN) × Blockchain × Animeを謳うCrypko社のもの。 pic.twitter.com/OByNmQENR0 — らーく@シノアリス・パワプロ (@lark1115caster) 2018年6月1日 名前:名無しさん投稿日:2018年06月03日 この技術が成長すればアニメーターの負担かなり減るから、その分AIが出来ないクリエイティブな方面(キャラデザとか脚本とか)にお金かけてもらえる 名前:名無しさん投稿日:2018年06月03日 まじでイラストに価値がなくなる
動きのない1枚の人の画像から人体と衣服の3Dモデルを計算し、衣服を3D上で着せ替えることができる技術をノースカロライナ大学チャペルヒル校の研究者らが開発しました。新たなアルゴリズムによって、単に人体の画像に衣服の画像を重ね合わせるだけでなく、服のしわや体形による服の状態変化なども再現されるそうです。 [1608.01250] Detailed Garment Recovery from a Single-View Image https://arxiv.org/abs/1608.01250 衣服着せ替え3Dモデルで何ができるのかは以下のムービーを見れば一発でわかります。 Physics-Inspired Garment Recovery from a Single-View Image 開発された仕組みでは、必要なデータを元にアルゴリズムが計算を行い、最終的な画像をアウトプットする模様。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く