並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 2100件

新着順 人気順

ディープラーニングの検索結果81 - 120 件 / 2100件

  • グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表

    グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。 競合モデルと同クオリティかつ超高速化 近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。

      グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表
    • AI の次の重要な一歩

      AI は、Google が現在取り組んでいる中で最も本質的なテクノロジーです。AI は、医師による病気の早期発見の支援や、自国語での情報へのアクセスなど、人々、ビジネス、コミュニティの潜在能力を引き出します。そして、数十億人の生活を大きく改善できる新しい機会を提供します。6 年前から、私たちが Google の方向性を AI 中心に再編し「世界中の情報を整理し、世界中の人がアクセスできて使えるようにする」という Google のミッションを果たす最も重要な方法に AI を据えているのは、これが理由です。 以来、私たちは全面的に AI への投資を継続し、Google AI と DeepMind のチームは最先端のテクノロジーを進化させています。現在、AI の計算規模は半年ごとに倍増していますが、それはムーアの法則よりもはるかに早いペースです。同時に、高度なジェネラティブ AI と大規模言語モ

        AI の次の重要な一歩
      • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション

        4月23日、彗星のように現れたネット上のサービス、CoeFont STUDIO(コエ・フォント・スタジオ)は、誰でも無料で使える音声合成サービスということで、瞬く間に広がり、2日で累計ユーザー数が6万人を突破。すでに20万人を超えるところまで来ているようです。日本語でテキストを入力すれば、非常に滑らかな声でしゃべってくれ、その音声をユーザーは商用を含めて自由に利用できるという画期的ともいえるサービスとなっているのです。 このサービスを立ち上げたのは、なんと東京工業大学2年生、19歳の早川尚吾さん。株式会社Yellstonを立ち上げ、その新サービスとして、CoeFont STUDIOをスタートさせたのです。もちろん株式会社ですから、今後ビジネス展開をしていくことを目論んでいるわけですが、それはCoeFont STUDIOの延長線上にあるもので、世の中を大きく変えていく可能性もありそうです。先

          19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界|DTMステーション
        • 機械学習で使用する手法を全公開 - Qiita

          株式会社デジサク がお送りするプログラミング記事、 今回はAI(機械学習)について扱っていこうと思います。 ※ 無料セミナーも開催中なので、ぜひご覧になってみて下さい。 はじめに kaggleや学習サイトなど誰でも機械学習を学べる機会が増えてきました。 その反面、情報量が多すぎて全体感を掴めていない人が多いと感じています。 そこで、様々な参考書や記事で紹介されている機械学習で使用する手法を全公開しようと思います。 細かなコーディングはリンクを貼っておくので、そちらを参照されてください。 SNS でも色々な情報を発信しているので、記事を読んで良いなと感じて頂けたら Twitterアカウント「Saku731」 もフォロー頂けると嬉しいです。 機械学習の一連手順 まず、機械学習を習得するために必要なスキルは下記です。 実務の場では数段細かな作業が必要になりますが、最初は下記を勉強するだけで十分で

            機械学習で使用する手法を全公開 - Qiita
          • 中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される

            PROTO@AiArt @proto_jp AIイラスト界隈で話題の #元素法典 のネガティブプロンプトらしきものを共有します。画像はダミー。ALTを確認 なんと3000文字以上あって1つのALTには収まらないので4巻構成です。つなぎ合わせて大呪文にしてください。ご利用は自己責任で #NovelAI #NovelAIDiffusion docs.qq.com/doc/DWHl3am5Zb… pic.twitter.com/dA5QNiyqLa 2022-10-17 14:36:23

              中国語圏で狙ったAIイラストを召喚する魔導書「元素法典」が作成される
            • Sakana AI

              概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes (モデルマージの進化的最適化)」を公開しました。 このリリースの要点は以下の通りです。 進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合(マージ)して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既

                Sakana AI
              • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

                OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

                  控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
                • 中学生でもわかる深層学習

                  第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-)

                    中学生でもわかる深層学習
                  • AIはどのような仕事ができるようになったのか?ChatGPTで変わる「優秀な人材」

                    この図はざっくりと3つの領域に分かれます。まず左下が従来のプログラミングの領域です。これは簡単に言うと「プログラムは間違ってはいけない定形な仕事を奪う」ということです。次にその上の士業が責任を取る領域です。これは「責任」を取る人がいないと成立しない仕事です。ミスが発生した際に罰則を与えるという形で、ミスの発生を防いでいます。最後に右側のホワイトカラーの仕事の領域です。ホワイトカラーの仕事は入出力が不定形であり、作業フローも非定型であったりします。そのため、多少のミスはあっても仕方ないという前提の上で仕事が行われています。 機械学習がビジネスに組み込まれるにつれ、ホワイトカラーの仕事領域はそれらによって少しずつ代替されつつあります。その図がこちらになります。 ホワイトカラーの担っていた領域は、表データの機械学習(重回帰や、Lasso回帰、SVM、RandomForest、LightGBMなど

                      AIはどのような仕事ができるようになったのか?ChatGPTで変わる「優秀な人材」
                    • PythonやAIのための数学の基礎を学べる講座が無料に | Ledge.ai

                      サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                        PythonやAIのための数学の基礎を学べる講座が無料に | Ledge.ai
                      • ChatGPTをオープンソースで再現、わずか1.6GBのGPUメモリですぐに使用でき7.73倍高速なトレーニングが可能

                        OpenAIの対話型AI「ChatGPT」は史上最も急速な成長で「月間1億ユーザー」をわずか2カ月で達成するなど、大いに注目を集めています。それに伴い、GoogleがChatGPTのライバルとなる会話型AI「Bard」を発表したり、中国企業が続々とChatGPT風AIを開発していると報道されている一方で、OpenAIはChatGPTのコードを公開していないためChatGPTを効果的に複製することは難しくなっています。AIのディープラーニングトレーニングを最適化するオープンソースプラットフォームのColossal-AIが、ChatGPTトレーニングプロセスをわずか1.6ギガバイトのGPUメモリで7.73倍高速なトレーニングに再現したと告知し、オープンソースで公開しています。 Open-source replication of ChatGPT implementation process!

                          ChatGPTをオープンソースで再現、わずか1.6GBのGPUメモリですぐに使用でき7.73倍高速なトレーニングが可能
                        • 私たちが見ている世界は脳が「過去15秒間」を平均化した映像だった - ナゾロジー

                          私たちの目は常に膨大な量の視覚情報にさらされています。 脳にとって、これは容易な状況ではありません。 何百万もの色や形、光の加減や視点の変化により、視覚の世界は絶えず移り変わっているのですから。(走りながら撮ったカメラの映像を見てください) にもかかわらず、私たちはブレやノイズのない安定した世界を見ることができます。 これは何世紀にもわたって研究者たちを悩ませてきた視覚科学の問題でした。 そしてこのほど、カリフォルニア大学バークレー校 (University of California, Berkeley・米)の研究で、視覚の安定性を説明する新たなメカニズムが発見されました。 それによると、私たちの脳は、過去15秒間に見たものを統合・平滑化して、整った一つの印象にまとめ上げているとのこと。 一体どういうことでしょうか。 研究の詳細は、2022年1月12日付で科学雑誌『Science Adv

                            私たちが見ている世界は脳が「過去15秒間」を平均化した映像だった - ナゾロジー
                          • AI 激動の年!2022年の人工知能10大トレンドと必読論文

                              AI 激動の年!2022年の人工知能10大トレンドと必読論文
                            • 年末年始に振り返る 2021年の人工知能10大トレンドと必読論文

                                年末年始に振り返る 2021年の人工知能10大トレンドと必読論文
                              • AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある

                                トランプ @t0kri AIはちょっと破綻した美少女画しか描けないと勘違いしてる人が多すぎる、全力で破綻に振り切らせるべきなんだ pic.twitter.com/XcBzM9siwo 2022-10-03 23:48:55

                                  AIはちょっと破綻した美少女絵しか描けないと思ってるかもしれないが、その真骨頂はむしろこっちの方向にある
                                • 動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に

                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ(背景雑音)を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。 実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除

                                    動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に
                                  • スワン on Twitter: "あと噂に聞いていた「GPTさんに英会話の練習相手してもらう」のが想像以上に優秀すぎた。 最近は毎日「10分で取り組める英作文のお題くれ〜」ってお願いしてて、せっせと書くと秒で文法&スペルチェックされる+褒めて貰えるのでコーチング感覚でモチベキープできるのが本当に良い✍️"

                                      スワン on Twitter: "あと噂に聞いていた「GPTさんに英会話の練習相手してもらう」のが想像以上に優秀すぎた。 最近は毎日「10分で取り組める英作文のお題くれ〜」ってお願いしてて、せっせと書くと秒で文法&スペルチェックされる+褒めて貰えるのでコーチング感覚でモチベキープできるのが本当に良い✍️"
                                    • デジタル庁事務方トップに伊藤穰一氏 政府最終調整

                                      政府は来月1日に発足するデジタル庁の人事について、事務方トップの「デジタル監」に実業家の伊藤穰一氏を起用する方向で最終調整に入りました。 デジタル庁は国のデジタル改革を担う菅総理大臣の肝煎り(きもいり)の政策です。政府はその要のポストとなる事務方トップのデジタル監に多数のIT関連企業の起業に関わってきた伊藤氏を民間から起用する方向で最終調整に入りました。 政府関係者は「国際的な知見や経験が期待されている」としています。 伊藤氏は2011年にアメリカのマサチューセッツ工科大学メディアラボの所長に日本人で初めて就任しましたが、少女への性的虐待などの罪で起訴された実業家から資金提供を受けていた問題で辞任しています。 政府は来月1日の発足に向けて慎重に調整を進める方針です。

                                        デジタル庁事務方トップに伊藤穰一氏 政府最終調整
                                      • Perplexity

                                        Upgrade for image upload, smarter AI, and more Pro Search.

                                          Perplexity
                                        • 生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について

                                          各種方針等 arrow_forward_ios生成系AIについて 生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について 2023年4月3日 東京大学理事・副学長(教育・情報担当) 太田 邦史 この半年ほどの期間で、生成系人工知能(Generative AI)が複数発表され、社会的に大きな注目を集めています。基本的には、インターネット上などに存在する既存の文章や画像イメージを大量に機械学習し、これに強化学習を組み合わせなどして、一定レベルの品質の文章や画像を生成するシステムです。とくに、2022年11月に公開され、話題になった大規模言語モデルChatGPTはバージョンが更新され、最新のGPT-4では生成される文章などの質や正確性が著しく向上しています1。 これらの生成系AIは、平和的かつ上手に制御して利用すれば、人類の

                                            生成系AI(ChatGPT, BingAI, Bard, Midjourney, Stable Diffusion等)について
                                          • ディープラーニングを学び始めた方へ 東京大学/松尾豊教授の動画 - Qiita

                                            1.はじめに ディープラーニングを学び始めた方にとって、東京大学/松尾教授の動画を見ることは、とても刺激的で勉強になり面白いものだと思います。今回、松尾教授の講演に加えて対談やパネルディスカッションも含めた動画のリンクをまとめましたので、よろしかったら見て下さい。 おすすめは、01, 05, 14, 16, 23, 27 です。 2.動画リンク 講演には★の表示がしてあります。 □2012年 ★01.Computer will be more clever than human beings 東京大学版TEDです(もちろん日本語です)。ウェブを利用した情報の利用と人工知能の可能性についてコンパクトにまとめています。ディープラーニングには触れていませんが、若々しい松尾教授の姿が見れて、内容も興味深いです。<おすすめです。>(15分) □2013年 02.IT融合シンポジウム ~企業・研究者に

                                              ディープラーニングを学び始めた方へ 東京大学/松尾豊教授の動画 - Qiita
                                            • 画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

                                              2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について(素案)」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント(パブコメ)」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について(素案)令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。 文化庁 文化審議会 著作権分科会 法制度小委員会(第7回) パブコメへの反応は「素案の内容周知」 発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

                                                画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)
                                              • 「AVモザイク除去」できるAIに業界が震撼、人気AV女優も被害に… | 日刊SPA!

                                                かつて実話誌の広告にあった「AVのモザイク除去機」が現代に甦った! AIの技術の進化によりモザイクの除去が可能となったが、人気AV女優も被害にあうなど、業界は深刻な被害に頭を痛めていた 昨年12月にSPA!は、AI(人工知能)で有名芸能人の顔にすげ替えた「フェイクポルノ」の蔓延についてお伝えしたが、現在、AIを悪用したアダルトコンテンツにはもう一つの潮流がある。それはモザイクが限りなく薄く見える「モザイク除去動画」の存在だ。すでにKやFといった海外のポルノ動画サイトでは大量にアップされている。 なかには本来、無修正作品が出回っているはずのない有名女優のT・SやM・Yなどの動画もある。これらの動画が流通し始めた当初、「いったいこれは何だ?」と謎が謎を呼んだが、そのカラクリが明らかになりつつあり、AV業界が震撼しているという。 真相に迫る前に、まずは実際にサイトで件の動画を探してみた。無数にア

                                                  「AVモザイク除去」できるAIに業界が震撼、人気AV女優も被害に… | 日刊SPA!
                                                • 最近話題になった 音楽生成AI まとめ|npaka

                                                  最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod

                                                    最近話題になった 音楽生成AI まとめ|npaka
                                                  • 大澤昇平 :: AI 救国論 🇺🇳 on Twitter: "私が関係筋から聞いた話によると、金子勇のWinny開発には中国共産党が関与している。 中国当局はその後、情報暴露型のワーム(Antinny/キンタマウイルス)を日本に蔓延させ、自衛隊の軍事機密をWinny経由で大量に流出させるこ… https://t.co/mXQOPBhoTT"

                                                    私が関係筋から聞いた話によると、金子勇のWinny開発には中国共産党が関与している。 中国当局はその後、情報暴露型のワーム(Antinny/キンタマウイルス)を日本に蔓延させ、自衛隊の軍事機密をWinny経由で大量に流出させるこ… https://t.co/mXQOPBhoTT

                                                      大澤昇平 :: AI 救国論 🇺🇳 on Twitter: "私が関係筋から聞いた話によると、金子勇のWinny開発には中国共産党が関与している。 中国当局はその後、情報暴露型のワーム(Antinny/キンタマウイルス)を日本に蔓延させ、自衛隊の軍事機密をWinny経由で大量に流出させるこ… https://t.co/mXQOPBhoTT"
                                                    • 日本人アイドルも被害に。96%がポルノ動画の「ディープフェイク」政治的な悪用も

                                                      Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you.

                                                        日本人アイドルも被害に。96%がポルノ動画の「ディープフェイク」政治的な悪用も
                                                      • 維新「司書はAIで代替可能」

                                                        拡大 学校司書の配置増を求める国会決議に反対し「司書の仕事はAI(人工知能)にとって代わられる」(中央)などとした日本維新の会の文書 学校図書館で子どもの読書や学習を支える学校司書の配置増を求める国会決議案に、与野党で唯一、日本維新の会が「近い将来、司書の仕事は人工知能(AI)で代替可能になる」と反対し、臨時国会(9日閉会)への提出が見送られていたことが19日分かった。 2015年施行の改正学校図書館法で「努力義務」とされた学校司書の配置は全体の半数程度にとどまっている。このため「文字・活字文化推進機構」が働き掛け、衆参両院で全会派が了承した形での決議案提出を目指していた。 維新の浅田均政調会長は取材に「人件費増に直結する『司書の配置促進』は『改革』の名に値しない」と文書で回答した。

                                                          維新「司書はAIで代替可能」
                                                        • 牧島かれん新デジタル相もNTTから豪華接待を2回受けていた | 文春オンライン

                                                          牧島かれん新デジタル担当相(44)が、NTTから2回にわたり、高額接待を受けていたことが「週刊文春」の取材でわかった。 デジタル庁を巡っては、平井卓也前デジタル担当相(63)や、ナンバー2の赤石浩一デジタル審議官がNTTから高額接待を受けていた問題が発覚。平井氏は閣僚給与1カ月分を自主返納し、赤石氏には減給10分の1(1カ月)の懲戒処分が下されている。

                                                            牧島かれん新デジタル相もNTTから豪華接待を2回受けていた | 文春オンライン
                                                          • 【一問一答】マヅコの知らない「異常検知」の世界 - Qiita

                                                            これから異常検知を勉強される初心者、中級者の方のために一問一答集を作ってみました。 実際にあった質問も含まれますが、ほとんどの質問は、私が勉強しながら疑問に思ったことです。 なお、各質問には私の失敗談を添えております。皆さんは私のような失敗をしないよう 祈っております(^^)。異常検知に特化した内容となっておりますので、ご了承ください。 初心者の方向け 勉強の仕方編 Q:異常検知を勉強したいのですが、何から手をつけて良いのか分かりません。 A:書籍を買って読むのがおススメです。 最初、私はネット情報で勉強していました。しかし、それにも限界があります。 ところが、書籍(入門 機械学習による異常検知)を買って読んだところ、かなり知識を 得ることができました。最初から、書籍を買っていれば、一年くらい得することができたのに... と思うこともあります(^^; ただ、こちらの本はディープラーニング系

                                                              【一問一答】マヅコの知らない「異常検知」の世界 - Qiita
                                                            • Microsoftが誰でも簡単に機械学習モデルが作れるツール「Lobe」を公開! | Techable(テッカブル)

                                                              Microsoftは、WindowsやMacにダウンロードして無料で使える「Lobe」を公開している。同ツールでは、ネット接続やログインもなしで機械学習トレーニングができて、利用するデータはプライベートに保たれる。 Microsoftは2018年にLobeを買収し、同ツールをブラッシュアップしてきた。今では、誰でも簡単に機械学習モデルがトレーニングできるように…とのコンセプトを体現したものになっている。写真をインポートすれば自動でトレーニングLobeのWebサイトに掲載の紹介動画を観れば、このツールのシンプルな使い勝手が認識できるだろう。ナビゲーターがPCのWebカメラで水を飲む写真を複数通り撮影。同じく水を飲んでいないシーンを撮影すると、トレーニングが自動で行われる。 ラベルを調整して、Webカメラの前で水を飲むと「水を飲む」動作が検出できるように。また、モデルの修正も簡単にできるようだ

                                                                Microsoftが誰でも簡単に機械学習モデルが作れるツール「Lobe」を公開! | Techable(テッカブル)
                                                              • DATAFLUCT Tech Blog

                                                                2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日本で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

                                                                  DATAFLUCT Tech Blog
                                                                • Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita

                                                                  08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。 言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします!(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransformerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ

                                                                    Self-Attentionを全面的に使った新時代の画像認識モデルを解説! - Qiita
                                                                  • お絵かきAI Disco Diffusionには解像度が上がる魔法の呪文があるらしい「入れるだけで自動的にこのクオリティ」

                                                                    リンク ゆるおた学習帳 イラスト自動生成AI「Disco Diffusion」に絵を描いてもらった - ゆるおた学習帳 絵を描いてくれるAI「Midjourney」をきっかけに、この世にはオープンソースのイラスト生成AIがあることを知りました。早速自分も試したい!と思ったのですが、今回の「Disco Diffusion」はイラスト生成まで少し難しかったので自分用備忘録です。 参考にさせていただいた記事はコチラ↓Get Started With Disco Diffusion to Create AI Generated Art イラスト自動生成AI「Disco Diffusion」の使い方 「Disco Diffusion 2 users リンク note(ノート) 魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)|note やればやるほど呪術化する、AI画像錬成につい

                                                                      お絵かきAI Disco Diffusionには解像度が上がる魔法の呪文があるらしい「入れるだけで自動的にこのクオリティ」
                                                                    • 日本ディープラーニング協会、機械学習やPythonを学べる講座を無料公開 外出控える人に「学ぶきっかけを」

                                                                      日本ディープラーニング協会(JDLA)は3月13日、AIの仕組みやプログラミング言語「Python」の基礎などを学べる講座を、公式サイトで無料公開した。新型コロナウイルスの感染拡大に伴って外出を控えている社会人と学生に、ディープラーニングを学ぶきっかけを提供したいという。無料期間は講座ごとに異なる。 ディープラーニングの基礎知識や、ビジネスでのAI活用、Pythonを使った機械学習などを学べる8種の学習コンテンツを無料で提供。JDLAはディープラーニングを活用できる人材の育成に向けた検定・資格試験を実施しており、今回の施策では「G検定」(ジェネラリスト検定)と「E資格」(エンジニア資格)の試験対策講座なども対象になる。E資格の取得に必要な講座も一部含まれるが、その講座を受講しただけでは受験資格は与えられないという。 関連記事 さくら、Pythonの基礎講座を無償提供 新型コロナで外出控える

                                                                        日本ディープラーニング協会、機械学習やPythonを学べる講座を無料公開 外出控える人に「学ぶきっかけを」
                                                                      • LoRAを使った学習のやり方まとめ!好きな絵柄・キャラクターのイラストを生成しよう【Stable Diffusion】

                                                                        を一通りご紹介するという内容になっています。 Stable Diffusion系のモデルを使って画像を生成していると、 特定のキャラクターのイラストを出したい あるアニメの絵柄を再現したい といった欲求が出てくることがあります。ただ画像生成AIはそのままだと「特定の絵柄・キャラクターを決め打ちで出す」のは非常に難しいですし、それを解決する手法もありましたが高性能なPCが必要で時間もかかる…という問題がありました。 しかしそのような問題を解決する「LoRA」という手法が知られて、今ではかなりポピュラーなやり方になっています。ここではこのLoRAについて

                                                                          LoRAを使った学習のやり方まとめ!好きな絵柄・キャラクターのイラストを生成しよう【Stable Diffusion】
                                                                        • (数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

                                                                          (数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理 複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ 概要: ChatGPT などで使われている Transformer モデルは、 ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。 本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。 実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、 その注釈版である The Annotated Transformer を参照のこと。 日本語では この解説 がわかり

                                                                          • サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―

                                                                            株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、最大68億パラメータの日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことをお知らせいたします。 近年、OpenAI社が開発した「ChatGPT」※1 を始めとする生成AI・LLMは急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいます。 一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および日本文化に強いLLMは少ない状況です。 ■最大68億パラメータの日本語LLM(大規模言語モデル)の公開について こうした背景のもと、当社は日本語LLMの開発に取り組んでおり、このたび一部モデルをHugging Face Hubにて公開いたしました。公開されたモデルはオープンな日本語データ※2で学習したもので

                                                                              サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―
                                                                            • Stable Diffusionをいらすとやでファインチューニングする

                                                                              巷で話題のStable Diffusion(以下SD)をファインチューニングする方法が公開されたので、早速やります。

                                                                                Stable Diffusionをいらすとやでファインチューニングする
                                                                              • 食べログ側に賠償命令、評価点下落「優越的地位の乱用」 - 日本経済新聞

                                                                                グルメサイト「食べログ」で評価点が不当に下がり、売り上げが減少したとして、飲食チェーン店がサイト運営のカカクコムに約6億4000万円の損害賠償などを求めた訴訟の判決が16日、東京地裁であった。林史高裁判長は独占禁止法が禁じている「優越的地位の乱用」に当たると判断。チェーン店側の請求を認め、カカクコムに3840万円の支払いを命じた。原告側によると、評価点を決めるルールの「アルゴリズム」(計算手法

                                                                                  食べログ側に賠償命令、評価点下落「優越的地位の乱用」 - 日本経済新聞
                                                                                • 大澤昇平🇺🇳 on Twitter: "東大は左翼の肩を持つつもりです。共産主義の反日大学にすべきでない。一刻も早い浄化を。 https://t.co/6ZGSD9a2Wd"

                                                                                  東大は左翼の肩を持つつもりです。共産主義の反日大学にすべきでない。一刻も早い浄化を。 https://t.co/6ZGSD9a2Wd

                                                                                    大澤昇平🇺🇳 on Twitter: "東大は左翼の肩を持つつもりです。共産主義の反日大学にすべきでない。一刻も早い浄化を。 https://t.co/6ZGSD9a2Wd"