タグ

ブックマーク / note.com/fladdict (3)

  • 魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)

    やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love AppleApple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple

    魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)
  • ZOOM会議に効果音をいれて超楽しくするには|深津 貴之 (fladdict)

    拡張現実(AR)は、音声からはじまる…というのが以前からの持論。そんなわけでZOOMの会議に、効果音をブチ込める環境を作ってみました。 会議中に、Hahahaha!とかOhhhhh…みたいな、アメリカンなアクションやりたい!ファンファーレやドラムロールとか、拍手やブーイング、ズキューンとか鳴らしたいじゃない? ユーザー体験が超変わる!!と思ったのですが、ググってもでてこなかったので環境構築してみました。 環境概要物理機材はなしソフトで解決。バーチャルミキサーを使って、マイクと各種音声アプリのサウンドを合算します。初回設定20分。会議前設定30秒ぐらい。ZOOMには、バーチャルミキサーを擬似マイクとして設定。こうすることで、様々な効果音や音楽、楽器をZOOMに流しこめます。 バーチャルミキサー音の合成には、Loopbackというアプリを使います。このアプリは、複数のオーディオインプット(マイ

    ZOOM会議に効果音をいれて超楽しくするには|深津 貴之 (fladdict)
    mainyaa
    mainyaa 2021/07/03
  • AI企業としてのAdobeの戦略 (本編)|深津 貴之 (fladdict)

    隠れAIプレイヤーだったAdobeが、今回のMAXでいよいよ表舞台に立った。 前記事では、Adobeの構造と収益体制について解説した。今回は編として、AdobeがAI戦略で、何を狙っているのかを考察する。 *注 筆者はAdobe社から、Adobe MAX 2017への招待を受けて参加しています。…が、それはそれとして中立で書きます。Adobeさん、都合の悪いこと書いてたらごめんなさい! Adobeが学習しているモノは何か?AdobeのAIプレイヤーとしては、特殊性なポジショニングを持つ。その特殊性を理解するには、まずAdobeが何を学習しているのか?を理解しなければならない。多くの人々は、「AdobeのAIは画像認識」だと考えている。だが、それは大きな間違いだ。画像認識は、AdobeのAI群のわずか一部分にすぎない。 では、AdobeのAI質は何か? Adobe Senseiの質は

    AI企業としてのAdobeの戦略 (本編)|深津 貴之 (fladdict)
    mainyaa
    mainyaa 2017/11/01
  • 1