今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」(コンピュータと人間を区別するための完全に自動化された公開チューリングテスト)を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」に注目します。 ▲CAPTCHAを突破するAIシステム CAPTCHAは、ウェブサイトのセキュリティを向上させるために広く使用されている技術です。この研究は、そのシステムの効果を詳細に検証し、AI技術を用いてどの程度突破できるかを明らかにしま
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。
深圳の3DプリンタメーカーELEGOOが2023年12月にKickstarterで実施していたクラウドファンディングにプレッジ(出資)していたのですが、その現物が届きました。「ELEGOO OrangeStorm Giga」という製品です。 当時は送料込みで1640ドル。日本円で25万円ほどでしたが、現在の暫定価格は2500ドル。35万円を超えます。それでも80×80×100cmという、現在一般で売られている3Dプリンタの4倍の印刷面積を誇ることを考えれば安いものです。 現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか(CloseBox) | テクノエッジ TechnoEdge ■これ、どうやって運びましょう(西濃運輸)8月中に届く予定だったのですが、結局日本に届いたのは8月末。さらに、配送の連絡が来たのは9月に入ってからです。な
■「Suno AIに挑戦する」と発表したサービスが、実はSunoへのスクレイピングで成立している?8月15日にLoudMeが発表したプレスリリースでは、「LoudMe Announces Its Royalty-Free AI Music Generator & Sound Effects Generator to Challenge Suno AI」とうたっていました。 LoudMeはロイヤリティフリーの音楽生成およびサウンドエフェクト生成でSuno AIに挑戦する、というものです。しかし、8月30日に、LoudMeの実態について、Sunoの関係者がYouTube動画で驚くべき指摘をしています。 この動画の作者である3Daizyさんは、SunoのDiscordでモデレーションをしている人で、Suno関係者といってもいい人物。LoudMeがロイヤリティフリーとして公開している楽曲はSuno
ディズニー・リゾート内レストランの食事が原因のアレルギー性ショック症状で女性が亡くなり、遺された夫がレストランおよびディズニーの監督責任を訴えていた裁判について。 米ディズニー社側は「夫は以前Disney+サービスに加入していたため、利用規約によりディズニー相手の訴訟は起こせない」との主張を取り下げました。 (ディズニー、リゾート内の死亡訴訟を『ディズニープラス規約』根拠に取り下げ求める。裁判外解決を主張 | テクノエッジ TechnoEdge) ■訴訟に至る経緯亡くなったのは、ニューヨーク在住の女医であるKanokporn Tangsuanさん。2023年秋に、夫のJeffrey Piccoloさんとその母親とともに、米フロリダ州ディズニー・リゾートの Disney Springs にあるレストラン Raglan Road Irish Pub and Restaurant を訪れました。
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第27回は、前回に続いて最新の画像生成AIモデル Stable Diffusion 3 Medium について。 『生成AIグラビアをグラビアカメラマンが作るとどうなる?連載』記事一覧』 前回に引き続きStable Diffusion 3 Mediumの話連載第26回にSD3 Medium(以降SD3 Medium)の話を書いたが、今回はその続きとなる。 前回の記事ではSD3 Mediumの特徴として Baseモデルなのに高画質。そして日本人含むアジア系もOK 商用利用不可。個人レベルでの商用利用は、クリエイターライセンス($20/月)を契約 結構な頻度で致命的な問題が発生する Promptで左右など、位置関係が指示でき再現可能。文字もOK(英語のみ) 生成環境は現状でComfyUI(系)のみ。基本Work
現時点で一般に使える最高レベル動画生成AI、Luma AIの「Dream Machine」に新しい機能「Keyframes」が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。 Dream Machineは高性能ではあるのですが、学習データが欧米に偏っているためか、日本人の画像を元にしても途中で欧米人に変身しがちという問題がありました。このため、欧米化する直前のところまでしか使えず、5秒間やそれをExtendした10秒といった長尺の動画は絵に描いた餅状態でした。 こうした「別人化」「欧米化」問題がこれで解消するか、実際に検証してみました。 ■2枚の銀塩写真から動画を作る同じときに撮影したこの2枚の写真をキーフレームの始点と終点にします。最初の画像を入力すると、End Frameの入力が可能になります。 (▲最初の画
以前見学させていただいた「マイコン博物館」が6月22日に正式オープンしました。 1日の利用が大人1000円で、動態保存してあるマイコンを利用できるオプションが3000円。全て予約制で、水曜日が休館日。開館時刻は12時~18時。最終入館時刻は17時となっています。突然の訪問はできません。詳細はこちら。 筆者は正式オープン前に伺ったのでまだ整理されていない状態でしたが、展示のために集められたマシンたちは実に素晴らしいものでした。 マイコン博物館プレオープン訪問記の後編をまだ書いていなかったので、個人的な過去の体験を交えながらここに書いておきます。以下に登場する記述や写真はプレオープン時のもので、今は収まるべきところに、正しい説明とともに収蔵されているはずです。 1981年冬のマイコンフェアが青梅に再現されていたここを訪れた後、思い出した場所があります。それは五反田TOCのどこか。1981年冬の
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 インターネットの根幹を支えている、世界に13台しかないDNSルートサーバーの1台が、4日間にわたり、他との同期を失う不具合を起こしていたことが分かりました。 同期を失っていたのは、Cogent Communicationsが管理するDNSルートサーバー。DNSとは、Domain Name Systemの略称で、人々がインターネットにアクセスするときに使うドメイン名とIPアドレスの紐付けを管理する役割を果たしています。 インターネットはこのDNSを階層的に構築しており、その最上階層にあるのが13台のルートサーバーです。 たとえば、誰かがブラウザーを開いてWikipediaを閲覧しようと思い、Wikipediaへ
Google Cloud Next 2024イベントを前に、Googleが新しいWorkspaceアプリ『Google Vids』を発表しました。 文書を作る Google Docs、スライドを作る Google Slidesのように、Google Vids は主にプレゼンテーションやプロモーション用の動画を作るためのアプリ。 動画を制作のさいに必要となるメッセージのライティングや、動画の絵コンテや流れの制作、音楽・画像・クリップといった素材の選定と展開にあわせた編集、ナレーション原稿の作成とAI音声による読み上げまでワンストップでアシストする点が特徴です。 Google ドキュメントやスライドのように多数のスタイルのテンプレートを用意しており、動画で伝えたいことを短い文章で形容して関連文書や素材を放り込めば、Google のAIモデル Gemini が動画の導入からストーリーボード(絵コ
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 Apple Vision Pro(以下Vision Pro)を購入して1カ月以上が経過した。「飽きて使わなくなった」という人もいるようだが、筆者はほぼ毎日、便利に使っている。 仕事自体も、Mac+物理ディスプレイ6に対してMac+Vision Proが4、くらいの比率で利用している。 そういう風に使うとなると、仕事環境や周囲の配置自体も、Vision Pro向けの最適化が必要になってくる。 今回はどんなことをしたのか、ちょっとまとめてみたいと思う。 イベント告知:Vision Proがドレスコードの「Apple Vision Proパーティー」第2回、秋葉原UDXで3月28日(木)開催。持っていなくても参加できます | テクノ
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面(右上)、コードエディタ(右下)、Webブラウザ(左下)を持っています(左上は人間とチャットでやり取りする領域)。 人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。 今回、Dev
Sugr Technology Hong Kong Limited 『月額不要、生涯無料で議事録作成丸投げ』ChatGPT連携AI要約作成+11in1オーディオドック 大手オーディオハードウェア企業Sugr Technology Hong Kong Limited社(2014年香港設立、代表取締役::宋少鹏)の最新ブランドHiDockより発表されたChatGPT連携AIオーディオドック「HiDock H1(ハイドック エイチワン)」が、先行販売サイトMakuakeにて2月27日(火)11時より日本初となる先行販売を開始しました。 「HiDock H1(ハイドック エイチワン)」先行予約販売ページ: https://www.makuake.com/project/hidock_h1/ 【予約販売期間】 2024年2月27日(火)11時~2024年4月29日18時まで ChatGPT連携のAI
では、一人の音楽素人がAIの力を借りたら、どの程度までコンセプトアルバムが作れるか、試してみました。思いついたのは、今日(2月27日)の11時30分ごろ。まず、ChatGPTにこう指令することから始めました。 ロックのコンセプトアルバムを作りたいので、12曲のタイトルと歌詞、そしてその曲調をそれぞれ英語で記述して そうすると、ChatGPTは12曲の概要を作ってくれました。 1. "Echoes of Eternity"曲調: エピックなインストゥルメンタルイントロ。壮大なストリングスとパワフルなドラムス。 歌詞の一部: (インストゥルメンタル) 2. "Shadows in the Moonlight"曲調: ミステリアスなヴァースとクライマックスへ向けて構築されるコーラス。 歌詞の一部: "In the silver glow, secrets come to dance, / Sha
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルは、iPhone 15シリーズに搭載するバッテリーの寿命(充電回数)が、再テストの結果これまでの想定より長寿命であることがわかったとして、iPhoneのサポートページを更新しました。 iPhone 15シリーズ(iPhone 15、iPhone 15 Plus、iPhone 15 Pro、iPhone 15 Pro Max)のバッテリー寿命は、これまでは充電回数にして500回とされていましたが、更新された充電可能回数は2倍の1000回になっています。 この「バッテリー寿命」とは一回の充電で何時間使えるかではなく、充電と放電(使用)を繰り返したとき、充電できる最大容量がどれほど残るかの目安。この場合は1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く