出版時にはさらにアップデートしたものにする予定。AI作曲関連の動きも早いので一体どうなることやら……。 Microsoft Copilotで作曲してみようSunoを使う方法が、実はもう一つあります。 それは、マイクロソフトが提供しているAIチャットサービス「Microsoft Copilot」(マイクロソフト・コパイロット)を利用することです。 Microsoft Copilotは、生成AIの代名詞ともなっているChatGPTと同等の機能が組み込まれているサービスで、Microsoftアカウントを持っていれば、copilot.microsoft.comにアクセスするだけで、基本無料で使えます。 画面下部に「なんでも聞いてください」と書かれているところにテキストを入力して▶️ボタンを押せば、AIが解凍してくれるという仕組みで、会話を続けながら、目的の情報を得ることができます。 ▲ログインしな
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面(右上)、コードエディタ(右下)、Webブラウザ(左下)を持っています(左上は人間とチャットでやり取りする領域)。 人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。 今回、Dev
Googleは2月21日(現地時間)、Google WorkspaceユーザーがGmailやドキュメント、スライド、スプレッドシート、MeetでGeminiを利用できるGemini for Google Workspaceの提供を開始しました。 日本でも利用できますが、いまのところ対応は英語のみとなっています。 プランとしては、既存のDuet AI for Workspaceに代わるGemini Enterprise(年間契約で1ユーザーあたり月額30ドル)と、より低価格なGemini Business(年間契約で1ユーザーあたり20ドル、日本では2712円)の2つを用意しています。 個人ユーザー向けには、すでにGoogle OneのAIプレミアムプランが提供されていますが、今回のGemini for Google Workspaceは企業などの組織向け。提供する機能としては、基本的には同
テクノエッジ編集部では、生成AIグラビア実践ワークショップ第5回を開催します。講師は、人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんです。 高価なゲーミングPCがなくても自分で高速な画像生成ができるサービス「生成AI GO」を無料で使いながら、生成AIに関する知見とグラビアカメラマンとしての豊かな経験から得られた最新かつ実践的なテクニックを学べます。 なお、ワークショップ内で使用するプロンプトは、受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のパソコンに保存できます。 第5回は、2月27日、オンラインにて開催いたします。なお、今回お申し込みいただいた方は、第4回の動画アーカイブを視聴いただけます。 グラビアカメラマンが教える、生成AIグラビア実践ワークショップ 申
楽天モバイル傘下の楽天シンフォニーは2月6日、クラウドストレージサービス「楽天ドライブ」を日本国内で本格的に提供開始すると発表しました。 楽天ドライブは、2019年に「Sendy」としてサービスを開始。2021年にSendyを運営する韓国のスタートアップ企業Estmob(イストモブ)を楽天モバイルが買収・子会社化していました。 Estmobはその後、楽天モバイルで培ったネットワーク技術をグローバル展開する楽天シンフォニー傘下として社名をRakuten Symphony Koreaに改称。楽天ドライブのグローバルな運営主体はRakuten Symphony Koreaで、日本国内での販売・マーケティングを楽天シンフォニーが行います。 なお、今回の発表はあくまでも日本国内で本格的に展開を開始するというもので、モバイルアプリを含め、1年前にはすでに楽天モバイルに改名されていました。 その楽天モバ
Adobeは2月4日、Creative Cloud個人版プランを3月5日から値上げすると発表しました。Creative Cloudの日本での値上げは2022年4月以来の約2年ぶり。 海外では2023年11月にも値上げが実施されていましたが、その際は日本は対象外でした。今回の値上げは、その海外での値上げを日本にも反映させるものとなっています。 コンプリートプランの価格改定は下記の通り。 年間プラン月々払い: 月額 6480 円から月額 7780 円 月々プラン月々払い: 月額 1万280 円から月額 1万2380 円 年間プラン一括払い: 年額 7万2336 円から年額 8万6880 円 値上げの対象となるのは、コンプリートプランのほか、単体プランやフォトプラン(20GB、1TB)など多岐に渡ります。 値上げの理由については、生成AI機能の追加など、機能強化による付加価値向上があげられていま
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 NASAとロッキード・マーティンは1月12日に静音超音速実験機「X-59 Quesst」を正式に発表しました。NASAの副長官で元宇宙飛行士のパメラ・メルロイ氏は「X-59は、私たちの旅のあり方を変え、移動をより近く、短時間にしてくれるでしょう」と述べています。 現在、米国上空では商用超音速飛行が禁止されていますが、NASAの最新の実験用航空機であるX-59は、これを再検討するのに役立つデータを取得、提供することに重点を置いています。全長約30mのうち約1/3が非常に伸びた先端を持つ機首部分という特異な形状により、音速の1.4倍(マッハ1.4)に達するという最高速度での飛行時にも、衝撃波の発生を大きく軽減しま
OpenAIが、かねてから予告していたGPT Store をようやく開設しました。 個人や企業が作ったカスタム版ChatGPTであるGPTsを分野ごとにブラウズ・検索して利用でき、自分が作ったGPTを公開することもできます。 現状では有料プランのChatGPT Plus加入ユーザーのみ、メニューの「Explore GPTs」から利用可能です。 ストアといっても利用に別途料金が必要なGPTsは今のところありませんが※、OpenAIは今四半期のうちにも、GPTsが利用された回数に応じて制作者に収益を分配するレベニューシェアを開始予定です。 (※ サードパーティーと接続したGPTsなどでは、チャットの過程で有料サービスに案内されることはあります。) 開設されたばかりのGPT Store でトップにフィーチャーされているのは、 AllTrails 世界中のトレッキングコースやアウトドア体験を場所・
歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」。音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。 いい感じの音楽が出るまでガチャを引けばいいのですが、Sunoを効率化のために使いたい、アイデア出しのために利用したいんだけど、出力された音楽をいちいち手弾きで入力するのもだるい、という話です。 今回はこの解決策をご紹介しようと思います。詳しい人ならご承知のことと思いますが、改めて。 以前のコラムで紹介したように、例えばLogic ProのFlexPitchのようなピッチエディターを使えば、単音のオーディオファイルからMIDIデータを取り出すことは可能です。 実際、筆者はUVR5という音源分離ツールを使って取り出したBassトラックをFlexPitchによってピアノロール表示し、それを改めてMIDIデータとして打ち込むというのをやっ
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」 アリババらが開発 話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」 話し方や感情なども忠実に再現 リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」 写真から3D
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第22回目は、AIが不得意とする指の数を修正する技術やStability AIの動画生成モデルなど、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ人間が話すような音声合成でテキストを読み上げるTTSモデル「StyleTTS 2」 コロンビア大の研究者ら開発 Stability AI、画像から動画を生成するモデル「Stable Video Diffusion」発表 画像と動画を同時に扱う大規模視覚言語モデル「Video-LLaVA」 北京大などが開発 テキストから3Dモデルを生成する新型モデル「LucidDreamer」 他に影響を与えず表情や年齢
アルトマン氏だけでなく、グレッグ・ブロックマン氏、さらには主要なエンジニアが次々と退社を表明する中、寝耳に水だったとされるマイクロソフトらステークホルダーによる圧力で、取締役会はアルトマン氏らと話し合いをもったものの、同氏の復帰はなりませんでした。しかし、この件を告げるThe Informationらの報道があった11月20日に、マイクロソフトのナデラCEOが続報をXに投稿。 新体制のOpenAIとのパートナーシップは継続する一方で、アルトマン氏は同じくOpenAIを退社したグレッグ・ブロックマン氏らとともにマイクロソフトの新しいAI研究チームを率い、マイクロソフトはそのために必要なリソースを提供する、という内容です。アルトマン氏はこれに対し、「使命は続く」とリプライ。 マイクロソフトは、OpenAIとの関係を継続する一方で、アルトマン氏と一緒にOpenAIを退社した人材をも自社に抱えると
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第19回目は、人気の文字起こしソフト「Whisper」の高速化版、スマホでできるAIボイチェン、プレッシャーをかける感情付きプロンプトをはじめとする、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップOpenAIの文字起こしAI「Whisper」を軽量かつ高速にするモデル「Distil-Whisper」 Hugging Faceが開発 3.2兆以上のトークンで学習された、130億のパラメータを持つオープン大規模言語モデル「Skywork」 テキストや画像から高品質な動画を生成するオープンソースモデル「VideoCrafter1」 中国テンセント含む研
1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。 打ち間違い・変換ミスのことを「typo」ということがある。 typoは英語でタイプミスを示す俗語で、typeのeをoと打ち間違う……という話に由来する。冷静にキー配列を考えるとeとoはあんまり打ち間違えないようにも思うが、それはそれとして、だ。 ライターの仕事はtypoとの戦いだ。 理由はいくつかある。 ・本来間違えていてはいけない ・文書の生産量が多いのでtypo混入の可能性もその分上がる ・スピードが必要なのでtypoしやすさも上がる ・その割にうっかりしがち 書籍などのように何回も、複数人の手を経るものならtypoは減らしやすいのだが、日々の作業だとtypoをゼロにするのは難しい。 というわけで今回は、typoを減らすツ
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 2010年に設立された「世界初の公式Unityユーザーグループ」ことBoston Unity Group(BUG)は、「会社に対する信頼を完全に失った」として最後のオンラインミーティングを開催すると発表しました。これをもってBUGは解散することになる模様です。 これは先週、このゲームエンジンを使用する開発者らの間に騒ぎを引きおこした料金体系改革に続いての動きであり、Unityはその後新料金体系の一部分を緩和する変更をすると述べました。しかし、いまでも多くの開発者が、やはりこのエンジンを敬遠する姿勢を見せています。 BUGはコミュニティへの声明文のなかで、「残念なことに、数年前からUnityの関心はゲーム業界か
Adobe Fireflyは、アドビが誇る画像生成AI技術です。まずPhotoshopのベータ版に導入されましたが、先ごろ、Photoshopの正式版でも使えるようになり、「Adobe Firefly web版」も提供開始されました。 筆者はこの技術をいち早く使うため、Adobe Creative Cloudにお布施を始めました。Photoshopベータ版での生成塗りつぶし・生成拡張を体験するためです。 この技術を使って1枚の写真を救出することに成功したので、報告したいと思います。 救いたかった写真はこちらです。 1981年ごろに撮影された妻の学生時代の写真。表情は素晴らしいのに、顔の上半分が欠けてしまっているのです。これだけのいい笑顔の写真はそれほど多く残っていません。ぜひ、これの完全版を見てみたい。 見えていない部分をAIで拡張する技術を提供しているのはアドビだけではありませんが、Ph
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く