shion214のブックマーク - はてなブックマーク

「Suno超えた？」と噂の、リアルな歌声でAI作曲して音源分離もできる「Sonauto」を試してみた（CloseBox） | テクノエッジ TechnoEdge

shion214 2024/04/10

リンク

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル（CloseBox） | テクノエッジ TechnoEdge

出版時にはさらにアップデートしたものにする予定。AI作曲関連の動きも早いので一体どうなることやら……。 Microsoft Copilotで作曲してみようSunoを使う方法が、実はもう一つあります。それは、マイクロソフトが提供しているAIチャットサービス「Microsoft Copilot」（マイクロソフト・コパイロット）を利用することです。 Microsoft Copilotは、生成AIの代名詞ともなっているChatGPTと同等の機能が組み込まれているサービスで、Microsoftアカウントを持っていれば、copilot.microsoft.comにアクセスするだけで、基本無料で使えます。画面下部に「なんでも聞いてください」と書かれているところにテキストを入力して▶️ボタンを押せば、AIが解凍してくれるという仕組みで、会話を続けながら、目的の情報を得ることができます。 ▲ログインしな

shion214 2024/04/09

リンク

リアルな歌唱もインストも作曲できる生成AI「Suno」高性能な最新版V3が3月23日から無料？→22日公開されました。最新の使い方を解説（CloseBox） | テクノエッジ TechnoEdge

shion214 2024/03/22

リンク

自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビルド・デプロイまで | テクノエッジ TechnoEdge

ITジャーナリスト／Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。 Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。 Cognition AI CEOのScott Wu氏以下はデモ動画からのキャプチャです。 Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面（右上）、コードエディタ（右下）、Webブラウザ（左下）を持っています（左上は人間とチャットでやり取りする領域）。人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。今回、Dev

shion214 2024/03/17

リンク

Google、企業向け生成AI『Gemini for Google Workspace』提供開始。GmailやDocs、シート等をAIがアシスト | テクノエッジ TechnoEdge

Googleは2月21日（現地時間）、Google WorkspaceユーザーがGmailやドキュメント、スライド、スプレッドシート、MeetでGeminiを利用できるGemini for Google Workspaceの提供を開始しました。日本でも利用できますが、いまのところ対応は英語のみとなっています。プランとしては、既存のDuet AI for Workspaceに代わるGemini Enterprise（年間契約で1ユーザーあたり月額30ドル）と、より低価格なGemini Business（年間契約で1ユーザーあたり20ドル、日本では2712円）の2つを用意しています。個人ユーザー向けには、すでにGoogle OneのAIプレミアムプランが提供されていますが、今回のGemini for Google Workspaceは企業などの組織向け。提供する機能としては、基本的には同

shion214 2024/02/23

リンク

画像生成AI「Stable Diffusion」の基本から最新テクニックまで。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ（第5回）参加者募集 | テクノエッジ TechnoEdge

テクノエッジ編集部では、生成AIグラビア実践ワークショップ第5回を開催します。講師は、人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる？」の著者である西川和久さんです。高価なゲーミングPCがなくても自分で高速な画像生成ができるサービス「生成AI GO」を無料で使いながら、生成AIに関する知見とグラビアカメラマンとしての豊かな経験から得られた最新かつ実践的なテクニックを学べます。なお、ワークショップ内で使用するプロンプトは、受講者向けにドキュメントとして公開し、その場でコピペするだけで画像生成を体験できる、非常に簡単な仕組み。生成した画像はその場で自分のパソコンに保存できます。第5回は、2月27日、オンラインにて開催いたします。なお、今回お申し込みいただいた方は、第4回の動画アーカイブを視聴いただけます。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ申

shion214 2024/02/20

リンク

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか | テクノエッジ TechnoEdge

shion214 2024/02/18

リンク

クラウドストレージ「楽天ドライブ」国内で本格提供開始無料10GB、月800円で1TB | テクノエッジ TechnoEdge

楽天モバイル傘下の楽天シンフォニーは2月6日、クラウドストレージサービス「楽天ドライブ」を日本国内で本格的に提供開始すると発表しました。楽天ドライブは、2019年に「Sendy」としてサービスを開始。2021年にSendyを運営する韓国のスタートアップ企業Estmob（イストモブ）を楽天モバイルが買収・子会社化していました。 Estmobはその後、楽天モバイルで培ったネットワーク技術をグローバル展開する楽天シンフォニー傘下として社名をRakuten Symphony Koreaに改称。楽天ドライブのグローバルな運営主体はRakuten Symphony Koreaで、日本国内での販売・マーケティングを楽天シンフォニーが行います。なお、今回の発表はあくまでも日本国内で本格的に展開を開始するというもので、モバイルアプリを含め、1年前にはすでに楽天モバイルに改名されていました。その楽天モバ

shion214 2024/02/08

リンク

Adobe Creative Cloud個人版が3月5日に値上げ、コンプリートプラン一括払いで約2割増の年額8万6880円に。生成AIなどの機能向上と為替レートを反映 | テクノエッジ TechnoEdge

Adobeは2月4日、Creative Cloud個人版プランを3月5日から値上げすると発表しました。Creative Cloudの日本での値上げは2022年4月以来の約2年ぶり。海外では2023年11月にも値上げが実施されていましたが、その際は日本は対象外でした。今回の値上げは、その海外での値上げを日本にも反映させるものとなっています。コンプリートプランの価格改定は下記の通り。年間プラン月々払い：　月額 6480 円から月額 7780 円月々プラン月々払い：　月額 1万280 円から月額 1万2380 円年間プラン一括払い：　年額 7万2336 円から年額 8万6880 円値上げの対象となるのは、コンプリートプランのほか、単体プランやフォトプラン（20GB、1TB）など多岐に渡ります。値上げの理由については、生成AI機能の追加など、機能強化による付加価値向上があげられていま

shion214 2024/02/07

リンク

NASA、静音超音速実験機「X-59 Quesst」を正式公開。ソニックブーム大幅軽減で「商用超音速飛行禁止」解除目指す | テクノエッジ TechnoEdge

ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 NASAとロッキード・マーティンは1月12日に静音超音速実験機「X-59 Quesst」を正式に発表しました。NASAの副長官で元宇宙飛行士のパメラ・メルロイ氏は「X-59は、私たちの旅のあり方を変え、移動をより近く、短時間にしてくれるでしょう」と述べています。現在、米国上空では商用超音速飛行が禁止されていますが、NASAの最新の実験用航空機であるX-59は、これを再検討するのに役立つデータを取得、提供することに重点を置いています。全長約30mのうち約1/3が非常に伸びた先端を持つ機首部分という特異な形状により、音速の1.4倍（マッハ1.4）に達するという最高速度での飛行時にも、衝撃波の発生を大きく軽減しま

shion214 2024/01/16

リンク

OpenAIがGPT Store開設、早速「SEOブログ記事自動生成」「AI検出回避に人間らしく加工」等が人気。レベニューシェア収益化も | テクノエッジ TechnoEdge

OpenAIが、かねてから予告していたGPT Store をようやく開設しました。個人や企業が作ったカスタム版ChatGPTであるGPTsを分野ごとにブラウズ・検索して利用でき、自分が作ったGPTを公開することもできます。現状では有料プランのChatGPT Plus加入ユーザーのみ、メニューの「Explore GPTs」から利用可能です。ストアといっても利用に別途料金が必要なGPTsは今のところありませんが※、OpenAIは今四半期のうちにも、GPTsが利用された回数に応じて制作者に収益を分配するレベニューシェアを開始予定です。 (※ サードパーティーと接続したGPTsなどでは、チャットの過程で有料サービスに案内されることはあります。) 開設されたばかりのGPT Store でトップにフィーチャーされているのは、 AllTrails 世界中のトレッキングコースやアウトドア体験を場所・

shion214 2024/01/12

リンク

AIで作曲して演奏・歌唱してくれる「Suno」、MIDIで吐いてくれPleaseとお嘆きの方に。無料のもあるよ（CloseBox） | テクノエッジ TechnoEdge

歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」。音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。いい感じの音楽が出るまでガチャを引けばいいのですが、Sunoを効率化のために使いたい、アイデア出しのために利用したいんだけど、出力された音楽をいちいち手弾きで入力するのもだるい、という話です。今回はこの解決策をご紹介しようと思います。詳しい人ならご承知のことと思いますが、改めて。以前のコラムで紹介したように、例えばLogic ProのFlexPitchのようなピッチエディターを使えば、単音のオーディオファイルからMIDIデータを取り出すことは可能です。実際、筆者はUVR5という音源分離ツールを使って取り出したBassトラックをFlexPitchによってピアノロール表示し、それを改めてMIDIデータとして打ち込むというのをやっ

shion214 2023/12/22

リンク

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」　アリババらが開発話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」　話し方や感情なども忠実に再現リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」写真から3D

shion214 2023/12/05

リンク

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第22回目は、AIが不得意とする指の数を修正する技術やStability AIの動画生成モデルなど、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップ人間が話すような音声合成でテキストを読み上げるTTSモデル「StyleTTS 2」　コロンビア大の研究者ら開発 Stability AI、画像から動画を生成するモデル「Stable Video Diffusion」発表画像と動画を同時に扱う大規模視覚言語モデル「Video-LLaVA」　北京大などが開発テキストから3Dモデルを生成する新型モデル「LucidDreamer」他に影響を与えず表情や年齢

shion214 2023/11/28

リンク

マイクロソフト、OpenAIと元OpenAIの両方を手に入れる。OpenAI創業者のアルトマン氏は、マイクロソフトの新しいAI研究チームトップに | テクノエッジ TechnoEdge

アルトマン氏だけでなく、グレッグ・ブロックマン氏、さらには主要なエンジニアが次々と退社を表明する中、寝耳に水だったとされるマイクロソフトらステークホルダーによる圧力で、取締役会はアルトマン氏らと話し合いをもったものの、同氏の復帰はなりませんでした。しかし、この件を告げるThe Informationらの報道があった11月20日に、マイクロソフトのナデラCEOが続報をXに投稿。新体制のOpenAIとのパートナーシップは継続する一方で、アルトマン氏は同じくOpenAIを退社したグレッグ・ブロックマン氏らとともにマイクロソフトの新しいAI研究チームを率い、マイクロソフトはそのために必要なリソースを提供する、という内容です。アルトマン氏はこれに対し、「使命は続く」とリプライ。マイクロソフトは、OpenAIとの関係を継続する一方で、アルトマン氏と一緒にOpenAIを退社した人材をも自社に抱えると

shion214 2023/11/21

リンク

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第19回目は、人気の文字起こしソフト「Whisper」の高速化版、スマホでできるAIボイチェン、プレッシャーをかける感情付きプロンプトをはじめとする、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップOpenAIの文字起こし AI「Whisper」を軽量かつ高速にするモデル「Distil-Whisper」　Hugging Faceが開発 3.2兆以上のトークンで学習された、130億のパラメータを持つオープン大規模言語モデル「Skywork」テキストや画像から高品質な動画を生成するオープンソースモデル「VideoCrafter1」　中国テンセント含む研

shion214 2023/11/07

リンク

朝日新聞社の校正支援サービス「Typoless」を試す（西田宗千佳） | テクノエッジ TechnoEdge

1971年福井県生まれ。得意ジャンルは、パソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。打ち間違い・変換ミスのことを「typo」ということがある。 typoは英語でタイプミスを示す俗語で、typeのeをoと打ち間違う……という話に由来する。冷静にキー配列を考えるとeとoはあんまり打ち間違えないようにも思うが、それはそれとして、だ。ライターの仕事はtypoとの戦いだ。理由はいくつかある。・本来間違えていてはいけない・文書の生産量が多いのでtypo混入の可能性もその分上がる・スピードが必要なのでtypoしやすさも上がる・その割にうっかりしがち書籍などのように何回も、複数人の手を経るものならtypoは減らしやすいのだが、日々の作業だとtypoをゼロにするのは難しい。というわけで今回は、typoを減らすツ

shion214 2023/11/06

リンク

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した（CloseBox） | テクノエッジ TechnoEdge

わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

shion214 2023/10/27

リンク

「世界初の公式Unityユーザーグループ」が活動終了へ「信頼は完全に失われた」 | テクノエッジ TechnoEdge

ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 2010年に設立された「世界初の公式Unityユーザーグループ」ことBoston Unity Group（BUG）は、「会社に対する信頼を完全に失った」として最後のオンラインミーティングを開催すると発表しました。これをもってBUGは解散することになる模様です。これは先週、このゲームエンジンを使用する開発者らの間に騒ぎを引きおこした料金体系改革に続いての動きであり、Unityはその後新料金体系の一部分を緩和する変更をすると述べました。しかし、いまでも多くの開発者が、やはりこのエンジンを敬遠する姿勢を見せています。 BUGはコミュニティへの声明文のなかで、「残念なことに、数年前からUnityの関心はゲーム業界か

shion214 2023/09/28

リンク

Photoshopに心から感謝を。生成AI「Firefly」が大事な1枚の写真を甦らせてくれました（CloseBox） | テクノエッジ TechnoEdge

Adobe Fireflyは、アドビが誇る画像生成AI 技術です。まずPhotoshopのベータ版に導入されましたが、先ごろ、Photoshopの正式版でも使えるようになり、「Adobe Firefly web版」も提供開始されました。筆者はこの技術をいち早く使うため、Adobe Creative Cloudにお布施を始めました。Photoshopベータ版での生成塗りつぶし・生成拡張を体験するためです。この技術を使って1枚の写真を救出することに成功したので、報告したいと思います。救いたかった写真はこちらです。 1981年ごろに撮影された妻の学生時代の写真。表情は素晴らしいのに、顔の上半分が欠けてしまっているのです。これだけのいい笑顔の写真はそれほど多く残っていません。ぜひ、これの完全版を見てみたい。見えていない部分をAIで拡張する技術を提供しているのはアドビだけではありませんが、Ph

shion214 2023/09/19

リンク

はてなブックマーク

タグ

ブックマーク / www.techno-edge.net (80)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス