最近の人工知能(AI)業界では音声生成AIモデルが広く注目を集めており、OpenAIも自社の新たな音声生成モデル「Voice Engine」を発表している。Stable AIもその流れに乗り、最新の音声生成モデルを公開した。 画像生成AIモデル「Stable Diffusion」で一躍有名になったオープンソースAI企業であるStability AIは米国時間4月3日、「Stable Audio 2.0」を発表した。この新モデルは、同社の前モデルである「Stable Audio 1.0」を大幅にアップグレードしたもので、テキスト以外の情報から曲やサウンドを生成する機能も追加されている。 Stable Audio 2.0は、音声から音声を生成する機能を持っており、ユーザーは音声のサンプルをアップロードして、自然言語のプロンプトを使ってさまざまな曲やサウンドを作成できる。またスタイル転換機能を使
こんにちは、Technology部のジョシュです。 今日は、最近バズっている生成AIモデル「Claude 3」と「GPT-4」を比べてみましょう! 生成AIが絶え間なく進化し続けるなかで、2024年3月に登場したAnthropic社の大規模言語モデルClaude 3。OpenAI社のGPT-4と比較され、多くの議論を呼び起こしています。 この記事ではこれら2つのモデルを深掘りし、それぞれの特徴、能力、そして生成したコードの結果を比較しながらご紹介します。生成AIのトレンドを知りたい方やAI開発に関心を持つ方々のご参考になれば幸いです。 GPT-4とClaude 3の概要 OpenAI社が開発した言語モデルGPT-4は生成AIを広めたモデルとして非常に有名で、様々なタスクをこなす能力があります。そんな中で3月に登場したAnthropic社のClaude 3は、いくつかの分野ではGPT-4を上
ここ数年、製造業では「ロボティクス」「AI」「IoT」「デジタルツイン」「メタバース」「データ連携」など、あらゆる技術コンセプトの重要性が語られてきた。そのたびに、企業はその活用方法を模索し、ビジネスに取り入れてきたが、最近そうした取り組みのすべてを加速させる“強力な武器”として「生成AIの活用」に注目が集まっている。本記事では、産業領域における生成AIの活用方法を3つのモデルに分類しつつ、各モデルの中から面白い事例を紹介する。自社の生成AI活用はどのモデルに当てはまるだろうか。 株式会社d-strategy,inc 代表取締役CEO、東京国際大学 データサイエンス研究所 特任准教授 日立製作所、デロイトトーマツコンサルティング、野村総合研究所、産業革新投資機構 JIC-ベンチャーグロースインベストメンツを経て現職。2024年4月より東京国際大学データサイエンス研究所の特任准教授としてサプ
AIの発達はさまざまな分野で人間の生活を快適にしてくれますが、その一方で「人間の仕事がAIに奪われてしまうのではないか」という懸念が浮上しています。労働市場分析企業のBloomberryが、世界最大級のフリーランスプラットフォームであるUpworkのデータを基にして、「ChatGPTなどの生成AIが登場したことで悪影響を受けた仕事」について分析しています。 The jobs being replaced by AI - an analysis of 5M freelancing jobs - bloomberry https://bloomberry.com/i-analyzed-5m-freelancing-jobs-to-see-what-jobs-are-being-replaced-by-ai/ Bloomberryは、ChatGPTがリリースされる1カ月前の2022年11月1日か
顧客フィードバックの内容に詳しい現役従業員の証言によれば、マイクロソフト(Microsoft)のAIアシスタント「Copilot(コパイロット)」に対する不満の声で最も多いものの一つは、OpenAIの対話型AI「ChatGPT」に性能面で劣り、十分機能しないことだ。 「初めてCopilotを利用したお客さまは例外なく、ChatGPT(の使用体験)と比較して、『どちらも同じ技術(大規模言語モデル)がベースなんだよね?』とおっしゃるのです」 ChatGPTを開発したOpenAIは、マイクロソフトのCopilotを初めて使用する顧客の期待(する性能水準)を比較的高めに見積もっている。 その高い期待を満たすことで初めて、AI業界全体として、無料のコンシューマー(消費者)向けチャットボットからより付加価値の高いアシスタントやエージェントなど有料製品への移行を実現できると考えているからだ。 一方、マイ
OpenAIは3月29日(現地時間)、少ない音声サンプルから合成音声を生成できるAIモデル「Voice Engine」について技術的な詳細を発表した。 Voice Engineは入力されたテキストから自然な発話音声を生成できるAIモデル。サンプルとして与えられた人間の声を自然な発音でまねることができ、学習に必要な音声サンプルの長さも15秒程度で済む。 サンプルデータに含まれていない言語の音声も生成可能だが、元の言語のアクセントの癖はそのまま保持される。例えば、フランス語話者の音声サンプルを基に英語の音声を生成すると、フランス語のアクセントをもった英語音声が出力されるといった具合だ。 Voice Engineは2022年後半に開発された技術で、すでに「ext-to-Speech API」や「ChatGPT Voice」といった同社のサービスに活用されているほか、2023年末からは信頼できる一
各企業のデータに合わせて、生成AIに「人間と同等の推論力」を構築。 オールインワンの高性能 SaaSとして提供します
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く