世界では今、インプットされたデータから文章や画像などを自動で作り出す「生成AI」の技術が急速に進化しています。こうした中、中国では「生成AI」を使って亡くなった人を「復活」させるビジネスが登場し、論争を…
もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと
Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成) 画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画
ChatGPTが思いがけずいろいろなことを人間より賢くやっているのを見てシンギュラリティという言葉を使う人が増えたように思いますが、逆に、シンギュラリティは来ないのではという思いを強くしています。 まず、この文章でのシンギュラリティがなにかという話ですが、レイ・カーツワイルが「シンギュラリティは近い」の1章の終わりで「さあ、これが特異点だ」といっている特異点、そのシンギュラリティです。 シンギュラリティは近い―人類が生命を超越するとき 作者:レイ・カーツワイルNHK出版Amazon この特異点は単にAIが人間より賢くなるというだけではありません。人間より賢くなるだけだと、便利な道具が増えるだけなので、大騒ぎするほどの変化は起きません。人の仕事を奪うといっても、蒸気機関ほどでもないですね。印刷機などと並んで、人の生活を変える転換点にすぎず、ただひとつの点をあらわすシンギュラリティには なりま
おいおいまたかよ、驚き屋かお前はと言われそうですが、またゲームチェンジャーなんですよ。ほんとすいません。全部AIが悪いんです。 AI関連はちょっと目を離すと取り残されてしまいます。後から来たのに追い越され、泣くのが嫌なら歩いていくしかないのです。今回、それが再びAI音声合成で起きました。 筆者はAIアートグランプリを受賞したおかげでいろいろなところから取材を受けたり自分でも解説記事を書いたりしていますが、その中で、Diffusion(拡散)モデルを使ったDiff-SVCというAI声質変換によってリアルな元音声を再現できると説明してきました。ですが、これからは「実は今は新しいAI技術を使っているんですよ」と付け加えなければいけません。 妻の歌声を合成するのに使っていたDiff-SVCから別の新しい技術に乗り換えてしまったのです。 Diff-SVCが出た後に、So-VITS-SVC(SoftV
サイト「みんなの自動翻訳@TexTra」より 英文などを自動翻訳したいとき、アメリカのグーグルが開発した「Google翻訳」を利用するという人は多いだろうが、今は、世界一高精度な自動翻訳ツールはドイツのDeepL GmbHが開発した「DeepL」だといわれている。 だが、日本が開発したある自動翻訳ツールもかなり優秀だという。6月にあるTwitterユーザーが呟いた投稿が多くの“いいね!”を集めるなど話題を呼んでいた。それによると、無料の「みんなの自動翻訳@TexTra(テキストラ)」(以下、TexTra)という自動翻訳サイトがDeepLに勝るとも劣らない性能を誇り、しかも開発したのは日本の国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー))なのだという。 しかし、このツイートで注目を集めたTexTraだが、DeepLの1日の閲覧数が数百万回といわれているのに対し、TexTra
さまざまな電子機器に使われる「ネオジム磁石」と呼ばれる強い磁石を、人工知能=AIを使って製造の条件を改良し、さらに強い磁石を作り出すことに物質・材料研究機構が成功し、AIを使った材料開発の事例として注目されています。 「ネオジム磁石」は、小さくても強い磁力を持つことからスマートフォンや電気自動車、それにエアコンなどさまざまな電子機器に使われている重要な部品です。 物質・材料研究機構の佐々木泰祐主幹研究員などの研究グループは、製造の際のデータをAIに学習させ、強い磁石にするために必要な要素を検討させました。 その結果、製造装置から磁石を押し出す際の温度と圧力が磁石の性能に重要であることが分かり、製造条件を改良しておよそ1.5倍強いネオジム磁石ができたということです。 AIを使って材料開発を行うことは「マテリアルズ・インフォマティクス」と呼ばれて近年、研究開発が加速していて、今回の成果もこうし
コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕
ウチューじん・ささき @uchujin17 攻撃的機械学習 Adversarial Machine Learning (AML)なんて用語が出来ていたのか。そしてAMLに対抗すべくCounter-AML AIが導入されているという。「敵は海賊」の世界はもう現実になっていたんだな。 リンク Wikipedia Adversarial machine learning Adversarial machine learning is a machine learning technique that attempts to fool models by supplying deceptive input. The most common reason is to cause a malfunction in a machine learning model. Most machine learn
計算機科学の分野において功績を収めた人物に贈られるチューリング賞を2018年に受賞した、Facebookの人工知能部門におけるチーフ研究者、ヤン・ルカン氏は、人工知能および機械学習における人種差別の議論で多くの非難を受け、Twitterアカウントを停止することを発表しました。 Yann LeCun Quits Twitter Amid Acrimonious Exchanges on AI Bias | Synced https://syncedreview.com/2020/06/30/yann-lecun-quits-twitter-amid-acrimonious-exchanges-on-ai-bias/ きっかけは2020年6月20日に、デューク大学が人工知能アルゴリズムを用いた高品質の画像生成に関する研究結果をTwitter上で公表したことから始まりました。 Face Depi
PCやスマホの画像を拡大すると、それまでのくっきりとした線がぼやけてしまう。拡大すればするほどに解像度は荒くなりぼやけてしまうのだ。 まるでモザイクがかかってしまったように不鮮明な画像を鮮明に見たい。そう願うあなたに朗報だ。人工知能型画像スケーリングプログラム「エンハンスネット(EnhanceNet)」が開発されたようだ。これでもう不鮮明な画像に歯がゆい思いをしなくて済む。 AI(人工知能)で低解像度の画像を鮮明に エンハンスネットはギザギザとしたドット絵のような鳥の低解像度写真を、くっきりとした画像に変換することができる。 この画像を大きなサイズで見るimage credit:arxiv 前景の小枝を見れば分かるように、なんと元の写真からカメラの被写界深度まで復元してくれる。 開発したのは独マックス・プランク知的システム研究所の研究者だ。彼らはこのプログラムについて「自動テクスチャ合成に
4月10日の日経ITproの記事「 AIベンチャーの雄が総務省の開発指針に反対する理由」で、総務省主導で推進されているAIネットワーク社会推進会議とその開発原則分科会からPFNが離脱したことを、取り上げていただきました。私とのとりとめのないインタビューを適切にまとめてくださった日経ITpro浅川記者に深く感謝いたします。また、その記事に対して、はてなブックマーク、NewsPicks、FacebookなどのSNSを通して多くのコメントを下さった方にも感謝の意を表します。ありがとうございます。離脱の理由は記事にある通りですが、総務省の方々も私達の立場を真摯に受け止めてくださっていて、実りのある議論を続けてくださっています。その上で、今後の議論を深めるために、いくつかの点について補足したいと思います。 汎用人工知能と特化型人工知能 現在、人工知能という言葉は大雑把には、 汎用人工知能(「強い」人
「ロボットは東大に入れるか」プロジェクトでぶつかった「ある疑問」国立情報学研究所(NII)の社会共有知研究センター。 「ロボットは東大に入れるか(東ロボ)」プロジェクトで知られる人工知能(AI)の研究チームが、子どもたちの読解力テストに着手した。 なぜ、AI研究者が「読解力」に関心をもつのか。 そこには、AIの限界を探る研究の過程でぶつかった、ある疑問が関係している。 センター長の数学者・新井紀子さんに話を聞いた。 今日(11月14日)の「東ロボ 2016成果報告会」で冒頭あいさつする新井紀子教授。東ロボプロジェクトは2011年にスタートしたAIは国語が苦手――なぜ、AI研究者が「読解力」に関心を? 東ロボは、問題を解き、正解も出すが、読んで理解しているわけではない。 現段階のAIにとって、文章の意味を理解することは、不可能に近い。 そうすると、特に難しいのが国語と英語だ。 国語では、20
三菱電機は10月7日、データの特徴を学習して推論処理を行う「ディープラーニング」を自動設計する「ディープラーニング自動設計アルゴリズム」を開発したと発表した。専門知識がなくても、ディープラーニングを活用した人工知能(AI)を短時間・低コストで企業システムなどに導入できるとしている。 学習データがあれば、独自のアルゴリズムでディープラーニングを自動設計できる。学習データの中から特徴的なデータのみを重複なく抽出することで効率的に適切なネットワークを構築できるという。機器のシステムに依存しないため、使用環境に合わせた高度な推論処理が可能だとしている。 従来、企業システムにディープラーニングを導入するには、AIの専門家に依頼して設計してもらう必要があったが、このアルゴリズムを使えば、企業内のシステム専門家だけで設計でき、AI専門家に依頼する必要がないという。専門家に依頼した場合は数日~数週間かかっ
技術の進化が著しい「ディープラーニング」を使うことで、著名な画家の作風を認識し、別の映像をそのテイストに変換してしまうというアルゴリズムの開発が進められています。ドイツ・フライブルク大学コンピューターサイエンス学部のManuel Ruder氏らによる研究で行われた実際の変換の様子がムービーで公開されているのですが、その様子は驚きを禁じ得ないレベルに達しています。 Supplementary video for "Artistic style transfer for videos" - YouTube このアルゴリズムは、コンピューターサイエンティストのLeon A. Gatys氏らが2015年に発表していた論文の内容をさらに発展させたもので、素材となる映像に著名な画家の作風を反映させることができます。例えば、CGアニメ映画「アイス・エイジ」に、ゴッホの作品「星月夜」のテイストを掛け合わせ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く