[B! ai] YaSuYuKiのブックマーク

ロボットを根本から変えるLLM技術「Transformer」の威力

今、AI（人工知能）によりロボットの世界が様変わりしようとしている。人間は五感を使って周囲の環境を認識し、行動する。同様にロボットも、外部環境と適切にインタラクションするために、視覚、聴覚、触覚など複数の感覚器を使って、異なる種類のデータ、すなわちマルチモーダルなデータを統合的に処理し、動作を生成する能力が必要になってくる。環境の認識から動作の生成までを扱うEnd-to-End モデル従来のロボットは感覚器ごとに処理が異なり、動作の生成も感覚器の処理とは独立していた。ところが近年のAI、特に大規模言語モデル（LLM：Large Language Model）の中核をなす「Transf ormer」は、単体でマルチモーダルなデータの扱いを可能にした。それだけではない。同じTransf ormerモデルによって複雑な動作も生成できるようになってきた。これは、環境の認識から動作の生成までを1つ

YaSuYuKi 2024/09/03

感覚的な推測だが、言語を持たない動物は言語より負荷の軽いモデルで処理しているので(人間でも動作を言語的に思考している方が少ない)、動作の制御に関してはより軽い「モデル」がいずれ登場するだろう

robot
ai

リンク

「オープンソースAI」問題ついに決着、OSIが定義を発表

これまで明確な定義がなかった「オープンソースAI」の定義をオープンソース・イニシアティブ（OSI）が発表した。テック企業が「オープンソース」という言葉を都合よく使っているとの批判への回答となるか。 by James O'Donnell2024.08.26 10 この記事の3つのポイントオープンソースAIの定義がOSIにより発表された定義はAIモデルの使用、検査、修正、共有の自由を規定している訓練データの透明性については意見の相違があり折衷案となった summarized by Claude 3 オープンソースAIは現在、至る所に存在する。問題は、実際のところそれが何なのかということについて、意見が一致していないことだ。今、私たちはようやくその答えを得られたかもしれない。オープンソースであることの意味の裁定者を自任するオープンソース・イニシアティブ（OSI）が、新しい定義を発表したのだ

YaSuYuKi 2024/08/26

リンク

Meta、コード最適化のためのAIモデル「LLM Compiler」を商用ライセンスで公開

米Metaは6月27日（現地時間）、コード最適化のためのLLMモデル「Meta Large Language Model Compiler」（以下「LLM Compiler」）を発表した。特別な商用ライセンスの下でリリースしており、Hugging Faceでダウンロードできる。70億パラメータと130億パラメータの2サイズ構成だ。 LLM Compilerは、研究者や開発者がコードの最適化とコンパイラの最適化をさらに研究開発するための、スケーラブルで費用対効果の高い基盤を確立することを目指しているという。このモデルを利用することで、コードサイズを大幅に削減したり、プログラムの実行速度を向上させることができるとしている。従来のコード最適化手法は、手作業で設計された特徴やグラフニューラルネットワークに依存しており、プログラムの表現が不完全だが、LLM Compilerは「ソースプログラムを完

YaSuYuKi 2024/06/29

ai

リンク

【大原雄介の半導体業界こぼれ話】生成AIのバブルはいつ弾ける？

YaSuYuKi 2024/06/27

過剰に上昇した株価という点ではいずれ調整局面に入るだろうが、生成AIはすでに実用品なので、潰えることはない。株価調整がドットコムバブル並みになるかは、私にはわからない

ai

リンク

OpenAIの投資計画はアポロ計画の70倍？加速し膨張するAI開発投資、バブルの懸念も：朝日新聞GLOBE＋

AI開発企業が抱えるもうひとつの課題は、AI開発投資が極端なまでに大規模化しつつあることだ。OpenAIやマイクロソフトのようなAI開発企業は、今後数年の間に、AI関連の開発投資を「1000億ドル（約15兆6000億円）」あるいは「7兆ドル（約1092兆円）」と極端な規模へと拡大する野望を抱いている。現状のAIの100倍、あるいはそれ以上の規模のAIを作り出すためだ。大規模投資計画は現状の100倍以上 2024年2月、AI開発企業OpenAIのCEOであるサム・アルトマンが、AI向け半導体の増産とAIデータセンター増強のために実に5兆〜7兆ドル（780兆〜1092兆円相当）の資金を集めていると経済紙ウォールストリート・ジャーナルが報じた。アラブ首長国連邦（UAE）政府、ソフトバンクの孫正義CEO、台湾の半導体メーカーTSMCと話し合いをしているという。この7兆ドルという数字は誇大妄想と

YaSuYuKi 2024/06/20

目標と、解決する課題の定義が曖昧、という指摘は重要。何が実現されるのか不明確なので、成否の基準も明確でない

ai

リンク

【西川和久の不定期コラム】初心者も簡単！ついにPCで104BのLLMも動かせるようになった！そして巷を騒がせるマルチモーダルも試した

YaSuYuKi 2024/05/30

pc
ai

リンク

｢スペースXはAIを使っていない｣…イーロン・マスク、宇宙開発分野でのAI活用を語る

スペースXは｢基本的にAIを使っていない｣とイーロン・マスクが明かした。スペースXのCEOであるマスクは、AIを使うことには前向きだが、まだ使い道は見つかっていないと語った。｢まだ道のりは長い｣と彼は話している。イーロン・マスク（Elon Musk）は映画｢2001年宇宙の旅｣をすぐに再現するつもりはない。 2024年5月6日に開催された第27回ミルケン研究所グローバルカンファレンス（Milken Institute Global Conference）で登壇したマスクは、講演のかなりの部分を人工知能（AI）の称賛に費やした。人間の日常生活においてAIが果たす役割について質問された場面では、｢真実を追求する｣AIは、｢人類の文明を発展させる｣可能性があると述べた。しかし、AIが宇宙開発におけるマスクの取り組みを｢加速｣させることができるかどうかを尋ねられると、彼はこの技術にそれほど

YaSuYuKi 2024/05/14

リンク

AIの新星ニューラルネットワーク「KAN」とは？　LLMが“カンニング”して評価を盛ってた？　など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第45回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ高精度なニューラルネットワーク・アーキテクチャ「KAN」をMITなどの研究者らが開発 1手先のトークン予測ではなく、4手先のトークンを同時に予測するモデルをMetaなどが開発医療分野に特化したマルチモーダル大規模言語モデル「Med-Gemini」をGoogleが開発大規模言語モデルが答えに相当するベンチマークを事前に学習し、高い評価を出していた？　AIカンニング問題を指摘した研究一貫性の高い長編ビデオをテキストから生成するAIモデル「StoryDiffusion」高精度なニューラ

YaSuYuKi 2024/05/07

リンク

Google Geminiアプリが日本でも利用可能に

YaSuYuKi 2024/05/02

google
ai

リンク

マイクロソフトのＡＩツール､Copilotがもたらすコーダーの働き方改革

A pedestrian walks past the GitHub Inc. offices in San Francisco, California, U.S., on Monday, June 4, 2018. Photographer: Michael Short/Bloomberg ソフトウエア開発者のニコライ・アフテニーブ氏は2021年、米マイクロソフトが提供するコーディングアシスタント「Copilot（コパイロット）」のプレビュー版を手にし、すぐにその可能性を実感した。マイクロソフトのコーディングプラットフォーム「GitHub（ギットハブ）」で開発され、米オープンＡＩが提供する生成ＡＩ（人工知能）をベースにしたCopilotは、完璧ではなく、時には間違えることもあった。しかしチケット販売会社スタブハブで働くアフテニーブ氏は、わずかなプロンプトで見事にコード行を完成させたこと

YaSuYuKi 2024/04/20

未来に渡って現在の水準なわけがないので、使いながら様子を見ている。イラストは見ているだけだが、品質は完全に変わって限定的に実用可能な水準になったし

リンク

1bit LLM の時代は来るのか，来ないのか，どっちなんだい？｜情報処理学会・学会誌「情報処理」

徳永拓之（LeapMind（株）） 1bit LLMの時代が来る？　2024 年2 月，The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits¹⁾ というタイトルの論文がarXiv上で公開され，にわかに話題となりました．“1.58 Bits” という表現はあまりなじみがありませんが，log₂(3) = 1.58 . . . ということで，パラメーターを三値にした場合の情報量を示しているようです．この論文（以下b1.58 論文とする）は，同じ著者グループによる文献2）を少し拡張したもので，大規模言語モデル（LLM）の効率化についての研究です．本稿の前半ではこれらの論文の主張を解説し，後半ではその主張の妥当性について検討します．なお，これらの2本の論文は，本稿執筆時点では，査読を経たものではありませんのでご注意くだ

YaSuYuKi 2024/04/05

ai

リンク

MicrosoftとOpenAIがAI用に17兆円規模のデータセンター建設を計画中。日本の防衛費の2倍以上に相当

MicrosoftとOpenAIがAIに特化した巨大データセンター構築を計画。数百万台のGPUを搭載し、コストは17兆円規模 MicrosoftとOpenAIではAIにオールインしており、OpenAIでは最近は動画を生成できるSoraや、15秒の音声サンプルから音声合成するVoice Engineなど次々と発表しています。ただ、AIの動作には莫大な数のGPUが必要で、Soraが普及した際にはNVIDIA Hopper H100が72万台必要になると言う試算もあります。そのため、MicrosoftとOpenAIではGPUを数百万台搭載した『Stargate』と呼ばれるプロジェクトの検討をしており、そのデータセンターは米国に設置される予定です。 Stargateプロジェクトは現在運用されているデータセンターに対して100倍以上のコストがかかると見られており、総費用は1150億ドル、日本円で1

YaSuYuKi 2024/03/31

複数年に渡る投資としてなら現実に可能な数値

microsoft
ai

リンク

速報：話題の 1ビットLLMとは何か？｜寺田英雄（㈱オープンストリームCTO）

2024-02-27にarXiv公開され，昨日（2024-02-28）あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「１ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c

YaSuYuKi 2024/03/02

ai

リンク

作業を依頼→Copilotが手順を考え、Windowsデスクトップで“自動RPA”　Windows 11に新機能「Power Automate via Copilot in Windows」

この記事は新野淳一氏のブログ「Publickey」に掲載された「マイクロソフト、Copilotに作業を依頼するとユーザーに代わって手順を考え、Windows デスクトップ上でRPAにより自動操作してくれる新機能「Power Automate via Copilot in Windows」、Windows 11に搭載へ」（2024年2月28日掲載）を、ITmedia NEWS編集部で一部編集し、転載したものです。米Microsoftは、Windowsに搭載している「Copilot in Windows」の新機能として、Copilotにプロンプトで作業を依頼することで、Windows上でさまざまな操作をユーザーに代わって自動的に実行してくれる「Power Automate via Copilot in Windows」を、開発中のWindows 11 Insider Preview Build

YaSuYuKi 2024/02/28

時間はかかるだろうが、本質的な変化の始まり

windows
ai

リンク

【AI動画生成】Sora 要素技術解説

もう全部OpenAIでいいんじゃないかなはじめに月間技術革新です。ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。原文を見たい方はこちらからどうぞ全体構成 Soraは以下の技術要素で構成されているとのこと

YaSuYuKi 2024/02/18

ai

リンク

AIにプログラミング作業を奪われている - k0kubun's blog

せっかく10年以上かけて学んだプログラミングだが、人間がコード書くよりChatGPTにやらせた方が早いなということが度々あり、だんだん自分でプログラミングをやる時間が減ってきた。AIにコードを書かせてそれをGitHubにコピペして残りの時間は遊んでるだけで成果が出てお給料ももらえる日は近いし、段々会社もそのことがわかってきて失職する日も近い。残念ながら現時点では全ての仕事がAIで上手くいくわけではないが、どういう時に使えるかを知っておくと楽をしやすくなるので、僕がどう使っているかをまとめておく。失職できるケース簡単なスクリプトを高速に書かせる僕はRubyが全ての言語の中で一番慣れており、StackOverflowやドキュメントをほぼ見ずに大抵のプログラムを書き切れるため、Rubyを書いている時がプログラマとして一番生産性が高いのだが、それでも最近AIにRubyを書かせたことがあった

YaSuYuKi 2024/01/20

ai

リンク

Steam、AI技術を使用したゲームの大半がリリース可能に

YaSuYuKi 2024/01/13

game
ai

リンク

NTT、軽量で高機能な大規模言語モデル「tsuzumi」を発表。来年3月にサービス開始

YaSuYuKi 2023/11/01

ai

リンク

Microsoftはコード補完AIツール「GitHub Copilot」でユーザー1人あたり月額3000円近くの損失を出しているという報告

Microsoftが2021年に発表したコード補完AIツール「GitHub Copilot」は、2022年に月額10ドル(約1500円)または年額100ドル(約1万5000円)で利用可能な有料サービスとして提供が開始されました。ところが、経済紙のウォール・ストリート・ジャーナルが発表したレポートによると、MicrosoftはGitHub Copilotのユーザー1人あたり月額20ドル(約3000円)近くの損失を出しているとのことです。 Big Tech Struggles to Turn AI Hype Into Profits - WSJ https://www.wsj.com/tech/ai/ais-costly-buildup-could-make-early-products-a-hard-sell-bdd29b9f Report: GitHub Copilot Loses an

YaSuYuKi 2023/10/11

リンク

GitHub・服部氏が語る「GitHub Copilot」の裏側　“エンジニアの開発生産性を上げる”ために重視している2つのポイント

「GitHub Copilot」の真のパワーについて発表したのは、GitHub社の服部佑樹氏。株式会社タイミー社が主催した「GitHub Copilotで拓く開発生産性」で「GitHub Copilot」の実装やプラクティスについて話しました。全2回。前半は、「GitHub Copilot」が目指す“開発者の生産性向上”と「Copilot Voice」「GitHub Copilot for *Your* Codebase」について。 ※本記事の内容は2023/08/30時点のものです。GitHub Copilotの実装は、今後変更される可能性があります。最新情報はドキュメントをご覧ください。開発者の生産性向上にフォーカスする「GitHub Copilot」服部佑樹氏：ギットハブ社の服部です。本日は、「開発生産性をあげるGitHub Copilotを徹底解剖！」というところで、ちょっと裏

YaSuYuKi 2023/10/07

リンク

はてなブックマーク

タグ

関連タグで絞り込む (46)

aiに関するYaSuYuKiのブックマーク (162)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス