「お好みソース」で広く知られるオタフクソース(広島市)は、AI(人工知能)を活用してソースづくりの業務効率化を進めている。10年間にわたり同社が蓄積してきた1万5000件以上のレシピから、AIを使って特定の味に近いレシピを探し出すシステムを開発した。

ここ数年、ロボット機械学習の領域を世界的にけん引してきた米Google(グーグル)。その中枢にいた精鋭研究者30人ほどが2024年の3月、一斉にグーグルを退職し、ロボットAIのスタートアップを立ち上げたことは、この領域の人々を驚かせた。「ロボットAIで世界最高峰の企業だったグーグルをなぜ離れるのか」「一体何があったのか」と。 彼ら精鋭達は創業後の約7カ月間、黙して語らずのステルス状態を貫いてきたが、このほどその沈黙を破り、ついに最初の成果を明らかにした。その名も「π0(パイゼロ)」。 マルチモーダル型の大規模言語モデルと、最新の連続型の生成モデルを組み合わせ、「膨大な知識を生かした汎用性」と「動きの精緻さ」を兼ね備えた基盤モデル(foundation model)を作り上げた。既存のロボットAIとは比べものにならないほど動きもスムーズになり、複雑な判断が必要な長いタスクを自動で実施できる(
パソコンは遠隔操作が可能だ(図1)。別の部屋にあるパソコンを手元のパソコンやスマホで操作できればファイルの転送も楽々。家族のパソコンを遠隔操作して使い方を教えることもできる。 図1 家にパソコンが複数台ある場合、遠隔操作できるようにしておくと何かと便利。別パソコンの前に行かなくても別室からファイルを取り出したりできる。スマホからも遠隔操作できるので、やり忘れた仕事や連絡をトイレやお風呂でサクッと済ませることも可能。操作に戸惑っている同居人を遠隔操作でサポートするのにも使える 遠隔操作はアプリで行う(図2)。最も手軽なのは「Chromeリモートデスクトップ」だが、ほかに「リモートデスクトップ」「UltraVNC」といった選択肢もある。家族の操作補助なら「クイックアシスト」が便利。このほか、1セットのキーボードとマウスで複数台のパソコンを操作するアプリもある(図3)。複数台を目の前に並べ、まと
今回は、ビジネスプロセス管理にマルチモーダル基盤モデルを適用する論文を取り上げたいと思います。マルチモーダル基盤モデルは、テキストや画像、時系列などのマルチモーダルな情報を扱うことができるモデルです。 論文のタイトルは「Do Multimodal Foundation Models Understand Enterprise Workflows? A Benchmark for Business Process Management Tasks」(2024年6月)。著者は米スタンフォード大学のMichael Wornow氏とAvanika Narayan氏などです。 [1]ビジネスプロセスとマルチモーダル基盤モデル この研究が扱っているのは、Web ベースの業務プロセスやオフィス作業です。製造業の現場のように物理的な制約や安全基準のあるものは考慮されていません。しかし、マルチモーダル基盤モ
生成AI(人工知能)の精度を高める手法として、大規模言語モデル(LLM)と検索エンジンを組み合わせたRAG(Retrieval Augmented Generation、検索拡張生成)の利用が盛んだ。ところが米Google(グーグル)によれば、RAGよりも性能を高めやすい手法があるのだという。「メニーショットICL(Many-Shot In-Context Learning)」や「ロングコンテキストICL(Long-Context In-Context Learning)」と呼ばれる手法だ。 「ロングコンテキストICLを利用すると、RAGに比べて性能が12ポイント向上した例も出てきている」。Google Cloudが2024年10月24日に開催した生成AIに関するイベント「Generative AI Summit Tokyo '24 Fall」で、グーグル・クラウド・ジャパンの寳野雄太テク
11年以上に及ぶこの「極言暴論」の連載で、私が一貫して主張してきたことがある。最近はあえてあまり書かないようにしていたが、「オールドファン」なら当然ご存じだろう。世界に類を見ない労働集約型の人月商売を、日本のIT業界から撲滅することだ。百歩譲ったとしても、付加価値がまるでない人月商売が日本のIT業界の主役だというばかげた状態に、一刻も早くピリオドを打たねばならぬ。そんな「志」を掲げて執筆を始めたのがこの極言暴論で、その思いは今も持ち続けている。 ただねぇ、日本のIT業界を人月商売に堕落させた責任の多くは、仕事を依頼する客側にある。何せパッケージソフトウエアやクラウドサービスなどをあまり活用せず、古くさい自社のビジネスモデルや業務プロセスなどを反映した「自前」のシステムにこだわり続けてきたからだ。しかも自前のシステムのはずなのに、客のIT部門は自らつくれない。そんな「お客様の事情」を前提に、
表計算ソフトの「Microsoft Excel」上でプログラミング言語「Python」のコーディングができる新機能が登場した。米Microsoft(マイクロソフト)が2024年9月に正式提供を開始した「Python in Excel」だ。これにより、Pythonのライブラリーを用いた数値計算や統計分析、データの可視化などがExcel上で可能になった。 Python in Excelは、「Microsoft 365 Business」と「Microsoft 365 Enterprise」のユーザーが利用できる。現時点ではWindows版Excelのみの機能で、Mac版やiPhone/iPad版、Android版、Web版のExcelでは利用できない。なお、Pythonのコードはクラウドで実行されるため、インターネットへの接続が必要だ。 同機能はPythonの開発環境「Anaconda」を利用
様々なタスクで汎用的に使える「ロボット基盤モデル」の実現に向けて、日本国内でも本格的な取り組みがスタートした。 基盤モデルを構築するには、人間がロボットを遠隔操作(テレオペ)するなどして収集した大規模なロボット動作データが必要となるが、そのデータセットを作るプロジェクト「HSRT-X」が、東京大学 松尾研究室主導で発足した。トヨタ自動車製の移動マニピュレータ型ロボット「HSR(Human Support Robot)」を使っており(図1)、将来的に数百万件規模のデータセット構築を目指す。 HSRをロボット研究に使う国内の大学研究室などが参画しており(表1)、2024年9月時点で約100時間分、1万4255件(軌道数)のデータを収集した。2024年9月に開催されたロボット系の学会「日本ロボット学会 学術講演会(RSJ 2024)」で発表した1)。
物流大手の日本通運が「新・国際航空貨物基幹システム」の開発失敗を巡り、ベンダーのアクセンチュアを訴えた裁判。名門企業同士の訴訟、さらには約124億9100万円という賠償請求額の大きさは衝撃的だった。 裁判資料を読んでいると胃がキリキリした。筆者は2年ほど前までシステムエンジニアとして働いていた。その分、記されていた当事者の発言やチャットが、あまりにも生々しく映った。 訴状によると、開発プロジェクトはテスト工程から遅延し始めた。当初2020年12月の予定だった結合テストの後半過程「ITb」の終了は2021年11月にずれ込んだ。アクセンチュアがITbの「成果物」を共有サーバーにアップロードしたのは2021年11月30日。しかし、日本通運は先立って実施していた「打鍵テスト」で大量の指摘事項が挙がっていたことなどから、この品質を問題視した。以降、これら成果物の検収を巡り、両者の主張は至るところで対
生成AI(人工知能)に欠かせない高性能のGPU(画像処理半導体)を搭載したサーバーを大量に運用できる「AIデータセンター」は、日本にどれだけ存在するのか。日経クロステックが国内にある49社のデータセンター事業者を対象に調査したところ、18社による計画中を含む32施設があることが分かった。 今回、日経クロステックがデータセンター事業者に質問したのは、大規模言語モデル(LLM)のトレーニング(訓練)や推論に使う高性能GPUサーバーが稼働できるような施設と、その詳細だ。現時点では国内に18社が運営する26施設があり、今後さらに6施設が増える計画だ。 消費電力10kW超えのGPUサーバーを1ラックで複数台稼働 LLMのトレーニングには、米NVIDIA(エヌビディア)のAI用GPUである「H100」や「H200」を8個搭載する高性能GPUサーバーが向いているとされる。NVIDIA自身がH100を8個
およそ10年前に将棋のトップ棋士を下す将棋AI(人工知能)が登場し、7~8年前からは正確な翻訳や文章執筆をするAI、写真のような画像を描画するAI、さらには材料開発をするAI(マテリアル・インフォマティクス、MI)が登場してきた。3年前からは、人間と自然に会話するようにやり取りして、さまざまなコンテンツを自在に生成する生成AIが世界の大きな話題になってきた。 そしてここにきて、天気予報を高い精度で出せるAIが登場してきた。近い将来、世界の天気予報はAIベースが主流となり、パソコン1台でいつでもどこでも1分以下で予報が得られ、これまで数十分~数時間もかかっていたスーパーコンピューターによる現行の数値計算はほぼ不要になるかもしれない。天気予報の計算に必要な電力量は、10万~数百万分の1へと激減した。 さらには、まだ緒についたばかりのようだが、地震の発生やその強さをAIで予測する研究も始まってい
左からプリファードネットワークスMN-Core事業経営企画室担当VPの小倉崇浩氏、VPコンピュータアーキテクチャー担当CTOの牧野淳一郎氏、計算基盤担当VPの土井裕介氏(写真:日経クロステック) AI(人工知能)スタートアップのPreferred Networks(プリファードネットワークス、東京・千代田)は次世代の学習用AI半導体の開発に着手した。米NVIDIA(エヌビディア)のGPU(画像処理半導体)などに対抗する狙いで、基盤技術の開発では韓国Samsung Electronics(サムスン電子)と製造面で連携する。2026年にも実用化したい考えで、自社や外部向けの計算基盤に活用する。 2022年12月に発表した第2世代の深層学習(ディープラーニング)用プロセッサー「MN-Core2(エムエヌ・コア・ツー)」の後継品を開発する。消費電力やコスト当たりの演算性能を大幅に高める。実用化時期
拡散モデルは生成モデルの一種であり、多くの生成問題で利用されている。画像や音声だけでなく、動画生成、ロボット制御、タンパク質の構造推定(AlphaFold31))などでも使用されている。 拡散モデルは、データに徐々にノイズを加える拡散過程を逆向きにたどるデノイジングの流れ(スコア=対数確率の入力勾配)を学習することでデータを生成する手法である。生成モデルとして、潜在変数モデル、エネルギーベースモデル、フローベースモデルの特徴を兼ね備えており、さらに非平衡熱力学や最適輸送理論とも接点がある(詳しくは文献2)などを参照)。
一部の先進企業が生成AI(人工知能)の業務活用を目指し、自社の情報システムに実装しようとする動きが見られる中、自らが取り組まなくてもいつの間にか生成AIを業務に活用している――。そんな時代が訪れつつある。海外のITベンダーが提供するSaaS(ソフトウエア・アズ・ア・サービス)が、当たり前のように生成AIを利用するようになってきているのだ。生成AIを使ったUI(ユーザーインターフェース)を提供したり、生成AIを活用した業務の自動化支援などの機能をSaaSに組み込んだりと、様々な手段で生成AIの業務利用を推進している。 CRM(顧客関係管理)を中心としたSaaSを提供する米Salesforce(セールスフォース)の日本法人セールスフォース・ジャパンは2024年10月にも、対話型でSaaSの機能を利用可能にする「Einstein Copilot」の日本語ベータ版を提供する。「2014年からAIの
米Microsoft(マイクロソフト)は米国時間2024年5月21日、年次イベント「Microsoft Build」で、生成AI(人工知能)によるユーザー支援機能「Copilot」の機能強化を発表した。複数の外部プログラムをつないで実行する「生成AIエージェント」を開発する機能や、個人だけでなくチームをサポートする「Team Copilot」を新たに追加。Copilotはユーザーをチャットで支援する機能から、業務を自動化する存在に進化しようとしている。 ユーザーがCopilotをカスタマイズできるローコードツール「Microsoft Copilot Studio」に、エージェントを開発する機能を新たに追加した。複雑なプロセスを自動化し、人の介入を最小限に抑えた自律的なエージェントを作成できるという。早期アクセスプログラムで限定的に公開されており、2024年後半にプレビュー版が提供される予定
米Microsoft(マイクロソフト)は米国時間2024年5月21日から開いた年次イベント「Microsoft Build」に合わせて、クラウドサービス「Microsoft Azure」の機能強化を発表した。生成AI(人工知能)関連サービスを中心に、追加された主要25機能を解説する。 今年もAI一色に染まったMicrosoft Build。「AI時代のニーズに応える、最も完全でスケーラブルなAIインフラを用意している」。基調講演でマイクロソフトのサティア・ナデラCEO(最高経営責任者)はこう語り、Azure関連の新サービスを発表した。 プレビュー版として提供してきた生成AIサービスの中核の1つ「Azure AI Studio」は、一般利用が可能になった。AzureのAI関連機能を一元的に管理するサービスで、米OpenAI(オープンAI)や米Meta(メタ)などが提供する1600以上のAIモ
生成AI(人工知能)を搭載したシステムを狙って情報を窃取し、生成AIを悪用して自らを拡散するワームが今後登場する恐れがある。セキュリティー研究者が2024年3月、実際にそのようなワームを開発したとの論文を発表した。生成AIにシステム権限を与えすぎないといった対処が必要だ。 生成AIを悪用するワーム「Morris II(モリスツー)」を開発して、機密データの窃取やマルウエアの拡散を可能にしたとの論文を2024年3月に発表したのは、米コーネル大学やイスラエル工科大学などの研究者だ。ワームとは自分自身をコピーして拡散するマルウエアの一種だ。 Morris IIは「生成AIエージェント」へ攻撃を仕掛ける。生成AIエージェントはChatGPTやGeminiといった生成AIモデル(基盤モデルや大規模言語モデルなどとも呼ばれる)と連係し、人間に代わって自律的にタスクを処理するシステムである。 論文は生成
「まだ700台も残っているのか」――。富士通と米Amazon Web Services(アマゾン・ウェブ・サービス、AWS)の会見を聞いた筆者の感想だ。両社は2024年3月18日、グローバルパートナーシップの拡大と顧客システムのモダナイゼーション支援を発表した。その中で、富士通の島津めぐみ執行役員副社長COO (サービスデリバリー担当)(現職)が同社のメインフレーム残存数に触れたのだ。 島津副社長によれば、現在約700台のメインフレームと約9400台のUNIXサーバーが稼働しているという。富士通は2030年度末にメインフレームの製造・販売から撤退し、5年後の2035年度末で保守を終える。UNIXサーバーは2029年度下期に製造・販売を終了し、2034年度中に保守を終える予定だ。 脱メインフレームは間に合わない 果たして2035年度末までに700台あるメインフレームをすべて撤廃できるだろうか
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く