最近は画像コンペではモデリングの余地があまりないことが多いが、系列データのコンペはデファクトの(pretrain)モデルが確立しておらずモデリングで勝敗が分かれることが多い。ここで系列データとは、時系列データ、センサデータ、RNA等のシーケンスデータのようなデータを意図している。 このような背景の…
WebAssemblyをちょっといじってみて思ったところをまとめてみます。 設計思想 WebAssembly/designに設計文書がまとまっています。特にHighLevelGoals.mdから読み取れるポイントは以下の4点です。 サンドボックス化された環境であること。 移植性があること。つまり、特定の実CPUアーキテクチャ等に依存しないこと。 少なくともC/C++の(十分に高速な)コンパイルターゲットとして機能すること。 安定した仕様を持つこと。 サンドボックスという観点からは、先行技術として以下のようなものが特筆に値します。 Webサンドボックス JavaScript および asm.js Javaアプレット Flash (ActionScript) NaCl, PNaCl Web以外のサンドボックス OSのユーザーランド、特にLinux userland これらのサンドボックスとの比
It is important to note that the component model does not support low-level (C-style) pointers. As such, you cannot pass object graphs or recursive data structures. In this respect, it shares the same limitations as JSON. To minimize data copying, the component model introduces the concept of resources, which we will explore in more detail in a forthcoming section of this blog post. The jco projec
ソフトウェア品質の評価と追跡を手掛けるTIOBE Softwareは、2024年5月版の「TIOBEプログラミングコミュニティーインデックス」(通称「TIOBEインデックス」)を発表した。TIOBEインデックスは、プログラミング言語の人気を示す指標で、同社が毎月1回更新している。 レーティングと順位 2024年5月のランキングでは「Python」が16.33%のレーティングで首位の座を堅持した。2~6位も2023年7月以降、順位変動がなく、「C」(9.98%)、「C++」(9.53%)、「Java」(8.69%)、「C#」(6.49%)、「JavaScript」(3.01%)と続いた。 関連記事 Pythonは首位を維持、PHPの人気はピークを過ぎた? プログラミング言語の人気ランキング プログラミング言語の人気ランキング「TIOBEインデックス」の2024年4月版が公開された。上位の順位
はじめに 最近Difyというサービスが大盛り上がりです。 ノーコードで、複雑なLLMのフローを簡単に作成することができ、 例えば、こんな複雑なフローもものの10分程度でパパッと作ることができました。 さらにすごいのは、「公開する」ボタンを押すと、URLが発行され、それを人に共有することが出来ます。 GPTsは無課金ユーザーには勧めにくい、という大きな欠点があったが、それが補完されている形ですね。 さらに、なんと、このワークフローはAPI経由でも使うことが出来るので、LINEBotなどの日常の使いやすいツールに組み込むことが出来ます!!! 実装 事前準備 こちらの記事を参考に、自分のアプリケーションが作ってある状態から記事が始まります! また、MakeとLINEBotを繋げる方法についても割愛します。 以下の記事なんかを参考に、おうむ返しLINEBotを作っておいてください。 Difyの操作
※2024/5/11 13:29追記DifyのLuyu Zhang CEOから直接コメントをいただきましたので、この記事の最後に追記いたしました。 Difyはテンセント系企業?使用して大丈夫?最近注目を集めているLLMOpsプラットフォームのDify.aiですが、中国のテンセントがバックにいるのではないかとの憶測がネット上で広がっていました。以下はXで話題の投稿です。 Difyは中国のテンセントがバックです。 DifyのWEB版(サブスク版)は使うべきではありません。裏側からあなたの作ったシステムも、プロンプトも、APIキーも丸見えですから。Gitからシステムをおろし、ローカルで開発し、GCPなどのクラウドで運用するなら、ありと思います。 — 平岡 憲人(HIRAOKA, Norito) Stand with Ukraine (@onokoro48) May 9, 2024 この記事では、
顔認識技術は、セキュリティ、マーケティング、エンターテインメントなど、さまざまな分野で応用されています。 特に、ディープラーニングの発展により、顔認識の精度は飛躍的に向上し、より広い範囲で利用されるようになりました。 そんな中、Pythonで顔認識を手軽に実装できるオープンソースのフレームワーク「Deepface」が注目を集めています。 Deepfaceは、複数の最先端の顔認識モデルをラップしており、少ないコード量で高精度な顔認識を実現できます。 この記事では、そんなDeepfaceについて解説しています。 本記事の内容 Deepfaceとは?DeepfaceのインストールDeepfaceの動作確認 それでは、上記に沿って解説していきます。 GitHub - serengil/deepface: A Lightweight Face Recognition and Facial Attri
Amazon Web Services ブログ 生成AIで外観検査をやってみた 1. はじめに 製造業における品質管理は非常に重要な課題です。製品の外観や組立状態を確認し、欠陥の有無を判断する外観検査工程は、高い品質を維持するうえで欠かせません。この検査工程を人手に頼らず自動化できれば、コスト削減と品質の安定化が期待できるため、さまざまな検査工程の自動化が試みられています。今でも外観検査のソリューションとしてAWSではAmazon Lookout for Visionというサービスを提供していますが、今回は違う切り口から、Amazon Titan Multimodal Embeddings G1を使って生成AIで同じような外観検査ができるかトライしてみました。 Embedding方式の利点は、製品カテゴリーを問わず同じ数値化モデルを活用できる点にあります。サンプル画像の数値化自体は製品に依
生成AIを使ったサービスを開発してわかったことをメモしておきます。 開発したもの 業種 SaaS 課題 提供サービス内でユーザーがアイディアを考えることが難しかった。様々なデータを人力で集めてくる必要があった 解決策 アイディア起案に繋がりそうなデータを自動で集めてきて提示する。手法はベクトル検索、AIによる要約生成。 その他 チャットUIは作っていない。ユーザーの入力は最初の検索テキスト入力文のみ。 開発前の検証・プロトタイピング 開発する前に生成AIの出力を検証することが必要 生成AIの出力の質はサービスの肝だから 生成AIの出力は事前の予想と違うこともあり早い段階で出力を確認しておかないと後々の仕様変更があったときにキツイから AIに渡すデータの中身を確認しておく 例えばRAGを使って社内ドキュメントやDBを検索する場合、それらのデータの中身を吟味する必要がある 必要なデータと不要な
この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。 チャンネル登録と高評価をよろしくお願いいたします。 日本語版Twitter https://twitter.com/3B1BJP 元チャンネル(英語) https://www.youtube.com/c/3blue1brown 元動画(英語) https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統
Microsoft、小規模言語モデル「Phi-3」公開 大規模言語モデルと異なる利用シーンを想定:「小」規模言語モデルの持つ可能性 Microsoftは、自社開発の小規模言語モデル(SLM)ファミリー、「Phi-3」を発表した。シリーズ最小のパラメーター数の「Phi-3-mini」を公開し、Microsoft Azure AI Studio、Hugging Face、Ollamaで利用可能になった。 Microsoftは4月23日(米国時間)、自社開発の小規模言語モデル(SLM)ファミリー、「Phi-3」を発表した。また、同日からPhi-3シリーズ最小となる38億個のパラメーターを持つ「Phi-3-mini」が「Microsoft Azure AI Studio」「Hugging Face」「Ollama」で利用可能になった。 Phi-3-miniの特徴 Phi-3-miniは4Kおよび1
以下の記事が面白かったので、簡単にまとめました。 Exampleは省略してるので元記事で確認してください。 ・Model Spec (2024/05/08) 1. Model Spec の概要1-1. Model Spec の概要これは「Model Spec」の最初のドラフトであり、OpenAI APIおよびChatGPTでのモデルの望ましい動作を指定する文書です。これには、一連の中核目標と、矛盾する目標や指示に対処する方法に関するガイダンスが含まれています。 OpenAIの目的は、研究者やデータラベル作成者がRLHF と呼ばれる手法の一部としてデータを作成するためのガイドラインとして「Model Spec」を使用することです。「Model Spec」はまだ現在の形式では使用していませんが、その一部はOpenAIでRLHFに使用したドキュメントに基づいています。また、モデルが「Model
Fugaku-LLM利用規約\n この利用規約(以下「本規約」といいます)は、富士通株式会社、国立研究開発法人理化学研究所、国立大学法人東京工業大学、国立大学法人東北大学、株式会社サイバーエージェント、国立大学法人東海国立大学機構、及び株式会社Kotoba Technologies Japan (以下「開発者」といいます)による、スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発の成果物として公開する大規模言語モデル(以下「Fugaku-LLM」といいます)の利用に関する条件を定めるものです。Fugaku-LLMの利用者(以下「利用者」といいます)は、本規約に同意した上でFugaku-LLMを利用するものとします。 \n\n第1条(利用許諾) Fugaku-LLMの利用者は、本規約に従い、Fugaku-LLMを商用または非商用目的を問わず利用することができ
PRESS RELEASE 2024年5月10日 東京工業大学 東北大学 富士通株式会社 理化学研究所 名古屋大学 株式会社サイバーエージェント Kotoba Technolgies Inc. スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 日本語能力に長け、研究・ビジネス利用にも期待 要点 日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルを公開 スーパーコンピュータ「富岳」の性能を最大限に活用した分散並列学習を実現 AI基盤モデルを科学研究に活用する「AI for Science」など革新的な研究やビジネスにつながる 概要 東京工業大学 学術国際情報センターの横田理央教授の研究チームと東北大学 大学院情報科学研究科の坂口慶祐准教授、富士通株式会社 人工知能研究所の白幡晃一シニアプロジェクトディレクター、理化学研究所 のMohamed
世界最高クラスの計算性能を持つスーパーコンピューター「富岳」を使って開発されたAIが完成し、10日、報道陣に公開されました。生成AIの開発の基盤となる大規模言語モデルと呼ばれるAIで、開発の担当者は「今後、日本語に特化した国産の生成AIのさまざまな研究・開発に活用されることを期待したい」と話しています。 開発された大規模言語モデル「FugakuーLLM」は、世界最高クラスの計算能力を持つスーパーコンピューター「富岳」を活用した国産のAIの研究開発プロジェクトとして、去年5月から東京工業大学や東北大学、富士通、理化学研究所などが進めてきたもので、10日、研究成果の発表会が東京 目黒区の東京工業大学で行われました。 発表会では、FugakuーLLMはAIのモデルが一から独自に構築されているため、透明性と安全性に優れていることや学習データのおよそ6割を日本語のコンテンツから学習したことで、日本語
ジャーナリストのエミリー・チャン氏がGoogleのスンダー・ピチャイCEOに独占インタビューを行い、検索にAIを取り入れているGoogleの思惑や、検索結果に表示されるページの質が悪くなっている件などについて尋ねました。 Google CEO Sundar Pichai and the Future of AI | The Circuit - YouTube Video: Alphabet CEO Sundar Pichai Lays Out Google’s AI Roadmap - Bloomberg https://www.bloomberg.com/news/articles/2024-05-09/google-parent-alphabet-is-said-to-progress-in-talks-with-hubspot 2015年のCEO就任時から「会社はAIファーストである
アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援 アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.
Rovo では、チームが選択したすべての SaaS アプリからの情報検索、作業によるナレッジの蓄積と繰り返し学習、仮想エージェントとの迅速な連携が可能になります。
生成AIのビジネスへの利活用の一環として、AIプログラミング補助ツール「GitHub Copilot」の導入に踏み切る企業が増えている。ファッションECサイト「ZOZOTOWN」を運営するZOZOもその一つで、2023年5月に法人向けサービスである「GitHub Copilot Business」を全社導入した。 ZOZOには約500人のエンジニアが所属しており、その全員がGitHub Copilot Businessを利用できるようにした。一方で、AIツールの全社導入に当たっては、セキュリティや費用対効果など、検討すべき点も多い。ZOZOではどのような検討の結果導入に至ったか、同社のテックリードを務める堀江亮介さん(技術本部技術戦略部CTOブロック)が公開している外部向け資料からひもとく。 全社導入を進める際、ZOZOでは「セキュリティ上の懸念」「ライセンス侵害のリスク」「導入による費用
NVIDIA製を“28倍”効率化 生成AI時代のゲームチェンジャー「サンバノバ」の正体:「サンバノバ」の正体【前編】(1/2 ページ) 2022年末のChatGPTの“衝撃”以降、さまざまな企業が生成AIの開発に注力している。ソフトバンクも、英アーム社をはじめ海外企業と協働しながら、開発を進めている。 それを支える企業の一つが、米シリコンバレーに拠点を置くSambaNova Systems(サンバノバシステムズ)だ。サンバノバでは、AIに強いプロセッサーを開発しており、市場の大部分を占めるNVIDIA製のチップに代わるものとして期待が集まっている。 特にサンバノバの最新製品「SN40L」は、NVIDIA製の「DGX H100」と比較して28倍低いTCO(総保有コスト、Total Cost of Ownership)を実現し、企業にとって低コスト化を実現するものとしている。 生成AI時代を迎
なお、ChatGPTはスマートフォンアプリも提供されており、GPT-3.5ならば無料で利用可能だ。モバイル版の「Plus」は、アプリ内課金により、Androidで月額2860円、iOSで月額3000円(2024年5月10日現在)となっている(同一アカウントであれば、Web版とスマートフォン版の両方の利用が可能)。 上記の他には、チーム/企業向けの「Team」と「Enterprise」というプランもあり、「Plus」の機能に加え、ワークスペースの管理機能やセキュリティ機能などがサポートされる。詳細は、ChatGPTの「Pricing」ページを参照してほしい。 ChatGPTの始め方 Windows 10/11、macOSなどでは、Webブラウザで「ChatGPT」ページを開くことでChatGPTが利用できる。「ChatGPT」で検索すると、ChatGPTのAPIを利用するなどした類似のドメイ
チャットAI「ChatGPT」や画像生成AI「DALL-E」を開発するOpenAIが、ユーザーに対し「ポルノや流血表現、中傷などを含む」コンテンツを自社のAI製品を通じて生成できるようにすることを検討中であることを明らかにしました。 OpenAI considers allowing users to create AI-generated pornography | Artificial intelligence (AI) | The Guardian https://www.theguardian.com/technology/article/2024/may/09/openai-considers-allowing-users-to-create-ai-generated-pornography これまでOpenAIは科学的資料や教育資料などを除き、「性的に露骨なコンテンツや暗示的な
米アップルが対話型人工知能(AI)「ChatGPT」を開発した米オープンAIの技術をiPhoneに採用することで合意に近づいている。事情に詳しい複数の関係者が明らかにした。自社デバイスに人工知能(AI)機能を付加する広範な取り組みの一環だという。 非公開情報だとして、これら関係者が匿名で明らかにしたところでは、両社はアップルの次期iPhone用基本ソフト(OS)「iOS 18」へのChatGPT機能の統合に向け合意条件を最終調整している。アップルはまた、アルファベット傘下のグーグルと同社のチャットボット「Gemini」のライセンスについて協議中。いずれの交渉も合意に至っていない。 アップルとオープンAIの合意がまとまれば、アップルは来月発表する予定の新たなAI機能に人気の高いChatGPTを含めることができる。ブルームバーグは4月、両社の協議が再開されたと報じた。ただ、すぐに合意が発表され
「検索エンジンでもない」としているのは、米Reutersが11日、OpenAIが13日に検索エンジンを発表するという予測を報じたことを受けたものだろう。 ライブ配信のタイミングが米Googleの年次カンファレンス「Google I/O 2024」の基調講演配信の24時間前に設定されていることも、Googleと競合する発表になるのではないかと予測させる。 Googleはこの基調講演で、GeminiなどのAI関連の多数の発表をするとみられる。 関連記事 OpenAI、コンテンツのスクレイピングを遮断するツール「Media Manager」を2025年までに提供へ OpenAIは、クリエイターが自分のコンテンツが生成AIのトレーニングにどう使われるかを制御できるツール「Media Manager」を開発中と発表した。2025年までに提供する計画だ。 OpenAI、ディープフェイク対策ツール「DA
対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、米太平洋時間13日午前10時(日本時間14日午前2時)にライブ配信を通じて製品アップデートを発表するとウェブサイトに発表した。AI界の巨人がどのような大型リリースを計画しているのか、臆測を呼んでいる。 オープンAIはこのイベントで検索プロダクトを発表することはないとしている。アルファベット傘下のグーグルとAI検索スタートアップ(新興企業)のパープレキシティに対抗する機能を、オープンAIは開発中だ。 発表は人気の「ChatGPT(チャットGPT)」とそのAIモデルのアップデートが中心になる。GPT-4のリリースからすでに1年余りが経過。新しいモデルの発表が待望されている。同社はしかし、このイベントはシリーズ最新GPT-5のローンチではないという。 サム・アルトマン最高経営責任者(CEO)は10日、ソーシャルメディア「X(旧ツ
Appleがをに搭載するためのOpenAIとの提携を協議しており、条件を調整する最終局面に到達しているとBloombergが報道しました。 Apple Closes in on Deal With OpenAI to Put on - Bloomberg https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone 18: Apple finalizing deal to bring to - 9to5Mac OpenAI confirms May 13 event for updates https://9to5google.com/2024/05/10/openai-may-13-event-chatgpt/ Bloomber
OpenAIはAP通信やFinancial Timesといった大手報道機関と戦略的パートナーシップを提携しており、各報道機関の記事をChatGPT内に表示する契約を結んでいます。このOpenAIと報道機関の契約内容については不明点が多いのですが、新たに海外メディアのAdweekが契約に関する資料を入手してその内容を報じました。 Leaked Deck Reveals OpenAI's Pitch on Publisher Partnerships https://www.adweek.com/media/openai-preferred-publisher-program-deck/ OpenAIは報道機関とのパートナーシップ提携を進めており、すでに「Financial Times」「AP通信」「アクセル・シュプリンガー」「ル・モンド」「プリサ・メディア」といった大手報道機関とのパートナー
ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。 GitHub - lllyasviel/IC-Light: More relighting! https://github.com/lllyasviel/IC-Light IC-Lightは画像の光源の種類や位置を指定しつつ背景を別物に置き換えられるAIツールです。IC-Lightはローカルにインストールして使用可能。さらに、インストール不要で使えるデモサイトも用意されていたので、実際にデモサイトでIC-Lightを使って画像を加工してみました。 IC-Lightのデモサイトには、以下のリンクをクリックするとアクセスできます。 IC Light - a Hugging Face Space by lllyasviel h
自分の声やフリーの声素材、著作権フリーの楽曲などで作るのならば問題はない。関係者を悩ませているのは、声優や歌手などの声を勝手に使った“無断AIカバー”だ。 人気歌手や声優の声を無断でAIに学習させ、無関係な歌を歌わせたり、セリフを言わせたりする無断AIカバーは、アニメファンなどが好きなキャラの声で勝手に制作し、動画SNSなどで人気を集めている。 声そのものが商品である声優にとって、無断AIカバーが作られるのは深刻な問題だ。「早急に何とかしたいと思っているのですが……」。声優の甲斐田裕子さん(アニメ業界の立て直し・発展を目指す有志団体「日本アニメフィルム文化連盟(NAFCA)」理事)は、対策の難しさに頭を抱える。 声を守ることに特化した法律がないことや、作品の関係者が多岐にわたること、関係者の間でも意見が割れていることなどが、問題を複雑にしている。 声優が自らの声でAI音声を作り、新たなビジ
AIが抱える最大のリスクはいったい何か? ――AI技術が社会や人間にどう影響するか見極めるには時間がかかると言いますが、では、現時点での最大のリスクはいったい何でしょうか。 それは「テクノロジーが社会の先を行ってしまうこと」です。今、私たちが行っているのは、人類に対する制御不能な実験です。だから、われわれ人間が、いろいろな場面で機械の指示に従おうとしている。 欧州では、リスクに基づく規制管理レベルを定めるなど、AIに対する幅広いアプローチを行っています。「雇用や融資、刑事司法といったリスクの高い分野においても、AIに仕事を任せてよいものか?」「AIにローンを組ませることはできるのか?」「AIを刑務所に送り込むことができるのか?」。今挙げたようなハイリスクの分野では、規制をかけるべきでしょう。また、AIシステムが出した結論があなたに不利だった場合には、「どんな方法でその結論に至ったのか」を知
iOS18の新機能として、iPhone純正の「ボイスメモ」アプリで、人工知能(AI)を活用した文字起こしと内容の要約機能が追加される、と米メディアAppleInsiderが報じています。クラウドにデータを送信せずデバイス上で動作するので、機密情報を含む会議も安心して要約できそうです。 iOS18の「ボイスメモ」で録音、文字起こし、要約が可能に iOS18の「ボイスメモ」アプリで、録音した音声の文字起こしと、その内容の要約が可能になる、とAppleInsiderが事情に詳しい複数の関係者から得た情報として伝えています。 AIによる文字起こしと要約機能は、6月の世界開発者会議(WWDC24)で発表予定のiOS18のほか、iPadOS18、macOS15でも使用可能になる見込みとのことです。 iOS18の「ボイスメモ」アプリでは、画面配置が既存のものから大きく変更され、文字起こし結果が画面の中央
連載「テルえもんが見たデジタルモノづくり最前線」では、筆者が日々ウォッチしているニュースや見聞きした話題、企業リリース、実体験などを基に、コラム形式でデジタルモノづくりの魅力や可能性を発信していきます。連載第1回のテーマは「3D CADに搭載されはじめたAI機能と自動化」です。 皆さん、こんにちは! 小原照記(おばらてるき)と申します。普段は岩手県の「いわてデジタルエンジニア育成センター」という施設で3D CADを中核とした、デジタルエンジニアの育成と“企業の困りごと”を聞いて支援する仕事をしています。当センターではいろいろな3D CADをはじめとしたデジタルモノづくりに関する設備を保有しており、学生や企業の方たち向けに講習会を開催したり、3Dプリンタでの試作や3Dスキャナーを使用しての検査/リバースエンジニアリングなどの受託を行ったりしています。また、筆者個人のSNSやブログでは「テルえ
東芝は、あらかじめ作成したデータでロボット制御に用いられるAIの機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発した。 東芝は2024年5月10日、あらかじめ作成したデータでロボット制御に用いられるAI(人工知能)の機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発したと発表した。これまでロボット制御AIのオフライン強化学習では数千以上のデータが必要だったが、新技術は10分の1以下のとなる100程度のデータで精度を向上できる。公開ベンチマーク環境によるシミュレーション評価の結果、平均成功率が従来比で2倍となる72%に向上した。少量の画像データから複雑なロボット操作を高精度に制御するAI技術は「世界初」(東芝)、公開ベンチマーク環境における72%の成功率は「世界最高精度」
冷戦のさなか、旧ソビエト軍の1人の中佐の判断が核戦争の勃発を防いだとされる出来事があった。アメリカ軍の核ミサイル攻撃を探知した監視システムの情報を、状況から誤作動と判断、ソビエト側の報復攻撃を防いだ。 しかし今、各国でAI=人工知能を使って、より自律性を高めた「AI兵器」の開発競争が激化している。 すでに戦地では20秒以内に攻撃の判断を求められるAIシステムの使用が伝えられている。 人間の判断が介在しない究極のAI兵器が登場したら、この世界はどうなるのだろうか。 (国際部記者 山下涼太) 2022年2月に始まったロシアによる軍事侵攻に対抗するウクライナ。物量で上回る大国との消耗戦になる中、遠隔操作型の無人機で偵察や監視・攻撃までを行い、善戦につなげてきた。 しかし、このところロシア側の電波妨害により、無人機の通信が途絶えて制御を失うケースが増え、無人機の損耗が増加。 このため、ウクライナ軍
元ピクサーのアニメーターが語る「ハリウッドでAIが通用しない理由」2024.05.11 11:0015,285 Matt Novak - Gizmodo US [原文] ( そうこ ) 昨今、AIが生成した動画が良くも悪くも常に話題になっています。ネタ動画を作るだけではなくて、これでプロの現場・ハリウッドも劇的に変わるのではないか?という声も聞こえてきます。 その問いに「No」と答えるのは、『トイ・ストーリー』や『ファインディング・ニモ』などの制作に携わった、元Pixarアニメーターのクレイグ・グッドさん。 グッドさんいわく、AIをプロの現場で使うには、関係者全員をイラつかせてしまう大きな欠点があるといいます。それは、微調整が効かないこと。 生成AIは、作りたいものをテキストで入力するだけで画像や動画を作り出します。何もないゼロ状態から作り出されるものとして、正直驚くべき出来です。ただ、現
2023年11月にあった那覇市長定例記者会見。沖縄の言葉で「はいさい ぐすーよー。ちゅーうがなびら(こんにちは皆さん。ご機嫌いかがでしょうか)」から始まった会見は、市の業務での生成AI本格導入に向けて「那覇市生成AI活用方針」を策定したというコメントを読み上げていた。「いっぺー にふぇーでーびる(ありがとうございました)」と締めたところで、知念覚市長がこう付け加えた。 「なお、このコメントもですね、生成AIによって下書きを作成し、職員が校正を行って作っております」 沖縄県内ではいち早く生成AI活用を導入した那覇市。同市DX推進室の長嶺伶生さんは「たたき台を手直しするだけで作れるので負担は少なくなっています」とそのメリットを挙げる。 住民の個人情報などデリケートな情報も多く扱う行政の現場。その利用にあたっては慎重に活用方針とガイドラインを作成し、日々の業務活用につなげている。行政が生成AIな
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く