misshikiのブックマーク / 2024年5月13日

「高専DCON2024」ものづくり×AI×事業性のリアル体験型コンテスト　本選生中継！

misshiki 2024/05/13

“『第5回全国高等専門学校ディープラーニングコンテスト DCON2024』”

ディープラーニング

リンク

Kaggleで学ぶ系列データのための深層学習モデリング

最近は画像コンペではモデリングの余地があまりないことが多いが、系列データのコンペはデファクトの（pretrain）モデルが確立しておらずモデリングで勝敗が分かれることが多い。ここで系列データとは、時系列データ、センサデータ、RNA等のシーケンスデータのようなデータを意図している。このような背景の…

misshiki 2024/05/13

全39ページのスライド資料。

Kaggle

リンク

データ基盤を支える技術

主にクラウドの話してます - 広島での登壇資料です。 https://omoni-cloud.connpass.com/event/315682/

misshiki 2024/05/13

全42ページのスライド資料。

データ基盤

リンク

WebAssemblyをちょっといじってみて思ったところをまとめてみます。設計思想 WebAssembly/designに設計文書がまとまっています。特にHighLevelGoals.mdから読み取れるポイントは以下の4点です。サンドボックス化された環境であること。移植性があること。つまり、特定の実CPUアーキテクチャ等に依存しないこと。少なくともC/C++の(十分に高速な)コンパイルターゲットとして機能すること。安定した仕様を持つこと。サンドボックスという観点からは、先行技術として以下のようなものが特筆に値します。 Webサンドボックス JavaScript および asm.js Javaアプレット Flash (ActionScript) NaCl, PNaCl Web以外のサンドボックス OSのユーザーランド、特にLinux userland これらのサンドボックスとの比

misshiki 2024/05/13

WebAssembly

リンク

VS Code Extensions and WebAssembly

It is important to note that the component model does not support low-level (C-style) pointers. As such, you cannot pass object graphs or recursive data structures. In this respect, it shares the same limitations as JSON. To minimize data copying, the component model introduces the concept of resources, which we will explore in more detail in a forthcoming section of this blog post. The jco projec

misshiki 2024/05/13

“Visual Studio Code は、 WebAssembly 実行エンジン拡張機能を介した WASM バイナリの実行をサポートします。”

WebAssembly

リンク

GitHub - Mega-Gorilla/Index_PDF_Translation

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2024/05/13

“Indqx PDF 翻訳は、2024年5月31までwebにて翻訳サービスを提供していた、PDF翻訳のソースコードです。”

Python

リンク

Pythonがますます独走、Fortranが2カ月連続でトップ10入り　プログラミング言語の人気ランキング

ソフトウェア品質の評価と追跡を手掛けるTIOBE Softwareは、2024年5月版の「TIOBEプログラミングコミュニティーインデックス」（通称「TIOBEインデックス」）を発表した。TIOBEインデックスは、プログラミング言語の人気を示す指標で、同社が毎月1回更新している。レーティングと順位 2024年5月のランキングでは「Python」が16.33％のレーティングで首位の座を堅持した。2～6位も2023年7月以降、順位変動がなく、「C」（9.98％）、「C++」（9.53％）、「Java」（8.69％）、「C#」（6.49％）、「JavaScript」（3.01％）と続いた。関連記事 Pythonは首位を維持、PHPの人気はピークを過ぎた？　プログラミング言語の人気ランキングプログラミング言語の人気ランキング「TIOBEインデックス」の2024年4月版が公開された。上位の順位

misshiki 2024/05/13

“2024年5月のランキングでは「Python」が16.33％のレーティングで首位の座を堅持した。”

Python

リンク

Make✖️DifyでLINEボットを作る - Qiita

はじめに最近Difyというサービスが大盛り上がりです。ノーコードで、複雑なLLMのフローを簡単に作成することができ、例えば、こんな複雑なフローもものの10分程度でパパッと作ることができました。さらにすごいのは、「公開する」ボタンを押すと、URLが発行され、それを人に共有することが出来ます。 GPTsは無課金ユーザーには勧めにくい、という大きな欠点があったが、それが補完されている形ですね。さらに、なんと、このワークフローはAPI経由でも使うことが出来るので、LINEBotなどの日常の使いやすいツールに組み込むことが出来ます！！！実装事前準備こちらの記事を参考に、自分のアプリケーションが作ってある状態から記事が始まります！また、MakeとLINEBotを繋げる方法についても割愛します。以下の記事なんかを参考に、おうむ返しLINEBotを作っておいてください。 Difyの操作

misshiki 2024/05/13

“ノーコードで、複雑なLLMのフローを簡単に作成することができ、例えば、こんな複雑なフローもものの10分程度でパパッと作ることができました。「質問入力」=>「Google検索」=>「検索結果をgptにまとめさせる」”

人工知能

リンク

Difyは使用して大丈夫？テンセント系企業？安全なの？｜Kyutaro

※2024/5/11 13:29追記DifyのLuyu Zhang CEOから直接コメントをいただきましたので、この記事の最後に追記いたしました。 Difyはテンセント系企業？使用して大丈夫？最近注目を集めているLLMOpsプラットフォームのDify.aiですが、中国のテンセントがバックにいるのではないかとの憶測がネット上で広がっていました。以下はXで話題の投稿です。 Difyは中国のテンセントがバックです。 DifyのWEB版（サブスク版）は使うべきではありません。裏側からあなたの作ったシステムも、プロンプトも、APIキーも丸見えですから。Gitからシステムをおろし、ローカルで開発し、GCPなどのクラウドで運用するなら、ありと思います。 — 平岡憲人(HIRAOKA, Norito) Stand with Ukraine (@onokoro48) May 9, 2024 この記事では、

misshiki 2024/05/13

人工知能

リンク

PythonとDeepfaceで始める顔認識 – 初心者から上級者まで

顔認識技術は、セキュリティ、マーケティング、エンターテインメントなど、さまざまな分野で応用されています。特に、ディープラーニングの発展により、顔認識の精度は飛躍的に向上し、より広い範囲で利用されるようになりました。そんな中、Pythonで顔認識を手軽に実装できるオープンソースのフレームワーク「Deepface」が注目を集めています。 Deepfaceは、複数の最先端の顔認識モデルをラップしており、少ないコード量で高精度な顔認識を実現できます。この記事では、そんなDeepfaceについて解説しています。本記事の内容 Deepfaceとは？DeepfaceのインストールDeepfaceの動作確認それでは、上記に沿って解説していきます。 GitHub - serengil/deepface: A Lightweight Face Recognition and Facial Attri

misshiki 2024/05/13

“Pythonで顔認識を手軽に実装できるオープンソースのフレームワーク「Deepface」が注目を集めています。 Deepfaceは、複数の最先端の顔認識モデルをラップしており、少ないコード量で高精度な顔認識を実現できます。”

Python

リンク

生成AIで外観検査をやってみた | Amazon Web Services

Amazon Web Services ブログ生成AIで外観検査をやってみた 1. はじめに製造業における品質管理は非常に重要な課題です。製品の外観や組立状態を確認し、欠陥の有無を判断する外観検査工程は、高い品質を維持するうえで欠かせません。この検査工程を人手に頼らず自動化できれば、コスト削減と品質の安定化が期待できるため、さまざまな検査工程の自動化が試みられています。今でも外観検査のソリューションとしてAWSではAmazon Lookout for Visionというサービスを提供していますが、今回は違う切り口から、Amazon Titan Multimodal Embeddings G1を使って生成AIで同じような外観検査ができるかトライしてみました。 Embedding方式の利点は、製品カテゴリーを問わず同じ数値化モデルを活用できる点にあります。サンプル画像の数値化自体は製品に依

misshiki 2024/05/13

“外観検査のソリューションとしてAWSではAmazon Lookout for Visionというサービスを提供していますが、今回は違う切り口から、Amazon Titan Multimodal Embeddings G1を使って生成AIで同じような外観検査ができるかトライ”

リンク

実務で生成AIサービスを開発してわかったこと

生成AIを使ったサービスを開発してわかったことをメモしておきます。開発したもの業種 SaaS 課題提供サービス内でユーザーがアイディアを考えることが難しかった。様々なデータを人力で集めてくる必要があった解決策アイディア起案に繋がりそうなデータを自動で集めてきて提示する。手法はベクトル検索、AIによる要約生成。その他チャットUIは作っていない。ユーザーの入力は最初の検索テキスト入力文のみ。開発前の検証・プロトタイピング開発する前に生成AIの出力を検証することが必要生成AIの出力の質はサービスの肝だから生成AIの出力は事前の予想と違うこともあり早い段階で出力を確認しておかないと後々の仕様変更があったときにキツイから AIに渡すデータの中身を確認しておく例えばRAGを使って社内ドキュメントやDBを検索する場合、それらのデータの中身を吟味する必要がある必要なデータと不要な

misshiki 2024/05/13

“AI出力に対するユーザの期待値調整：期待値を下げる方法１「ワーディング」、期待値を下げる方法2「チャットUIを使わない」、期待値を下げる方法3「inputを限定する」、期待値を下げる方法4「地味AI」”

リンク

GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning

この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。チャンネル登録と高評価をよろしくお願いいたします。日本語版Twitter https://twitter.com/3B1BJP 元チャンネル（英語） https://www.youtube.com/c/3blue1brown 元動画（英語） https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction

misshiki 2024/05/13

“この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。”

Transformer

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

misshiki 2024/05/13

“PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。”

リンク

Microsoft、小規模言語モデル「Phi-3」公開　大規模言語モデルと異なる利用シーンを想定

Microsoft、小規模言語モデル「Phi-3」公開　大規模言語モデルと異なる利用シーンを想定：「小」規模言語モデルの持つ可能性 Microsoftは、自社開発の小規模言語モデル（SLM）ファミリー、「Phi-3」を発表した。シリーズ最小のパラメーター数の「Phi-3-mini」を公開し、Microsoft Azure AI Studio、Hugging Face、Ollamaで利用可能になった。 Microsoftは4月23日（米国時間）、自社開発の小規模言語モデル（SLM）ファミリー、「Phi-3」を発表した。また、同日からPhi-3シリーズ最小となる38億個のパラメーターを持つ「Phi-3-mini」が「Microsoft Azure AI Studio」「Hugging Face」「Ollama」で利用可能になった。 Phi-3-miniの特徴 Phi-3-miniは4Kおよび1

misshiki 2024/05/13

“Microsoftは、自社開発の小規模言語モデル（SLM）ファミリー、「Phi-3」を発表した。シリーズ最小のパラメーター数の「Phi-3-mini」を公開し、Microsoft Azure AI Studio、Hugging Face、Ollamaで利用可能になった。”

リンク

OpenAI の Model Spec の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。 Exampleは省略してるので元記事で確認してください。・Model Spec (2024/05/08) 1. Model Spec の概要1-1. Model Spec の概要これは「Model Spec」の最初のドラフトであり、OpenAI APIおよびChatGPTでのモデルの望ましい動作を指定する文書です。これには、一連の中核目標と、矛盾する目標や指示に対処する方法に関するガイダンスが含まれています。 OpenAIの目的は、研究者やデータラベル作成者がRLHF と呼ばれる手法の一部としてデータを作成するためのガイドラインとして「Model Spec」を使用することです。「Model Spec」はまだ現在の形式では使用していませんが、その一部はOpenAIでRLHFに使用したドキュメントに基づいています。また、モデルが「Model

misshiki 2024/05/13

“「Model Spec」の最初のドラフトであり、OpenAI APIおよびChatGPTでのモデルの望ましい動作を指定する文書です。これには、一連の中核目標と、矛盾する目標や指示に対処する方法に関するガイダンスが含まれています。”

リンク

Fugaku-LLM/Fugaku-LLM-13B · Hugging Face

Fugaku-LLM利用規約\n この利用規約（以下「本規約」といいます）は、富士通株式会社、国立研究開発法人理化学研究所、国立大学法人東京工業大学、国立大学法人東北大学、株式会社サイバーエージェント、国立大学法人東海国立大学機構、及び株式会社Kotoba Techno logies Japan (以下「開発者」といいます)による、スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発の成果物として公開する大規模言語モデル（以下「Fugaku-LLM」といいます）の利用に関する条件を定めるものです。Fugaku-LLMの利用者（以下「利用者」といいます）は、本規約に同意した上でFugaku-LLMを利用するものとします。 \n\n第１条（利用許諾） Fugaku-LLMの利用者は、本規約に従い、Fugaku-LLMを商用または非商用目的を問わず利用することができ

misshiki 2024/05/13

自然言語処理

リンク

スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 : 富士通

PRESS RELEASE 2024年5月10日東京工業大学東北大学富士通株式会社理化学研究所名古屋大学株式会社サイバーエージェント Kotoba Technolgies Inc. スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開日本語能力に長け、研究・ビジネス利用にも期待要点日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルを公開スーパーコンピュータ「富岳」の性能を最大限に活用した分散並列学習を実現 AI基盤モデルを科学研究に活用する「AI for Science」など革新的な研究やビジネスにつながる概要東京工業大学学術国際情報センターの横田理央教授の研究チームと東北大学大学院情報科学研究科の坂口慶祐准教授、富士通株式会社人工知能研究所の白幡晃一シニアプロジェクトディレクター、理化学研究所のMohamed

misshiki 2024/05/13

“スーパーコンピュータ「富岳」を用いて学習した日本語能力に優れた大規模言語モデル「Fugaku-LLM」を2024年5月10日に公開した。”

リンク

「富岳」で学習した日本語向け国産AI「Fugaku-LLM」公開

misshiki 2024/05/13

“大規模言語モデル「Fugaku-LLM」が公開された。モデルはHugging Faceにて公開されており、ライセンスに従って研究および商業目的での利用が可能。”

リンク

スパコン「富岳」で開発のAIが完成報道陣に公開 | NHK

世界最高クラスの計算性能を持つスーパーコンピューター「富岳」を使って開発されたAIが完成し、10日、報道陣に公開されました。生成AIの開発の基盤となる大規模言語モデルと呼ばれるAIで、開発の担当者は「今後、日本語に特化した国産の生成AIのさまざまな研究・開発に活用されることを期待したい」と話しています。開発された大規模言語モデル「FugakuーLLM」は、世界最高クラスの計算能力を持つスーパーコンピューター「富岳」を活用した国産のAIの研究開発プロジェクトとして、去年5月から東京工業大学や東北大学、富士通、理化学研究所などが進めてきたもので、10日、研究成果の発表会が東京目黒区の東京工業大学で行われました。発表会では、FugakuーLLMはAIのモデルが一から独自に構築されているため、透明性と安全性に優れていることや学習データのおよそ6割を日本語のコンテンツから学習したことで、日本語

misshiki 2024/05/13

“開発された大規模言語モデル「FugakuーLLM」は、世界最高クラスの計算能力を持つスーパーコンピューター「富岳」を活用した国産のAIの研究開発プロジェクト”

リンク

D＆AやAIなどに取り組むリーダーには「経営層との密接なコミュニケーション」が不可欠　ガートナージャパン

D＆AやAIなどに取り組むリーダーには「経営層との密接なコミュニケーション」が不可欠　ガートナージャパン：価値を「分かりやすい形で示すこと」が重要ガートナージャパンは、年次調査「最高データ／アナリティクス責任者（CDAO）サーベイ」の結果を発表した。それによると、61％の組織が「破壊的なAI（人工知能）技術の影響を受けて、データ／アナリティクスのオペレーティングモデルの進化や再考を余儀なくされている」という。

misshiki 2024/05/13

“61％の組織が「破壊的なAI（人工知能）技術の影響を受けて、データ／アナリティクスのオペレーティングモデルの進化や再考を余儀なくされている」”

リンク

Google検索の品質の悪さをどのように改善するのかなどについてスンダー・ピチャイCEOが回答したインタビューが公開される

ジャーナリストのエミリー・チャン氏がGoogleのスンダー・ピチャイCEOに独占インタビューを行い、検索にAIを取り入れているGoogleの思惑や、検索結果に表示されるページの質が悪くなっている件などについて尋ねました。 Google CEO Sundar Pichai and the Future of AI | The Circ uit - YouTube Video: Alphabet CEO Sundar Pichai Lays Out Google’s AI Roadmap - Bloomberg https://www.bloomberg.com/news/articles/2024-05-09/google-parent-alphabet-is-said-to-progress-in-talks-with-hubspot 2015年のCEO就任時から「会社はAIファーストである

misshiki 2024/05/13

“...ユーザーにとって価値のないコンテンツに対処する。”頼むよ。ちなみに自分の観測範囲では、はてブの影響力が激減して、Google Discoverの影響力が増えており、サイト運営のGoogle依存は高まってしまっている...。

Google
SEO

リンク

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

misshiki 2024/05/13

“サービス横断の検索や、AIとのチャットが可能”

人工知能

リンク

Atlassian Rovo: AI でチームの生産性を最大限に高める | Atlassian

Rovo では、チームが選択したすべての SaaS アプリからの情報検索、作業によるナレッジの蓄積と繰り返し学習、仮想エージェントとの迅速な連携が可能になります。

misshiki 2024/05/13

Atlassian Rovo

人工知能

リンク

「GitHub Copilot全社導入」の前にたちはだかった3つの壁　ZOZOはどう乗り越えたか

生成AIのビジネスへの利活用の一環として、AIプログラミング補助ツール「GitHub Copilot」の導入に踏み切る企業が増えている。ファッションECサイト「ZOZOTOWN」を運営するZOZOもその一つで、2023年5月に法人向けサービスである「GitHub Copilot Business」を全社導入した。 ZOZOには約500人のエンジニアが所属しており、その全員がGitHub Copilot Businessを利用できるようにした。一方で、AIツールの全社導入に当たっては、セキュリティや費用対効果など、検討すべき点も多い。ZOZOではどのような検討の結果導入に至ったか、同社のテックリードを務める堀江亮介さん（技術本部技術戦略部CTOブロック）が公開している外部向け資料からひもとく。全社導入を進める際、ZOZOでは「セキュリティ上の懸念」「ライセンス侵害のリスク」「導入による費用

misshiki 2024/05/13

“「GitHub Copilot」の導入に踏み切る企業が増えている。ファッションECサイト「ZOZOTOWN」を運営するZOZOもその一つで、2023年5月に法人向けサービスである「GitHub Copilot Business」を全社導入した。”

リンク

NVIDIA製を“28倍”効率化　生成AI時代のゲームチェンジャー「サンバノバ」の正体

NVIDIA製を“28倍”効率化　生成AI時代のゲームチェンジャー「サンバノバ」の正体：「サンバノバ」の正体【前編】（1/2 ページ） 2022年末のChatGPTの“衝撃”以降、さまざまな企業が生成AIの開発に注力している。ソフトバンクも、英アーム社をはじめ海外企業と協働しながら、開発を進めている。それを支える企業の一つが、米シリコンバレーに拠点を置くSambaNova Systems（サンバノバシステムズ）だ。サンバノバでは、AIに強いプロセッサーを開発しており、市場の大部分を占めるNVIDIA製のチップに代わるものとして期待が集まっている。特にサンバノバの最新製品「SN40L」は、NVIDIA製の「DGX H100」と比較して28倍低いTCO（総保有コスト、Total Cost of Ownership）を実現し、企業にとって低コスト化を実現するものとしている。生成AI時代を迎

misshiki 2024/05/13

人工知能

リンク

あなたのChatGPT活用はじめの一歩

なお、ChatGPTはスマートフォンアプリも提供されており、GPT-3.5ならば無料で利用可能だ。モバイル版の「Plus」は、アプリ内課金により、Androidで月額2860円、iOSで月額3000円（2024年5月10日現在）となっている（同一アカウントであれば、Web版とスマートフォン版の両方の利用が可能）。上記の他には、チーム／企業向けの「Team」と「Enterprise」というプランもあり、「Plus」の機能に加え、ワークスペースの管理機能やセキュリティ機能などがサポートされる。詳細は、ChatGPTの「Pricing」ページを参照してほしい。 ChatGPTの始め方 Windows 10／11、macOSなどでは、Webブラウザで「ChatGPT」ページを開くことでChatGPTが利用できる。「ChatGPT」で検索すると、ChatGPTのAPIを利用するなどした類似のドメイ

misshiki 2024/05/13

“ChatGPTとはどういったものなのか、また基本的な設定や使い方について解説する。”

リンク

AIによるポルノコンテンツ生成を認めるべきかOpenAIが検討中

チャットAI「ChatGPT」や画像生成AI「DALL-E」を開発するOpenAIが、ユーザーに対し「ポルノや流血表現、中傷などを含む」コンテンツを自社のAI製品を通じて生成できるようにすることを検討中であることを明らかにしました。 OpenAI considers allowing users to create AI-generated pornography | Artificial intelligence (AI) | The Guardian https://www.theguardian.com/techno logy/article/2024/may/09/openai-considers-allowing-users-to-create-ai-generated-pornography これまでOpenAIは科学的資料や教育資料などを除き、「性的に露骨なコンテンツや暗示的な

misshiki 2024/05/13

“「ChatGPT」や画像生成AI「DALL-E」を開発するOpenAIが、ユーザーに対し「ポルノや流血表現、中傷などを含む」コンテンツを自社のAI製品を通じて生成できるようにすることを検討中”

リンク

アップル、iPhoneへのChatGPT搭載でオープンＡＩとの合意に近づく

米アップルが対話型人工知能（ＡＩ）「ChatGPT」を開発した米オープンＡＩの技術をiPhoneに採用することで合意に近づいている。事情に詳しい複数の関係者が明らかにした。自社デバイスに人工知能（ＡＩ）機能を付加する広範な取り組みの一環だという。非公開情報だとして、これら関係者が匿名で明らかにしたところでは、両社はアップルの次期iPhone用基本ソフト（ＯＳ）「iOS 18」へのChatGPT機能の統合に向け合意条件を最終調整している。アップルはまた、アルファベット傘下のグーグルと同社のチャットボット「Gemini」のライセンスについて協議中。いずれの交渉も合意に至っていない。アップルとオープンＡＩの合意がまとまれば、アップルは来月発表する予定の新たなＡＩ機能に人気の高いChatGPTを含めることができる。ブルームバーグは４月、両社の協議が再開されたと報じた。ただ、すぐに合意が発表され

misshiki 2024/05/13

“米オープンＡＩの技術をiPhoneに採用することで合意に近づいている。事情に詳しい複数の関係者が明らかにした。自社デバイスに人工知能（ＡＩ）機能を付加する広範な取り組みの一環だという。”

OpenAI

リンク

OpenAI、Google I/O前日に何かを発表へ　「GPT-5でも検索でもないよ」とアルトマンCEO

「検索エンジンでもない」としているのは、米Reutersが11日、OpenAIが13日に検索エンジンを発表するという予測を報じたことを受けたものだろう。ライブ配信のタイミングが米Googleの年次カンファレンス「Google I/O 2024」の基調講演配信の24時間前に設定されていることも、Googleと競合する発表になるのではないかと予測させる。 Googleはこの基調講演で、GeminiなどのAI関連の多数の発表をするとみられる。関連記事 OpenAI、コンテンツのスクレイピングを遮断するツール「Media Manager」を2025年までに提供へ OpenAIは、クリエイターが自分のコンテンツが生成AIのトレーニングにどう使われるかを制御できるツール「Media Manager」を開発中と発表した。2025年までに提供する計画だ。 OpenAI、ディープフェイク対策ツール「DA

misshiki 2024/05/13

“米OpenAIは5月10日（現地時間）、13日午前10時（日本時間の14日午前2時）に「ChatGPTとGPT-4」に関する更新についてライブ配信するとXで告知した。”

OpenAI

リンク

オープンＡＩ、13日に新プロダクト発表－「GPT-5」でも検索でもない

対話型人工知能（ＡＩ）「ChatGPT」を開発した米オープンＡＩは、米太平洋時間13日午前10時（日本時間14日午前２時）にライブ配信を通じて製品アップデートを発表するとウェブサイトに発表した。ＡＩ界の巨人がどのような大型リリースを計画しているのか、臆測を呼んでいる。オープンＡＩはこのイベントで検索プロダクトを発表することはないとしている。アルファベット傘下のグーグルとＡＩ検索スタートアップ（新興企業）のパープレキシティに対抗する機能を、オープンＡＩは開発中だ。発表は人気の「ChatGPT（チャットＧＰＴ）」とそのＡＩモデルのアップデートが中心になる。ＧＰＴ－４のリリースからすでに１年余りが経過。新しいモデルの発表が待望されている。同社はしかし、このイベントはシリーズ最新ＧＰＴ－５のローンチではないという。サム・アルトマン最高経営責任者（ＣＥＯ）は10日、ソーシャルメディア「Ｘ（旧ツ

misshiki 2024/05/13

“発表は人気の「ChatGPT」とそのＡＩモデルのアップデートが中心。...新しいモデルの発表が待望されている。同社はしかし、このイベントはシリーズ最新ＧＰＴ－５のローンチではないという。”

リンク

AppleとOpenAIの契約が最終調整へ、iOS 18にChatGPTを搭載するとみられる - ライブドアニュース

Appleがをに搭載するためのOpenAIとの提携を協議しており、条件を調整する最終局面に到達しているとBloombergが報道しました。 Apple Closes in on Deal With OpenAI to Put on - Bloomberg https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone 18: Apple finalizing deal to bring to - 9to5Mac OpenAI confirms May 13 event for updates https://9to5google.com/2024/05/10/openai-may-13-event-chatgpt/ Bloomber

misshiki 2024/05/13

“AppleがChatGPTをiPhoneに搭載するためのOpenAIとの提携を協議しており、条件を調整する最終局面に到達しているとBloombergが報道しました。”

OpenAI
Apple

リンク

OpenAIと大手報道機関の契約内容を示す資料が流出し「優先的表示」などの優遇条件が明らかに

OpenAIはAP通信やFinancial Timesといった大手報道機関と戦略的パートナーシップを提携しており、各報道機関の記事をChatGPT内に表示する契約を結んでいます。このOpenAIと報道機関の契約内容については不明点が多いのですが、新たに海外メディアのAdweekが契約に関する資料を入手してその内容を報じました。 Leaked Deck Reveals OpenAI's Pitch on Publisher Partnerships https://www.adweek.com/media/openai-preferred-publisher-program-deck/ OpenAIは報道機関とのパートナーシップ提携を進めており、すでに「Financial Times」「AP通信」「アクセル・シュプリンガー」「ル・モンド」「プリサ・メディア」といった大手報道機関とのパートナー

misshiki 2024/05/13

“OpenAIから報道機関への支払いは「データへのアクセスに対する固定ライセンス料」と「チャット内に表示した回数に応じて変動する利用料」の2種類に分かれている。また、「...新たな記事のスクレイピングに重点...」”

OpenAI

リンク

【いま知っておくべき5つのニュース】コンテンツホルダーはOpenAIと協業すべきか敵対すべきかほか［2024/4/25～5/8］

misshiki 2024/05/13

“コンテンツホルダーとしては、生成AIの開発会社とライセンス契約をしたり、協業をしたりする道を選ぶのか、それともコンテンツの勝手な利用を許さないという姿勢で敵対的な道を選ぶのかという2つに分かれている。”

OpenAI

リンク

ソフトバンクグループ「AI革命」に10兆円　孫正義氏の構想動き出す - 日本経済新聞

【この記事のポイント】・AI向け半導体の開発・製造にファブレス形式で参入・データセンターや発電事業にも進出、総投資額は10兆円規模・「世界で最もAIを活用するグループ」へ脱皮図るソフトバンクグループ（SBG）の孫正義会長兼社長が掲げる「AI（人工知能）革命」が動き出す。AI向け半導体の開発・製造を皮切りに、データセンターやロボット、発電事業にも事業を拡大する計画だ。投資額は最大で10兆円規模とな

misshiki 2024/05/13

人工知能

リンク

光源を指定して画像の背景を違和感なく変更できる生成AIツール「IC-Light」をControlNetの作者が公開したので使ってみた

ControlNetの開発者として知られるLvmin Zhang氏が、画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」を公開しました。 GitHub - lllyasviel/IC-Light: More relighting! https://github.com/lllyasviel/IC-Light IC-Lightは画像の光源の種類や位置を指定しつつ背景を別物に置き換えられるAIツールです。IC-Lightはローカルにインストールして使用可能。さらに、インストール不要で使えるデモサイトも用意されていたので、実際にデモサイトでIC-Lightを使って画像を加工してみました。 IC-Lightのデモサイトには、以下のリンクをクリックするとアクセスできます。 IC Light - a Hugging Face Space by lllyasviel h

misshiki 2024/05/13

“画像の光源の位置や光源の種類を自由に指定できる画像編集AIツール「IC-Light」”

人工知能

リンク

あのキャラの声、AIで勝手に再現「無断AIカバー」氾濫　声優と弁護士に聞く「声の守り方」と未来

自分の声やフリーの声素材、著作権フリーの楽曲などで作るのならば問題はない。関係者を悩ませているのは、声優や歌手などの声を勝手に使った“無断AIカバー”だ。人気歌手や声優の声を無断でAIに学習させ、無関係な歌を歌わせたり、セリフを言わせたりする無断AIカバーは、アニメファンなどが好きなキャラの声で勝手に制作し、動画SNSなどで人気を集めている。声そのものが商品である声優にとって、無断AIカバーが作られるのは深刻な問題だ。「早急に何とかしたいと思っているのですが……」。声優の甲斐田裕子さん（アニメ業界の立て直し・発展を目指す有志団体「日本アニメフィルム文化連盟（NAFCA）」理事）は、対策の難しさに頭を抱える。声を守ることに特化した法律がないことや、作品の関係者が多岐にわたること、関係者の間でも意見が割れていることなどが、問題を複雑にしている。声優が自らの声でAI音声を作り、新たなビジ

misshiki 2024/05/13

“自分の声やフリーの声素材、著作権フリーの楽曲などで作るのならば問題はない。関係者を悩ませているのは、声優や歌手などの声を勝手に使った“無断AIカバー”だ。”

リンク

NYT記者が分析する､AIが抱える最大のリスク

AIが抱える最大のリスクはいったい何か？ ――AI 技術が社会や人間にどう影響するか見極めるには時間がかかると言いますが、では、現時点での最大のリスクはいったい何でしょうか。それは「テクノロジーが社会の先を行ってしまうこと」です。今、私たちが行っているのは、人類に対する制御不能な実験です。だから、われわれ人間が、いろいろな場面で機械の指示に従おうとしている。欧州では、リスクに基づく規制管理レベルを定めるなど、AIに対する幅広いアプローチを行っています。「雇用や融資、刑事司法といったリスクの高い分野においても、AIに仕事を任せてよいものか？」「AIにローンを組ませることはできるのか？」「AIを刑務所に送り込むことができるのか？」。今挙げたようなハイリスクの分野では、規制をかけるべきでしょう。また、AIシステムが出した結論があなたに不利だった場合には、「どんな方法でその結論に至ったのか」を知

misshiki 2024/05/13

“「雇用や融資、刑事司法といったリスクの高い分野においても、AIに仕事を任せてよいものか？」「AIにローンを組ませることはできるのか？」...。今挙げたようなハイリスクの分野では、規制をかけるべきでしょう”

リンク

iOS18のAI新機能！ボイスメモでの文字起こしと要約をデバイス上で完結 - iPhone Mania

iOS18の新機能として、iPhone純正の「ボイスメモ」アプリで、人工知能（AI）を活用した文字起こしと内容の要約機能が追加される、と米メディアAppleInsiderが報じています。クラウドにデータを送信せずデバイス上で動作するので、機密情報を含む会議も安心して要約できそうです。 iOS18の「ボイスメモ」で録音、文字起こし、要約が可能に iOS18の「ボイスメモ」アプリで、録音した音声の文字起こしと、その内容の要約が可能になる、とAppleInsiderが事情に詳しい複数の関係者から得た情報として伝えています。 AIによる文字起こしと要約機能は、6月の世界開発者会議（WWDC24）で発表予定のiOS18のほか、iPadOS18、macOS15でも使用可能になる見込みとのことです。 iOS18の「ボイスメモ」アプリでは、画面配置が既存のものから大きく変更され、文字起こし結果が画面の中央

misshiki 2024/05/13

“iOS18の新機能として、iPhone純正の「ボイスメモ」アプリで、人工知能（AI）を活用した文字起こしと内容の要約機能が追加される”

リンク

3D CADに搭載されはじめたAI機能と自動化

連載「テルえもんが見たデジタルモノづくり最前線」では、筆者が日々ウォッチしているニュースや見聞きした話題、企業リリース、実体験などを基に、コラム形式でデジタルモノづくりの魅力や可能性を発信していきます。連載第1回のテーマは「3D CADに搭載されはじめたAI機能と自動化」です。皆さん、こんにちは！　小原照記（おばらてるき）と申します。普段は岩手県の「いわてデジタルエンジニア育成センター」という施設で3D CADを中核とした、デジタルエンジニアの育成と“企業の困りごと”を聞いて支援する仕事をしています。当センターではいろいろな3D CADをはじめとしたデジタルモノづくりに関する設備を保有しており、学生や企業の方たち向けに講習会を開催したり、3Dプリンタでの試作や3Dスキャナーを使用しての検査／リバースエンジニアリングなどの受託を行ったりしています。また、筆者個人のSNSやブログでは「テルえ

misshiki 2024/05/13

“CAD／CAEの最新動向として、AI機能の搭載が各ベンダーで進んでいます。ここからは「3D CADに搭載されはじめたAI機能と自動化」をテーマに、各ベンダーやツールの動向、方向性などについてご紹介”

人工知能

リンク

ロボット制御AIのオフライン強化学習で東芝が世界初と世界最高精度を達成

東芝は、あらかじめ作成したデータでロボット制御に用いられるAIの機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発した。東芝は2024年5月10日、あらかじめ作成したデータでロボット制御に用いられるAI（人工知能）の機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発したと発表した。これまでロボット制御AIのオフライン強化学習では数千以上のデータが必要だったが、新技術は10分の1以下のとなる100程度のデータで精度を向上できる。公開ベンチマーク環境によるシミュレーション評価の結果、平均成功率が従来比で2倍となる72％に向上した。少量の画像データから複雑なロボット操作を高精度に制御するAI 技術は「世界初」（東芝）、公開ベンチマーク環境における72％の成功率は「世界最高精度」

misshiki 2024/05/13

“東芝は、あらかじめ作成したデータでロボット制御に用いられるAIの機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発した。”

人工知能

リンク

「AI兵器」の衝撃 “機械は犠牲を理解できず”暗い未来の不安 | NHK | WEB特集

冷戦のさなか、旧ソビエト軍の1人の中佐の判断が核戦争の勃発を防いだとされる出来事があった。アメリカ軍の核ミサイル攻撃を探知した監視システムの情報を、状況から誤作動と判断、ソビエト側の報復攻撃を防いだ。しかし今、各国でAI＝人工知能を使って、より自律性を高めた「AI兵器」の開発競争が激化している。すでに戦地では20秒以内に攻撃の判断を求められるAIシステムの使用が伝えられている。人間の判断が介在しない究極のAI兵器が登場したら、この世界はどうなるのだろうか。（国際部記者山下涼太） 2022年2月に始まったロシアによる軍事侵攻に対抗するウクライナ。物量で上回る大国との消耗戦になる中、遠隔操作型の無人機で偵察や監視・攻撃までを行い、善戦につなげてきた。しかし、このところロシア側の電波妨害により、無人機の通信が途絶えて制御を失うケースが増え、無人機の損耗が増加。このため、ウクライナ軍

misshiki 2024/05/13

“各国でAI＝人工知能を使って、より自律性を高めた「AI兵器」の開発競争が激化している。”

人工知能

リンク

元ピクサーのアニメーターが語る｢ハリウッドでAIが通用しない理由｣

元ピクサーのアニメーターが語る｢ハリウッドでAIが通用しない理由｣2024.05.11 11:0015,285 Matt Novak - Gizmodo US ［原文］（そうこ）昨今、AIが生成した動画が良くも悪くも常に話題になっています。ネタ動画を作るだけではなくて、これでプロの現場・ハリウッドも劇的に変わるのではないか？という声も聞こえてきます。その問いに｢No｣と答えるのは、『トイ・ストーリー』や『ファインディング・ニモ』などの制作に携わった、元Pixarアニメーターのクレイグ・グッドさん。グッドさんいわく、AIをプロの現場で使うには、関係者全員をイラつかせてしまう大きな欠点があるといいます。それは、微調整が効かないこと。生成AIは、作りたいものをテキストで入力するだけで画像や動画を作り出します。何もないゼロ状態から作り出されるものとして、正直驚くべき出来です。ただ、現

misshiki 2024/05/13

“AIをプロの現場で使うには、関係者全員をイラつかせてしまう大きな欠点があるといいます。それは、微調整が効かないこと。”

人工知能

リンク

神戸市、全国初の“包括的なAI条例”を施行――制定の背景と必要性、市の最高デジタル責任者が語る　リスクを認識してAIを安全に活用

misshiki 2024/05/13

“神戸市は「神戸市におけるAIの活用等に関する条例」を今年2月に市議会に提出し、3月に可決、段階的に施行されることが決まったと発表した。”

人工知能

リンク

生成AI、那覇市はどう活用？　職員も思いつかなかった、AIが提案したアイデアとは

2023年11月にあった那覇市長定例記者会見。沖縄の言葉で「はいさいぐすーよー。ちゅーうがなびら（こんにちは皆さん。ご機嫌いかがでしょうか）」から始まった会見は、市の業務での生成AI 本格導入に向けて「那覇市生成AI活用方針」を策定したというコメントを読み上げていた。「いっぺーにふぇーでーびる（ありがとうございました）」と締めたところで、知念覚市長がこう付け加えた。「なお、このコメントもですね、生成AIによって下書きを作成し、職員が校正を行って作っております」沖縄県内ではいち早く生成AI活用を導入した那覇市。同市DX推進室の長嶺伶生さんは「たたき台を手直しするだけで作れるので負担は少なくなっています」とそのメリットを挙げる。住民の個人情報などデリケートな情報も多く扱う行政の現場。その利用にあたっては慎重に活用方針とガイドラインを作成し、日々の業務活用につなげている。行政が生成AIな