ブックマーク / www.itmedia.co.jp (84)

  • OpenAI、5月に予告したChatGPTの高度な音声モード提供を延期

    OpenAIは6月25日(現地時間)、5月の発表イベントで予告したChatGPTアプリのGPT-4oベースの新しい高度な音声モードのα版提供開始を、当初の6月下旬から延期すると発表した。「リリースの基準に達するまでにあと1カ月必要」としている。 「例えば特定のコンテンツを検出して応答を拒否するモデルの機能を改善している」という。 高度な音声モードは、感情や非言語的なジェスチャーの意味を理解して応答できるというもの。これにより、AIとのリアルタイムで自然な会話が可能になるとしている。 秋にはすべての有料版ユーザーが利用可能になる予定という。また、5月にデモを行った動画機能と画面共有機能の展開にも取り組んでいる(提供時期は未定)と説明した。 高度な音声モードをめぐっては、女性の音声が俳優のスカーレット・ヨハンソンの音声に似ていると話題になった。ヨハンソンはこの件に対応するため弁護士を雇ったと

    OpenAI、5月に予告したChatGPTの高度な音声モード提供を延期
    macro1597
    macro1597 2024/06/26
  • “GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」

    東大発のAIスタートアップ企業であるELYZA(東京都文京区)は6月26日、GPT-4を超える性能を持つ日語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。 Llama-3-ELYZA-JP-70Bは、米MetaのLLM「Llama-3-70B」をベースに日語の追加事前学習や指示学習を行って開発したモデル。元のLLMから、日語性能が大きく向上しているのが特徴。2つのベンチマークで日語性能を評価したところ、米OpenAIのLLM「GPT-4」の性能を上回り、米AnthropicのLLM「Claude 3 Sonet」や米GoogleのLLM「Gemini 1.5 Flash」とも同等かそれ以上の性能を達成したという。

    “GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」
    macro1597
    macro1597 2024/06/26
  • 現社長の“AIクローン”が事業承継へ 堺の建設会社が挑戦中 「死んだ後も知見を残せるようにしたい」

    堺市の建設会社、進和建設工業は生成AIを使ったデジタルクローンで日初の事業承継に挑むと発表した。6月21日、現社長が退いて会長に就任し、副社長が新社長に昇格するが、あわせて現社長のデータを学習させたAIクローンを試験導入する。 顔や声、方言まで社長そっくりのクローンで、すでに開発を進めており、今は一問一答に応じられるレベル。2026年3月をめどに、事業計画立案などもこなせるまでに”成長”させる。後継者難や人手不足が深刻化している建設業界において、課題の打開策となるか注目される。 クローンはAIベンチャーのオルツ(東京都港区)が開発した。同社は12年までに国内の労働人口5000万人分をAIクローンで補う目標も掲げている。 24年4月から、マンションの設計・施工などを手がける進和建設工業の西田芳明社長(72)の著書やブログ、講演録などを取り込みクローンに学習させてきた。 クローンに経営哲学を

    現社長の“AIクローン”が事業承継へ 堺の建設会社が挑戦中 「死んだ後も知見を残せるようにしたい」
    macro1597
    macro1597 2024/06/20
    AIの遺電子にもあった担い手や跡継ぎが不足している職人技や伝統工芸を、AIロボットに継承させる回に発想が似てる。
  • 下請け事業者にデザインのやり直し“計2万4600回”を無償で要求──大阪の印刷事業者で発覚 公取委が勧告

    下請事業者に計2万4600回のデザインのやり直しを無償でさせていた──印刷事業を手掛ける大阪シーリング印刷(大阪市)は6月19日、下請代金支払遅延等防止法に違反する行為があり、公正取引委員会から勧告を受けたと発表した。 大阪シーリング印刷では、品容器に貼るラベルやパッケージなどのデザイン作成業務を下請事業者に委託している。同社は下請事業者が作成したデザインに対して一度は問題がないと判断したものの、顧客からやり直しの依頼があったことを理由に、2022年4月~2023年10月までの間、計2万4600回のデザインのやり直しを下請事業者36人に無償でやらせていたという。 公取委はこの行為を「請事業者の利益を不当に害していた」と判断。大阪シーリング印刷に対して、違反行為の再発防止に努めるよう求め、下請法に関する自社研修の実施要請を出すなど勧告した。 大阪シーリング印刷は「下請事業者さまにご迷惑をお

    下請け事業者にデザインのやり直し“計2万4600回”を無償で要求──大阪の印刷事業者で発覚 公取委が勧告
    macro1597
    macro1597 2024/06/20
    プロダクトデザインこそ生成AIを活用すべきで、自分の納得いくものが出るまで何度でも試せばよい。
  • 日経、大規模言語モデル「NiLM」を開発 約40年分の記事データのみ学習、経済領域に特化

    経済新聞社は4月24日、経済情報に特化した大規模言語モデル「NIKKEI Language Model」(NiLM、にるむ)を開発したと発表した。約40年分の日経済新聞などの記事のみを学習したAIモデル。130億と700億パラメータの2つのモデルを開発したという。 NiLMの学習には、ネット上の公開情報は利用していない。約40年分の日経済新聞の記事や、日経産業新聞と日経MJ、日経ヴェリタス、NIKKEI Primeなどの専門媒体、日経BPの各媒体から同社が著作権と使用権を持つ記事だけを学習に使ったとしている。 130億パラメータのモデルは、一般公開されているモデルは使わず、独自にモデルを構築。700億パラメータのモデルは、米Metaの「Llama 2」の700億パラメータモデルと、Llama 3の80億パラメータのモデルなどをベースに開発した。学習に使った日語コーパスのトークン量

    日経、大規模言語モデル「NiLM」を開発 約40年分の記事データのみ学習、経済領域に特化
    macro1597
    macro1597 2024/04/25
  • GPT-4に日本語特化モデル OpenAI Japan始動会見で発表

    OpenAIは4月15日、大規模言語モデル「GPT-4」について、日語に最適化したカスタムモデルを発表した。日語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表 OpenAIは、11月に発表した「GPT-4 Turbo」のプレビュー版をリリースすると発表した。「GPT-4」が怠け者になってきたという苦情を受け、怠けにくくしたという。公式版は数カ月中にリリースする計画だ。 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenA

    GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
    macro1597
    macro1597 2024/04/15
  • Microsoftも出資するAI企業Mistral、オープンソースLLM「Mixtral 8x22B」リリース

    仏新興AI企業のMistral AIは4月10日、オープンソースLLM(大規模言語モデル)の「Mixtral」の新版「Mixtral 8x22B」をリリースしたとXの公式アカウントでポストした。 このポストはファイルをTorrentでダウンロードできることを示しているが、稿執筆現在、このLLMのレビューなどはまだ出ていないようだ。 先代のMixtral 8x7Bは多くのベンチマークで米OpenAIGPT-3.5や米MetaのLlama 2 70Bを上回る性能を示した。名称の7Bや22Bがパラメータ数を表しているかどうかは不明だが、先代の3倍以上であると推測してよさそうだ。

    Microsoftも出資するAI企業Mistral、オープンソースLLM「Mixtral 8x22B」リリース
    macro1597
    macro1597 2024/04/12
  • Microsoft、中国のAIによる選挙操作を具体例で再警告

    Microsoftは4月4日(現地時間)、中国が地政学的利益を高めるために世界の有権者の分断化を実験し、AIコンテンツを強化していると公式ブログで警告した。 Microsoftによると、中国SNSの偽アカウントで既に分断化してるテーマに関するアンケートを行い、分断を助長し、米国、韓国、インドなどで年内に予定されている選挙の結果に有利な影響を与える可能性があるという。 同社の脅威分析センター(MTAC)は同日公開した報告書(PDF)で、こうしたコンテンツがユーザーに与える影響は依然として低いが、コンテンツを増強する実験が増えており、将来的には効果的になる可能性があるとしている。 中国は既に、Microsoftが「Storm 1376」と呼ぶグループを使って、1月の台湾総統選挙でAIによる偽情報キャンペーンを実施したという。例えば、11月に出馬を取りやめたテリー・ゴウ氏が別の候補者を支持す

    Microsoft、中国のAIによる選挙操作を具体例で再警告
    macro1597
    macro1597 2024/04/08
    反AIとの分断や反ワクとの分断も、さらに言えばきのこたけのこ論争も、対立が激化するように工作されている気がする
  • OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO

    Google傘下のYouTubeのニール・モーハンCEOは4月4日(現地時間)、米Bloombergとのインタビューで、米OpenAIがもし自社のAIモデルのトレーニングにYouTube動画を使っているとすれば、それはYouTubeポリシーの「明らかな違反」になると語った。 OpenAIのミラ・ムラティCTO(最高技術責任者)は3月、米Wall Street Journalとのインタビューで、2月に発表した動画生成AIモデル「Sora」のトレーニングにYouTube、Facebook、Instaramなどの動画を使ったかどうか問われ、分からないと答えた。 モーハン氏は「クリエイターが努力して作った成果をYouTubeにアップロードするとき、彼らは利用規約が順守されると信じている」ので、「トランスクリプト(文字起こし)や動画などのダウンロードは許可されておらず、それは明らかな違反だ」と語っ

    OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO
    macro1597
    macro1597 2024/04/05
    まあ当然の牽制だよね。OpenAIはGoogleのビジネス基盤を奪おうとしてるわけだし、しかもTransformerベースのAIで
  • 映画「Winny」、アマプラ見放題に登場

    ファイル共有ソフト「Winny」を巡り、開発者の金子勇さんが著作権法違反ほう助容疑で逮捕・起訴された"Winny事件”を題材にした映画「Winny」が、4月3日からAmazonプライムビデオの見放題コンテンツに登場した。 脚と監督は松優作さん。金子勇さん役を俳優の東出昌大さん、サイバー犯罪に詳しい弁護士、壇俊光さん役を三浦貴大さんが務めた。金子さんと弁護士が無罪を勝ち取るまでの7年間の軌跡を追う。 2023年3月に劇場公開。興行成績はふるわなかったが、後に再評価される日発の技術を扱ったことや、映画制作の起点となったのがクラウドファンディングだったこと、配給をKDDIが担当したことでも注目を集めた。 映画タイトルの「Winny」は2004年に登場したファイル共有ソフト。技術的には革新的だったが、映画音楽の違法アップロードが横行して社会問題となり、金子さんは著作権法違反ほう助容疑で20

    映画「Winny」、アマプラ見放題に登場
    macro1597
    macro1597 2024/04/05
  • 次世代Siri? Apple、画面内の状況を理解できるAI「ReALM」を論文発表 GPT-4超えとアピール

    AppleMachine Learning Researchが、論文投稿サイト「arXiv」において「ReALM: Reference Resolution As Language Modeling」を発表した。ReALMは、画面上の物体への曖昧な言及や、会話での背景の文脈を理解し、音声アシスタントより自然なやりとりを可能にする新たな人工知能システムだという。 ReALMの最小のモデルでは、画面上の参照において5%以上の絶対的な改善を得ることができたという。また、GPT-3.5とGPT-4に対するベンチマークを行い、ReALMの最小モデルはGPT-4と同等の性能を達成し、ReALMの大型モデルはGPT-4を大幅に上回る性能を達成したと説明する。 Appleは、会話アシスタントには、参照を含むコンテキストを理解できることが不可欠だと説明していて、ユーザーが画面に表示されている内容について

    次世代Siri? Apple、画面内の状況を理解できるAI「ReALM」を論文発表 GPT-4超えとアピール
    macro1597
    macro1597 2024/04/04
    人間の知覚は視覚情報に頼っている割合が大きいので、それを踏まえるとAppleのAIは画像理解に長けていて軽量だから後々追い上げてきそう。
  • 「Transformer」後継と期待される「RetNet」活用 PKSHAが日英対応の独自LLMを開発 日本MSも協力

    AIベンチャー・PKSHA Technology(東京都文京区)は3月28日、「RetNet技術を活用した日英大規模言語モデル(LLM)を開発したと発表した。RetNetを使用した日英モデルは世界初で、日マイクロソフトの技術支援により実現。PKSHA Technologyの上野山勝也代表は「これによって生成AIの活用が一段前に進む」と自信を見せる。 左から、PKSHA Communication、PKSHA Workplaceの佐藤哲也代表、PKSHA Technologyの上野山勝也代表、日マイクロソフト 執行役員 常務 最高技術責任者の野嵜弘倫さん、PKSHA Technology アルゴリズムエンジニア VPoEの森下賢志さん、PKSHA Technology アルゴリズムリードの稲原宗能さん 今回開発したLLMの最大の特徴であるRetNetとは「Retentive Netwo

    「Transformer」後継と期待される「RetNet」活用 PKSHAが日英対応の独自LLMを開発 日本MSも協力
    macro1597
    macro1597 2024/03/29
    10億トークンのLongNetもどこかがやってくれそう
  • 周期性のない図形「ペンローズ・タイル」が量子コンピュータのエラーを訂正? カナダの研究者らが発表

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 カナダの研究所Perimeter Institute for Theoretical Physicsとエジンバラ大学に所属する研究者らが発表した論文「The Penrose Tiling is a Quantum Error-Correcting Code」は、繰り返さないパターンである「ペンローズ・タイリング」が、量子コンピュータの誤り訂正に応用できることを提案した研究報告である。 量子コンピュータは量子力学の原理を利用することで、従来のコンピュータでは解くことが難しい問題を高速に解くことができる。しかし、量子情報は環境ノイズからの影響に

    周期性のない図形「ペンローズ・タイル」が量子コンピュータのエラーを訂正? カナダの研究者らが発表
    macro1597
    macro1597 2024/03/27
  • 「Stable Diffusion」のStability AI、モスタクCEOが辞任

    画像生成AI「Stable Diffusion」で知られる英Stability AIは3月23日金曜日(現地時間)の夜、共同創業者のエマド・モスタクCEOが辞任し、取締役会からも退任したと発表した。取締役会は、シャン・シャン・ウォンCOO(最高執行責任者)とクリスチャン・ラフォルテCTO(最高技術責任者)を暫定CEOに任命した。 モスタク氏は発表文で、「分散型AIを追求するために」辞任すると語った。Xへの一連の投稿で同氏は、競合する米OpenAIや米Anthropicに言及し、より多くの「集中型AI」を開発しても既存の集中型AIには勝てないとも語った。 また、自分がStability AIの議決権のある株の過半数を持っていることが、AIへの権力集中につながり、これが「私たち全員にとって悪影響を及ぼす」と考えて辞任を決めたとも説明した。 モスタク氏の辞任発表の前に、米Forbesは20日、S

    「Stable Diffusion」のStability AI、モスタクCEOが辞任
    macro1597
    macro1597 2024/03/25
  • KDDI、東大発AIベンチャー・ELYZAを連結子会社化 春以降、生成AI関連サービスを提供へ

    KDDIは3月18日、東大発のAIスタートアップ企業であるELYZA(東京都文京区)を連結子会社にすると発表した。資業務提携を結び、4月1日をめどにKDDIグループがELYZAの株式の過半数を保有する。これにより、同社らは「生成AIの社会実装を加速させる」としている。 KDDIが43.4%、グループ会社のKDDI Digital Divergenceが10.0%のELYZAの株式を保有する。同社らは今後、生成AIの利用を担う組織を共同設置し、春以降に順次生成AI関連サービスを企業や自治体向けに提供する。具体的には「オープンモデル活用型の日語汎用大規模言語モデル(LLM)開発」「領域特化型のLLM開発」「生成AIを活用したDX支援・AI SaaS」の3つを提供予定。 KDDIは資業務提携の理由について「生成AI活用による業務効率化や生産性向上の実現が期待される一方、グローバルモデルの利

    KDDI、東大発AIベンチャー・ELYZAを連結子会社化 春以降、生成AI関連サービスを提供へ
    macro1597
    macro1597 2024/03/18
  • 今週、生成AI「Grok」をオープンソースにする──イーロン・マスク氏が発表 「OpenAIはうそつき」

    関連記事 「名前を変えろ」──イーロン・マスク氏、米OpenAIにリプライ “オープン”の意味巡り溝広がる 「Change your name」(名前を変えろ)──米国の実業家であるイーロン・マスク氏は3月6日(現地時間)、米OpenAIに対してX上でそんなコメントを送った。 xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表 イーロン・マスク氏が7月に立ち上げたAI企業xAIは、同社初のAIモデル「Grok」を発表した。まだ初期β段階だが、ベンチマークでは「ChatGPT-3.5」や「Inflection-1」を上回るとしている。 米OpenAI、“イーロン・マスク氏の訴訟”に反論 メール文面も公開 “Open”の意味も明らかに 米OpenAIは、米国の実業家であるイーロン・マスク氏の訴訟を巡る件について、反論するブログ記事を公開した。マスク氏がOpenAIに在籍し

    今週、生成AI「Grok」をオープンソースにする──イーロン・マスク氏が発表 「OpenAIはうそつき」
    macro1597
    macro1597 2024/03/12
  • Anthropic、AIチャット「Claude 3」を3サイズで 日本語力も向上

    無料のclaude.ai稿執筆現在、既に「Claude 3 Sonnet」になっている。月額20ドルの「Claude Pro」にアップグレードすれば「Opus」を利用できるようになる。 コンテキストウィンドウは、最大20万トークン(約15万ワード、または500ページ以上のドキュメント)を受け入れる。Anthropicによると、Opusは「AIシステムの一般的なベンチマークのほとんどで、米OpenAIのGPT-4や米GoogleのGeminiなどの競合するシステムを上回る性能を発揮した」という。また、「複雑なタスクでは人間に近い理解力の流暢さを示し、一般知能の最前線をリードする」としている。 昨年7月にリリースした「Claude 2」と比較して、分析と予測、微妙なコンテンツ作成、コード生成、スペイン語、日語、フランス語などの非英語での会話能力が向上した。2023年8月までのデータでトレ

    Anthropic、AIチャット「Claude 3」を3サイズで 日本語力も向上
    macro1597
    macro1597 2024/03/05
  • スマホ指紋認証の“摩擦音”を録音→指紋を復元する攻撃 中国の研究者らが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国の華中科技大学などに所属する研究者らが発表した論文「PrintListener: Uncovering the Vulnerability of Fingerprint Authentication via the Finger Friction Sound」は、スマートフォンによる指紋認証時の摩擦音を録音し解析することで、その指紋を復元する自動指紋識別システム(AFIS)へのサイドチャネル攻撃を提案した研究報告である。 この攻撃手法は、ユーザーの画面上でのスワイプ動作を利用して指紋の特徴を抽出し、これらの特徴に基づいて、ユーザーの指紋

    スマホ指紋認証の“摩擦音”を録音→指紋を復元する攻撃 中国の研究者らが開発
    macro1597
    macro1597 2024/02/19
  • Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新

    Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスの提供を開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 同社は従来、生成AIの頭脳部分となるLLM(大規模言語モデル)として「Gemini」ブランドを利用し、サービス名は「Bard」として提供していたが、サービス名も今回Geminiに統一。NanoやProなど、すでに発表している3つのLLMのうち、パラメータ数が最大で複雑なタスクをこなせるとしていた「Gemini Ultra」を使ったサービスはこれまで登場していなかった。今回、UltraからAdvancedにリネームしての正式ローンチとなる。 Gemini Advancedは数学、物理学、歴史、法律、医学、倫理を含む57科目の組み合わせを使用するベンチマークテストで人間の専門家を上回る成

    Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新
    macro1597
    macro1597 2024/02/09
  • ソフトバンクの生成AIは「1兆パラメーター目指す」と宮川社長 “蒸留”して「研ぎ澄まされたLLMに」

    ソフトバンク子会社のSB Intuitionsが開発している国産大規模言語モデル(LLM)は、1兆パラメーター超えを目指す──ソフトバンクの宮川潤一社長が2月7日に開催した決算説明会(2024年3月期第3四半期)の中で明らかにした。 同社は2023年10月に国内最大級の生成AI開発向け計算基盤の稼働とLLM開発の開始を発表した。宮川社長によると、開発中のLLMは23年12月末の時点で1300億パラメーターに達し、検証を実施しているという。 当面の目標は「3900億パラメーターの構築。並行してLLMのマルチモーダル化も進める」。文書だけでなく、図表や符号、画像といった入力にも対応したLLMを2024年度中に完成させるという。 さらに「先の話」として、1兆超えのパラメーター数を目指すという。そこから“蒸留”とよばれる、パラメーター数の多いモデルの出力をより小さく軽量なモデルに学習させて計算効率

    ソフトバンクの生成AIは「1兆パラメーター目指す」と宮川社長 “蒸留”して「研ぎ澄まされたLLMに」
    macro1597
    macro1597 2024/02/08