タグ

2023年12月21日のブックマーク (12件)

  • RAG、ファインチューニングとは|生成AI進化の鍵は「ドメイン特化」 | AI専門ニュースメディア AINOW

    最終更新日: 2024年5月15日 人工知能AI技術は、近年劇的な進歩を遂げています。特に、言語生成AIの分野では、GPTシリーズなどのモデルが幅広い用途で活用され、社会に大きな影響を与えています。しかし、これらのモデルは限界も持ち合わせており、特に生成内容の正確性や特定分野への適応能力に課題があります。これらの課題に対処するために、RAG(Retrieval-based Language Model)やファインチューニング技術が開発され、AIの能力をさらに拡大しています。 記事では、生成AIの現状として、特にハルシネーション(誤った情報の生成)や特化分野への適用困難性といった問題点を検討します。さらに、これらの問題を解決するための鍵として、RAGやファインチューニングの技術がどのように重要性を増しているのか、その具体的なメカニズムやユースケースを詳しく解説します。また、今後の課題と

    RAG、ファインチューニングとは|生成AI進化の鍵は「ドメイン特化」 | AI専門ニュースメディア AINOW
    naggg
    naggg 2023/12/21
  • RAGにおけるドキュメント検索精度向上について(実践編)

    損害保険ジャパン株式会社 DX推進部の眞方です。この記事では、RAG(Retrieval Augmented Generative)の構築時に、ドキュメント検索精度の向上を目指して検索モデルの改善を行った際の手法、および結果について解説させていただきます。 概要を知りたい、という方は以前書いた前回の記事を読んでください。 はじめに 今回はRAGにおける検索モデルの改善を目的として、独自のデータを使用してfine-tuneを行いました。 RAGにおける検索(赤枠)の部分を改善する取り組みを行いました。 検索モデル 学習のためのライブラリとしては、sentence transformersを使用しました。また、モデルは日語BERTを使用しています。 データ 今回RAGの対象となるドキュメントは、大きく次の2つが存在しています。 規定集 保険商品の説明等が書かれているドキュメントです(詳細は前

    RAGにおけるドキュメント検索精度向上について(実践編)
  • GPTsより精度の高いRAGシステムの構築

    2 松 和高
 株式会社エクスプラザ リードエンジニア
 X: _mkazutaka
 Github: mkazutaka
 18年にバックエンドエンジニアとしてメルカリに入社。そ 後、ミラ ティブ、フリーランスを得て株式会社エクスプラザに所属。フロント エンドからバックエンドまで幅広く開発しています。
 Code生成系AIと相性がいい 関数型なんじゃないかと
 思って関数型プログラミングを勉強したりしています。 CONFIDENTIAL INFORMATION: Not for Public Distribution - Do Not Copy 3 株式会社エクスプラザ (EXPLAZA, Inc.) 会社名 プロダクト 力で、豊かな暮らしをつくる ミッション 代表取締役CEO 高橋一生 代表者 2020年07月03日 設立 東京都港区六木4丁目8-5 和幸ビル 所在地 会社概要

    GPTsより精度の高いRAGシステムの構築
  • AIは特許の「発明者」になれず、英最高裁が判決

    英最高裁は20日、人工知能(AI)システムが考案した発明品の特許登録を認めない判断を示した。AIが特許権を保有できるかを巡り、英国で画期的な判決が下された形になった。(2023年 ロイター/Dado Ruvic) [ロンドン 20日 ロイター] - 英最高裁は20日、人工知能(AI)システムが考案した発明品の特許登録を認めない判断を示した。発明者は人間か企業でなければならないという知的財産庁の見解を支持し、AIシステムを開発した原告の米科学者の敗訴となった。 原告である米国のコンピューター科学者スティーブン・ターラー氏は、自身のAIシステム「DABUS」が考え出した発明について英国で2件の特許を申請したが、英国の知的財産庁(IPO)は、発明者は機械ではなく、人間か企業でなければならないとして申請を拒否。これを受け、ターラー氏が訴訟を起こしていた。 最高裁は全会一致で同氏の訴えを退け、英国の

    AIは特許の「発明者」になれず、英最高裁が判決
    naggg
    naggg 2023/12/21
    言わなきゃいいじゃん、ってことかー
  • AIが生成したフェイクニュースを掲載するウェブサイトが半年で1000%以上に爆増している

    ChatGPTBardなどの高性能なAIは人間と見分けが付かないような文章を生成できますが、生成する内容が事実であるとは限らず、悪意を持った誰かがフェイクニュースを生成させることもできます。そんなAI生成フェイクニュースを掲載するウェブサイトが2023年5月以降で1000%以上に急増し、政治戦争、自然災害に関するデマがこれまでになく拡散しやすい状況になっていると報じられました。 Tracking AI-enabled Misinformation: Over 600 ‘Unreliable AI-Generated News’ Websites (and Counting), Plus the Top False Narratives Generated by Artificial Intelligence Tools - NewsGuard https://www.newsguard

    AIが生成したフェイクニュースを掲載するウェブサイトが半年で1000%以上に爆増している
    naggg
    naggg 2023/12/21
    困るなぁ。以前にきいた、陸海空、情報、宇宙、の次の認知に関わってくるよねぇ。
  • Apple、限られたメモリで効率的な大規模言語モデル推論を行う方法を開発 | NEWS | Mac OTAKARA

    サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部がサイトに還元されることがあります。 AppleMachine Learning Researchは、arXivに「LLM in a flash: Efficient Large Language Model Inference with Limited Memory」を投稿しています。 大規模言語モデル(LLM)は、現代の自然言語処理の中心的存在であり、様々なタスクにおいて卓越した性能を発揮します。しかし、その集中的な計算とメモリ要件は、特にDRAM容量が限られたデバイスにとって課題となります。 この論文では、モデルのパラメータをフラッシュメモリに保存し、必要に応じてDRAMに取り込むことで、利用可能なDRAM容量を超えるLLMを効率的に実行するという課題に取り組みむと説明しています。 Ap

    Apple、限られたメモリで効率的な大規模言語モデル推論を行う方法を開発 | NEWS | Mac OTAKARA
  • Appleが、LLMのパラメータを「SSDなどの外部フラッシュメモリに保存し」PCで効率的にモデルを使用する手法を開発 | AIDB

    参照論文情報 タイトル:LLM in a flash: Efficient Large Language Model Inference with Limited Memory 著者:Keivan Alizadeh, Iman Mirzadeh, Dmitry Belenko, Karen Khatamifard, Minsik Cho, Carlo C Del Mundo, Mohammad Rastegari, Mehrdad Farajtabar 所属:Apple URL:https://arxiv.org/abs/2312.11514 記事の関連研究:LLMへの入力プロンプトを「意味を保持したまま」高度に圧縮する技術『LLMLingua』 研究背景 LLMは高性能ですが、多くの計算能力とメモリ(情報を一時的に保存する部分)を必要とします。 そのためメモリ容量が限られているデバイス

    Appleが、LLMのパラメータを「SSDなどの外部フラッシュメモリに保存し」PCで効率的にモデルを使用する手法を開発 | AIDB
    naggg
    naggg 2023/12/21
    ブコメにもあったけど、Appleの論文自体が珍しいような・・・
  • 小学校でも活用 生成AIがもたらす学びの革命 | NHK | WEB特集

    “家庭教師”はAI――。そんな時代が、すぐそこまで来ているような気がする。 ChatGPTが公開されてから1年、生成AI教育分野でも存在感が強まっている。 国がことし7月に発表した小中学校での生成AI活用に関する「暫定的なガイドライン」では、リスクに対応できる一部の学校で試験的に取り組み、今後の議論につなげるべきだとされているが、小学生から大学生までさまざまな学びの現場で自主的な活用が始まっている。生成AIがもたらす学びの革命とは。 (科学・文化部記者 絹川千晴)

    小学校でも活用 生成AIがもたらす学びの革命 | NHK | WEB特集
  • 東京都 生成AI導入も 利用する職員 対象の1割にとどまる | NHK

    行政サービスの質を向上させようと、ことし夏に生成AIを導入した東京都では、「何に使っていいかわからない」などの理由から利用する職員が対象の1割にとどまっていることがわかりました。 生成AIをめぐっては、去年11月、ChatGPTが公開されたことをきっかけに利用が急速に拡大していて、東京都でも行政サービスの質を向上させようとことし8月に全局で導入し、およそ5万人の職員が利用できる対象となっています。 導入からおよそ4か月がたち、生成AIがどれほど利用されているのか都が確認したところ、19日の時点で、利用を申請した職員はおよそ5000人と、1割にとどまっていることがわかりました。 都が10月に行った職員へのアンケートでは、「企画のアイデアを考える際に役立った」など業務が効率化されたという意見の一方、「何に使っていいかわからない」とか「利用を申請したもののほとんど使っていない」などの意見もあった

    東京都 生成AI導入も 利用する職員 対象の1割にとどまる | NHK
    naggg
    naggg 2023/12/21
    "何に使っていいかわからない」などの理由から利用する職員が対象の1割に" って、こんなにわかりやすいガイドラインあるのに。。 → https://www.digitalservice.metro.tokyo.lg.jp/ict/pdf/ai_guideline.pdf
  • 「日本は衰退した。何故ならば、中国には抜かれてしまい、インドにも抜かれそうだから」ー中国やインドを舐めてるとしか思えない

    るーでる@柏葉(※パロディです) @rudel101 「日は衰退した。何故ならば、中国には抜かれてしまい、インドにも抜かれそうだから」という類の言説を見かけるたび、中国やインドを舐めてるだろとしか思えない今日この頃、皆様、如何お過ごしでしょうか? 2023-12-20 05:18:18 るーでる@柏葉(※パロディです) @rudel101 産業革命以前の歴史においては、中国とインドは経済では1位と2位を独占し続けていた国でございます。西欧諸国が中国とインドを経済面で追い抜くには産業の構造そのものを変化させるという、言うなれば「ゲームのルールそのものを変えてしまう」という荒業が必要だったわけですね。 2023-12-20 05:21:12

    「日本は衰退した。何故ならば、中国には抜かれてしまい、インドにも抜かれそうだから」ー中国やインドを舐めてるとしか思えない
    naggg
    naggg 2023/12/21
    グラフで、2016年頃に中国がアメリカのGDPを抜いてるんだけど、そうだったっけ・・・?
  • 連合 最低賃金 2035年までに時給1600円超えを 政府目標上回る | NHK

    労働団体の連合は企業が労働者に最低限、支払わなければならない最低賃金について、2035年までに時給1600円を超える水準まで段階的に引き上げる目標を掲げる方針を固めたことがわかりました。 賃上げの機運が高まる中、政府の目標を上回る水準を掲げ、格差是正につなげたい考えです。 最低賃金について連合は2006年以降、「だれでもどこでも時給1000円」をスローガンに掲げて厚生労働省の審議会で国や企業側と議論を続け、ことし初めて全国平均の時給は1000円を超えました。 このため連合は新たな目標の検討を進めてきましたが、12年後の2035年までに時給1600円を超える水準まで段階的に引き上げる目標を掲げる方針を固めたことがわかりました。 EU=ヨーロッパ連合の基準を参考に引き上げるもので、政府がことし8月に表明した2030年代半ばまでに全国平均を時給1500円に引き上げるとする目標を上回ります。 連合

    連合 最低賃金 2035年までに時給1600円超えを 政府目標上回る | NHK
    naggg
    naggg 2023/12/21
  • 「指輪物語」二次創作作家、アマゾン『力の指輪』は自作の盗用と訴えるも敗訴。逆にトールキン財団から訴えられ著書の全破棄命じられる | テクノエッジ TechnoEdge

    ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日版, Autoblog日版, Forbes JAPAN他 米アマゾンとトールキン財団は、J・R・R・トールキンのファンタジー小説『指輪物語』を巡って争われていた作家デミトリアス・ポリクロン氏との複数の法廷闘争で勝利しました。 ことの発端は2017年、ポリクロン氏がファンタジー小説『The Fellowship of the King』を米国著作権局に登録したことに始まります。ポリクロン氏はこの作品を『ロード・オブ・ザ・リング』の続きとして書いたとして、原稿をJ・R・R・トールキンの孫であり知的財産権を管理するトールキン財団のディレクターでもあるサイモン・トールキン氏に送り、レビューを求めたとのこと。 しかし、返答は2019年になってもありませんでした。ポリクロン氏は

    「指輪物語」二次創作作家、アマゾン『力の指輪』は自作の盗用と訴えるも敗訴。逆にトールキン財団から訴えられ著書の全破棄命じられる | テクノエッジ TechnoEdge
    naggg
    naggg 2023/12/21