タグ

AIに関するhkjnのブックマーク (79)

  • 富士通、大規模言語モデル「Takane」提供開始 「世界一の日本語性能を持つ」とうたう

    富士通は9月30日、カナダのAIスタートアップ企業Cohereと共同開発した大規模言語モデル(LLM)「Takane」の提供を始めた。富士通AIサービス「Fujitsu Kozuchi」を通じて提供。同社はこのLLMについて「世界一の日語性能を持つ」とうたっている。 Takaneは、CohereのLLM「Command R+」をベースに、日語に特化させるための追加学習とファインチューニングを行ったAIモデル。日語の性能評価指標「JGLUE」で世界最高記録を達成したことから、富士通は「世界一の日語性能を持つ」と説明。また、プライベートな環境でセキュアに利用できるのも特徴に挙げている。 富士通は日語に特化したLLMの必要性について「日語は文字種の混在や主語の省略、敬語表現など、特有の難しさがあり、汎用LLMの出力精度には課題がある」と説明。言葉の間違いが大きな問題になったり、損害

    富士通、大規模言語モデル「Takane」提供開始 「世界一の日本語性能を持つ」とうたう
  • スーパーのチラシをOCRで読み取らせてAIに献立を提案してもらう | IIJ Engineers Blog

    クラウド部 クラウドソリューション部に所属(2024年入社) 主に社内向けのクラウド記事を書いてます。でかい鯉を見るのが好き。 はじめに どうもこんにちは、好きな料理漫画は「ミスター味っ子」、クラウドソリューション部の立木です。 ここ2か月間、おいしいので毎晩カレーべていましたが、流石に嫌気が刺してきたのでAIに献立を考えてもらうことにしました。 ただ、それだけだと面白味がないので、近所のスーパーのチラシを用いてOCRを行い、読み取った情報を元に献立を考えてもらいます。 それでは実際にやっていきましょう。 ※今回、たまたまいなげや様のチラシを使用していますが、件はいなげや様とは無関係なのでお問い合わせされないようにお願いします。あくまで私個人がツールの検証として使用しただけです。 構成 今回の構成です。 まず、チラシをWebサイトから入手し、そのときの形式がPDFなのでjpegに

    スーパーのチラシをOCRで読み取らせてAIに献立を提案してもらう | IIJ Engineers Blog
  • 【1分でわかる】OpenAI o1とは?GPT-4oとの違いや特徴を徹底解説! | AI Walker

    この記事のまとめ OpenAI o1とは「人間のように応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズ」です。特に科学、コーディング、数学の分野で難しい問題を解決することができます。また、o1-previewとo1-miniの2つのモデルがあり、o1-miniはより高速で低コストとなっています。 2024年9月12日(現地時間)に、OpenAIは新たなAIモデルシリーズ「OpenAI o1」を発表しました。記事ではOpenAI o1の特徴や料金、使い方について詳細に解説していきます。 弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。⇒AI導入支援サービスの概要はこちら 執筆者:山口

    【1分でわかる】OpenAI o1とは?GPT-4oとの違いや特徴を徹底解説! | AI Walker
  • OpenAI o1(ChatGPT o1)とは?その特徴や使い方、料金体系を徹底解説! | AI総合研究所

    この記事のポイント OpenAI o1(o1-preview)は、複雑な推論を実行するために強化学習で訓練された新しいAIモデルo1-miniは、基的能力を維持しつつ処理速度と効率性を向上させた軽量・高速モデルGPT-4oとの違いは、o1はSTEM分野で優れた性能を示すが、一般的な言語タスクではGPT-4oの方が優位新しい安全性学習手法により、安全性と整合性が向上無料開放は無く、ChatGPT PlusまたはChatGPT Teamへの加入が必要 Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのITWeb3事業の創業と経営を経て、LinkX Japan株式

  • RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita

    はじめに こんにちは! AI エンジニアのヤマゾーです。 近年、生成 AI の進化が目覚ましく、生成 AI を活用したシステムの開発が盛んに行われています。その中で最も有名なテクニックが RAG です。RAG というのは検索拡張生成 (Retrieval Augmented Generation) の略で、質問の関連情報を検索し、質問と関連情報をセットで入力して回答させる技術のことです。 各企業ではこの RAG システムを積極的に導入していますが、ほぼ確実に課題になるのが検索部分の精度です。そして検索精度を上げるためには検索エンジンの知識が必要不可欠です。 記事では検索エンジンの筆頭サービスである Azure AI Search を題材に、検索エンジンの基的な仕組みや検索クエリの書き方について初学者向けに解説します。 RAG の検索部分を "Retriever" と呼びますが、この語源

    RAGは検索エンジンが命!Azure AI Search初心者入門 - Qiita
  • RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。記事では、RAGの性能を高めるための「HybridRAG」という手法について、ざっくり理解します。 この記事は何 この記事は、RAGシステムを専門用語に強くするための手法「HybridRAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー HybridRAGは、通常のRAG(Retrieval Augmented Generation)で用いられる「ベクトル検索」の弱みを補い、回答精度を向上するための手法です。BlackRockとNVIDIAの研究者らによって2024年8月に提案されました。 ベクトル検索の弱みはいくつかあります

    RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う
  • ソースコードをリポジトリ丸ごとLLMに読んでもらう方法

    はじめに ソースコードをLLMに読んでもらうとき、単一ファイルだと楽なのですが、GitHubのリポジトリのように複数ファイルから構成されるプロジェクトだと困ってしまいますね。 リポジトリごとLLMに読んでもらえるようにいい感じにテキスト化できると良いですね。そんなソフトがありました。しかも2つ。 両方ともほとんどコンセプトは同じです。特に後者のgenerate-project-summaryは使い方も含めて、自分のやりたいことが、すでに開発者の清水れみおさんが以下の記事にまとめていました。 なので、あんまり書く必要ないのですが、せっかくなのでgpt-repository-loaderの使い方と、出力したファイルの別の活用方法について書いてみたいと思います。 gpt-repository-loaderでリポジトリをテキストに変換 使い方はREADMEに書いてあります。シンプルなソフトなので、

    ソースコードをリポジトリ丸ごとLLMに読んでもらう方法
  • グーグル、Geminiで独自チャットサービスを作れる「Gems」開始

    グーグル、Geminiで独自チャットサービスを作れる「Gems」開始
  • v0(ブイゼロ)の使い方を徹底解説!始め方や料金、プロンプトも紹介

    テキストだけでサイトやアプリを構築できるv0(ブイゼロ)と呼ばれるAIツールが、SNSを中心に話題となっています。 v0では、テキストだけで(ノーコードで)、サイトの見た目(UI:ユーザーインターフェース)やゲーム・アプリを作成できます。 とはいえ、「v0が話題なのは知っているが、どうやって使えばいいのかわからない」と疑問をもっている方は多いでしょう。 そこで記事では、v0の始め方や使い方を徹底解説しています。また、実際に作成したプロダクトや、v0を使うコツも紹介しているため、ぜひ参考にしてみてください。 この記事を読むことで、v0の使い方がわかり、デザイナー以外の方でもクオリティの高いプロダクトを作れるようになるでしょう。 弊社SHIFT AIでは、v0の特徴や使い方、記事では紹介してない活用例などをまとめた資料を法人様向けに提供しています。 ご興味のある方は、ぜひ以下のリンクからダ

    v0(ブイゼロ)の使い方を徹底解説!始め方や料金、プロンプトも紹介
  • チャットAI「Claude」人気機能「Artifacts」が誰でも使えるようになった

    Anthropicが提供するAIサービス「Claude.ai」の新機能「Artifacts」が、8月28日から全ユーザーに開放された。iOS版およびAndroid版のClaudeアプリでも利用可能だ。 Artifactsは、Claudeをアシスタントとしてコンテンツを作ることに特化した機能。ユーザーはArtifactsを通じて、Claudeとともに作成したプログラムなどを専用のウィンドウで確認し、発展させられる(関連記事:チャットAI「Claude」すごい新機能「Artifacts」の使い方、全部教えます)。 Artifacts機能は2024年6月にプレビュー版として導入後、数千万件のArtifactsが作成されるなど、多くのユーザーに活用されてきたという。機能を利用することで、コードスニペット、フローチャート、SVGグラフィックス、ウェブサイト、インタラクティブなダッシュボードなど、さま

    チャットAI「Claude」人気機能「Artifacts」が誰でも使えるようになった
  • 話題のGraphRAGとは - 内部構造の解析と実用性の考察

    初めまして。経営企画AI推進室の鏡味、窪田、小林と申します。当社は年度、AI推進室という新組織を発足させ、主に生成AIについての社内の利用促進、およびユーザーへ生成AIを活用したソリューションの提供を進めるべく、新技術の展開や検証を行っています。 今回は、最近話題となっている、Microsoftが発表したRAG(Retrieval Augmented Generation)技術であるGraphRAG ⧉について、元となる論文やブログ記事、GitHubのコードを元に内部の構造を解析し、さらに現時点でどの程度実用的かを考察していきます。 GraphRAGとは GraphRAGは、ナレッジグラフと生成AI技術を組み合わせることで、従来のRAGでは対応が難しかった問い合わせに回答できるようになったRAGです。2024年2月にMicrosoftによって発表 ⧉され、その後、2024年7月にリ

    話題のGraphRAGとは - 内部構造の解析と実用性の考察
  • ゼロからRAGを作るならこんなふうに

    どんな人向けの記事? これからRAGを作ってみたい DifyやLangChainにこだわらず、自分で開発をハンドリングしたい ベクトルDBや埋め込みモデルの選定の勘所をサッと知りたい ここではRAGとは何かのような話題は扱いません。 RAGが、ほぼAI活用の現実的な最適解になりつつある LLMは高度な知的タスクを実行可能である。 そんな理解が世界に広まっていく中で、企業は自らが蓄えたデータをLLMに組み合わせてどう活用するか躍起になっています。これからはビッグデータだ!という時代を経ているため、情報インフラに投資した企業も多く、AIでデータを活用する流れはもはや確定路線と言えます。 この問題を解決する手法として一番最初に思いつくのは、モデル自体を改変するファインチューニングです。しかし、ファインチューニングにはいくつかの実用上の問題があります。ファインチューニング自体に専門知識が必要である

    ゼロからRAGを作るならこんなふうに
  • 進化計算時代への序曲|shi3z

    統合科学者ネクシャリストという考え方がある。平たく言えば、理系・文系の分け隔てなくさまざまな専門分野を統合的に扱う学者である。ちなみにこの言葉自体は「宇宙船ビーグル号」に登場する架空の概念であり、現実には存在しない。 ただ、人類が生み出した偉人、天才と呼ばれる科学者の中で、特に傑出した人々は、その発言の真意が理解されるまでに途方もなく長い時間がかかることがある。 そうした発言はしばしば「予言」または「予想」と呼ばれ、場合によっては何世代にもわたってその真意を確かめようと後の人類が挑戦する。それが実際にはたわごとなのか、それとも真理なのか、それは誰にもわからない。 20年以上前にミンスキーが「心の社会」を書き、ペンローズが「皇帝の新しい心」を書いた。 どちらも登場した当時は「すごいが出た」と言われたが、この「すごい」は「凄そうなことが書いてあるが、何が書いてあるかわからない」という「すごい

    進化計算時代への序曲|shi3z
  • 「RAG」と「ロングコンテキストLLM」の徹底比較:LLMの長文理解における新たなハイブリッドアプローチ Google DeepMindとミシガン大学の研究 | Ledge.ai

    Top > 学術&研究 > 「RAG」と「ロングコンテキストLLM」の徹底比較:LLMの長文理解における新たなハイブリッドアプローチ Google DeepMindとミシガン大学の研究

    「RAG」と「ロングコンテキストLLM」の徹底比較:LLMの長文理解における新たなハイブリッドアプローチ Google DeepMindとミシガン大学の研究 | Ledge.ai
  • RAG入門: 精度改善のための手法28選 - Qiita

    RAGの精度改善するために何があるかを学びました。基系のNaive RAGを知っている人向けの記事です。 方法が多すぎるので、Youtubeの「RAG From Scratch」を中心に少し整理してみました。LangChainをよく使っているので、LangChain出典が多いです。 全体像 まずは、RAGの全体像。Indexingが同じ流れにあるのが少しわかりにくいのですが、実行タイミングとしてはRAGの前準備としてやっておきます。 画像出典: RAG from scratch: Overview もう少し粒度を細かくした図です。 画像出典: RAG from scratch: Overview 表形式で分類します。Generationだけ少し特殊です。 大分類 中分類 内容

    RAG入門: 精度改善のための手法28選 - Qiita
  • Failure Analysis Assistant – AIOps で障害分析を効率化してみよう – | Amazon Web Services

    Amazon Web Services ブログ Failure Analysis Assistant – AIOps で障害分析を効率化してみよう – システムやサービスを提供する上で、障害はつきものです。障害を迅速に分析し対処することがユーザビリティやサービス信頼性を向上し、結果顧客満足度につながります。一方で近年システムは複雑さを増しており、障害特定が従来に比べて難しくなっています。したがって障害分析の効率化や高度化が重要になっています。 従来の手動による障害分析では、膨大なログデータの中から問題の根原因を特定するのに多大な時間と労力を要し、ダウンタイムの長期化やサービス品質の低下につながる可能性がありました。そこで注目されているのが、人工知能 (AI) や機械学習 (ML) を活用した障害分析です。 AI/ML による高度な分析技術を用いることで、障害の早期発見、迅速な原因特定、さ

    Failure Analysis Assistant – AIOps で障害分析を効率化してみよう – | Amazon Web Services
  • 生成AIのRAG構成を大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog

    G-gen の堂原と又吉です。当記事では、Amazon Web Services(AWS)、Microsoft Azure、Google Cloud(旧称 GCP)が提供するフルマネージドな RAG サービスの比較を行います。 はじめに 当記事について RAG とは 3社比較 前提条件 機能比較 料金シミュレーション 想定シナリオ AWS Azure Google Cloud 総評 AWS Azure Google Cloud 詳細の解説 Knowledge bases for Amazon Bedrock(AWS)の詳細 構成図 プロダクト一覧 Knowledge bases for Amazon Bedrock Amazon S3 Amazon OpenSearch Service できること 検索 対応データソース 料金 概要 基盤モデル利用料金 ベクトルデータベース料金 Azure

    生成AIのRAG構成を大手3社(AWS、Azure、Google Cloud)で徹底比較してみた - G-gen Tech Blog
  • Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」

    米Metaは7月24日(現地時間)、“オープンソースの”LLMの最新版「Llama 3.1」を発表した。最大モデルは4050億(405B)のパラメータを持ち、米NVIDIAの1万6000個以上の「H100」でトレーニングした。Llama 3の70Bモデルと8Bモデルもアップグレードされる。 4月にリリースした「Llama 3」同様に、ほぼすべての主要クラウドサービス(AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake)で利用可能になる。 15兆トークンを超えるトレーニングデータでトレーニングしたとしているが、データの出所は明示していない。 405Bモデルは、長文テキストの要約、多言語会話エージェント、コーディングアシスタント、将来のAI言語モデルのト

    Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」
  • Google、アプリ実行時に生成AIが適切なUIを構成し動的生成する「AI Generated UI」発表

    Google、アプリ実行時に生成AIが適切なUIを構成し動的生成する「AI Generated UI」発表 基的に、アプリケーションのユーザーインターエイス(UI)は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。 しかしこのUIを開発時ではなく、アプリケーションの実行時に生成AIが適切に構成して動的に生成し表示する「AI Generated UI」という仕組みを、Googleがインドのバンガロールで行われたイベント「Google I/O Connect Bengaluru 2024」で発表しました。 現時点でAI Generated UIFlutterフレームワークの上にアーリープレビューとして実装されており、ユーザーの意図に基づいてFlutterが動的にUIコンポーネントとレイアウトを構成し、ユーザーにパーソナライズされた最適なUIを表示すると説明されています

    Google、アプリ実行時に生成AIが適切なUIを構成し動的生成する「AI Generated UI」発表
  • 実務におけるRAG 〜学びと現場のノウハウ〜 | ドクセル

    RAG (Retrieval-Augmented Generation)とは ● 外部データをRetrieval(検索)して ● プロンプトをAugument(拡張)し ● クエリに対する回答をGeneration(生成) ○ クエリ := ユーザからの問合せ ・・・する技術講義では「インプット=クエリ+プロンプト」と定義 4 RAG (Retrieval-Augmented Generation)とは 登場人物______________ ビジネスでの応用先はLLMが大多数_ ❶検索アルゴリズム ● ・ベクトル検索、全文検索、及びその組合せ (Hybrid検索)がよく使用される ・…が、それに限るものではない ● ビジネスでは”言語”の基盤モデル (LLM)への応用が多い ○ 講義も LLMに注力 一方、言語以外のモーダル (画像・音声等)も研究開発中 ❷拡張処理アルゴリズム ・

    実務におけるRAG 〜学びと現場のノウハウ〜 | ドクセル