タグ

ranicのブックマーク (925)

  • 自宅のPCでLLMが動く! オープンソースの視点からひも解く生成AIの現在と未来

    プライベート・ビジネスを問わず活用が進む生成AI。そんな生成AIの進化を支えるのが、OSSだ。AIシステムを支えるコアソフトウェアのLangChainやvLLMは、代表例の1つ。しかも最近は生成AI自体がOSSとして提供されており、ローカルでLLMを実行できるところまできている。セッションでは、レッドハットでスペシャリストソリューションアーキテクトを務める石川純平氏がOSS視点で生成AIの今とこれからを語った。 オープン/クローズドで読み解くLLMの現在 生成AI活用が広がる中で、LLM(大規模言語モデル)事情も変化していると語るのは、レッドハットのスペシャリストソリューションアーキテクト、石川純平氏だ。 レッドハット株式会社 テクニカルセールス部 スペシャリストソリューションアーキテクト 石川 純平氏 LLMは大きく、クローズドLLMとオープンLLMに分けることができる。クローズドL

    自宅のPCでLLMが動く! オープンソースの視点からひも解く生成AIの現在と未来
    ranic
    ranic 2024/09/26
  • 話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門) - Qiita

    GraphRAGとは? Microsoft社が、以前から提唱していたRAGの新しいアプローチ「GraphRAG」のサンプル実装を7月にGitHubで公開したことから、LLM界隈で一気に話題となりました。 従来のRAGは、検索対象のドキュメントを埋め込み(ベクトル)に変換しておくことで、検索クエリーと意味的に近いかたまり(チャンク)を数学的な計算によって探し当てて持ってくる手法でした。 これに対してGraphRAGでは、検索対象のドキュメントを埋め込みではなく「グラフ」として保存する手法です。これによって、従来のRAGでは検索精度がイマイチだったユースケースでも精度が改善することがあります。 グラフとは? グラフといえば、Excelなどでデータを可視化するアレを思い浮かべる方も多いでしょう。GraphRAGで扱うのはそれではなく、数学の世界でいう「グラフ理論」のグラフです。ノード(節点)とエ

    話題のGraphRAGにAWSで挑戦しよう!(LlamaIndexとNeptuneに入門) - Qiita
    ranic
    ranic 2024/09/25
  • AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン

    AWS Lambda Web Adapter (LWA)は、AWS Lambda上で従来のウェブアプリフレームワークをそのまま動かすためのLambda Extensionです。このセッションでは、LWAの機能を取り上げ、それらが必要となる背景や従来実用が困難だった実装パターンをどのように実現できるのかを…

    AWS Lambda Web Adapterを活用する新しいサーバーレスの実装パターン
    ranic
    ranic 2024/09/25
  • PythonとLLMで作る!カレー好きのための知識グラフQAシステム - Qiita

    はじめに こんにちは、カレー愛好家の皆さん!今回は、Pythonと大規模言語モデル(LLM)を使って、カレーに関する知識を管理し、質問に答えるシステムを作ってみました。このシステムでは、カレー好きの人々のネットワークや、お気に入りのカレー店、新しいメニューなどの情報をグラフ構造で表現し、それをベースに質問応答を行います。 システムの概要 このシステムは以下の主要な機能を持っています: カレー関連の知識をグラフ構造で表現 ユーザーのコメントを分析し、新しい知識をグラフに追加 グラフの可視化(日語対応) グラフ情報を基にした質問応答 それでは、知識グラフの魅力について詳しく見ていきましょう! 知識グラフのメリットと有益性 皆さんは「知識グラフ」という言葉を聞いて、どんなイメージを持ちますか?難しそう?複雑そう?確かに最初はそう感じるかもしれません。でも、実はとてもパワフルで、私たちの日常生活

    PythonとLLMで作る!カレー好きのための知識グラフQAシステム - Qiita
    ranic
    ranic 2024/09/23
  • 【WSL 2】dockerコンテナでGUIアプリを実行してWindowsで表示させたい | DevelopersIO

    はじめに GUIのアプリを開発してdockerコンテナ内で実行し、ホストWindowsで表示したいと思いました。軽くやり方を調べたところ、WSL、Xサーバーなど色々な用語が出てきて混乱してしまったので自分なりにまとめてみました。 環境 この記事は以下の環境で検証しています。 Windows 10 Pro 22H2(ビルド:19045) Rancher Desktop 1.14.1 Docker version 26.1.0-rd, build cca8e72 WSL バージョン: 2.2.4.0 WSLとは? WSLはWindows Subsystem for Linuxの略で、Windows上でLinuxを動かすための分離された環境です。WSLを使うことでWindowsに複数のLinuxディストリビューション(Ubuntuなど)をインストールでき、それぞれのLinuxに入ってコマンドを

    【WSL 2】dockerコンテナでGUIアプリを実行してWindowsで表示させたい | DevelopersIO
    ranic
    ranic 2024/09/19
  • RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。記事では、RAGの性能を高めるための「Router Retriever」という手法について、ざっくり理解します。 この記事は何 RAGを実装するエンジニアが困りがちなのは、大量の文書から「いかに、ソースとなる正しい文書を検索してくるか」という検索部分です。この記事では、そういった文書検索の精度を上げるための手法である「RouterRetriever」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 (注:前提として、今回の手法はちょっとディープです。これまでRAGをやってきたエンジニアで、「RAGの文書検索って難しい」と感じたことがある方にだけ刺さる内容

    RAGで文書検索の精度を上げるには、複数の埋め込みモデルを使う
    ranic
    ranic 2024/09/18
  • モデリングとアーキテクチャの知見を積み上げて基幹システムに可変性を注入する - MonotaRO Tech Blog

    こんにちは。 この記事では、2024/5/22に開催された「アーキテクチャを突き詰める Online Conference」で弊社CTOの普川がお話しした内容(ビジネスの構造をアーキテクチャに落とし込みソフトウェアに可変性を注入する〜モノタロウ基幹システム刷新の実践例)を、現場目線から改めてご紹介します。 なお、稿の執筆は頼と尾髙が分担しておりまして、途中で急に文体が変わったな?と違和感を持たれることもあろうかと思われますが、ご容赦いただけますと幸いです。 稿をさらに深掘りするイベントを10/4(金)に開催いたします。 ご興味ある方はぜひご登録ください。 https://connpass.com/event/328360/ 問題領域は関連システムの密結合点 分割を試みる 最初のモデルを手に入れる レイヤードアーキテクチャに沿って実装 レイヤードアーキテクチャのメリット モデルを洗練させ

    モデリングとアーキテクチャの知見を積み上げて基幹システムに可変性を注入する - MonotaRO Tech Blog
    ranic
    ranic 2024/09/14
  • GitHub CopilotでOpenAI o1を試してみた

    Author Mario Rodriguez OpenAI o1-previewとGitHub Copilotの統合をテストしました。 日、OpenAIは難しい問題を解決するための高度な推論機能を備えた新しいAIモデルシリーズ、OpenAI o1をリリースしました。皆さんと同じように、私たちも新しいo1モデルを使いこなすことを楽しみにしており、o1-previewとGitHub Copilotのインテグレーションをテストしました。大規模システムのデバッグ、レガシーコードのリファクタリング、テストスイートの作成など、この新しいモデルを使って多くのユースケースを模索していますが、最初のテストでは、コード解析と最適化において有望な結果が得られました。これは、o1-previewが返答する前に課題を考え抜く能力を備えているためで、GitHub Copilotで複雑なタスクを構造化されたステップに

    GitHub CopilotでOpenAI o1を試してみた
    ranic
    ranic 2024/09/13
  • PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics

    はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基PDFで保存されているため、PDFからテキストを抽出して、検索対象にすることが必要です。 そこで今回は、PythonPDFからテキストを抽出するためのライブラリを比較して、どれが良いのか検証しました。 はじめに 概要 実装 PyMuPDF pdfplumber unstructured 比較結果 テキスト抽出 サンプル1のテキスト抽出結果 サンプル2のテキスト抽出結果 表の抽出 サンプル3の表抽出結果 サンプル4の表抽出結果 検証結果 まとめ 概要 今回はPDF読み取りライブラリとして、PyMuPDFpdfplumber、unstructuredの3

    PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics
    ranic
    ranic 2024/09/12
  • RAGの精度と速度を同時に向上「DIVA」による曖昧さ対策

    導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 この記事では、曖昧な質問に対する回答の精度を高め、さらに処理速度を大幅に改善した手法「DIVA」について紹介します。 サマリー DIVAは、従来のRAGでは対応が難しかった曖昧な質問に対する精度を向上させつつ、他の同様の手法と比べて精度が高く、回答速度も速い点が特徴です。 DIVAの特徴は主に2つあります。1つ目は質問を複数の形に拡張して、検索の多様性を高める「Retrieval Diversification」。2つ目は、得られた情報の有用性を評価する「Adaptive Generation」というフレームワークを採用している点です。これにより、高速かつ高精度な検索結果を得ることが可能です。 問題意識

    RAGの精度と速度を同時に向上「DIVA」による曖昧さ対策
    ranic
    ranic 2024/09/11
  • Python FastAPIで構築する実用的データ統合パイプライン: 天気・交通APIを例にしたジェネレータ活用術 - Qiita

    はじめに こんにちは、皆さん。今回は、FastAPIを使用して天気予報APIと交通情報APIを作成し、それらから取得したデータを効率的に統合する方法について、Pythonのジェネレータを使用したアプローチを紹介します。この例を通じて、複数のデータソースを組み合わせることで、日常生活の計画をより効率的に立てる方法を学びましょう。 目次 はじめに 環境準備 FastAPIを使用した天気・交通APIの作成 ジェネレータを使用したデータ統合 動作確認と日常生活への応用 パフォーマンスと拡張性 まとめ はじめに 日々の生活において、天気予報や交通情報は私たちの行動計画に大きな影響を与えます。記事では、これらの情報を提供する2つのAPIを作成し、それらからのデータを効率的に統合して活用する方法を紹介します。 環境準備 まず、必要なライブラリをインストールします: from fastapi impor

    Python FastAPIで構築する実用的データ統合パイプライン: 天気・交通APIを例にしたジェネレータ活用術 - Qiita
    ranic
    ranic 2024/09/10
  • “著作権への配慮を徹底した”画像生成AI、日本のAIベンチャーが公開 日本語対応で商用利用OK

    画像生成AIの開発を手掛けるAIベンチャー・AI Picasso(東京都港区)は9月9日、学習に対する透明性が高い画像生成AI「CommonArt β」を公開した。学習には、改変などの許可がある画像データのみを使用。著作権への配慮を徹底したという。日語に対応しており、商用利用もできる。 学習に使ったのは、「改変が許されるライセンスを持つ」「改変しても商用利用可能である」「ライセンスを変更しても良い」の3つの条件を満たす画像。この条件を満たすクリエイティブ・コモンズライセンス「CC BY 4.0」と「CC0 1.0」の画像を原則として学習用データに使い、CommonArt βに学習させた。これにより、著作物を勝手に改変したり、改変したものを勝手に販売したりすることがないようにしたという。 学習用の画像には、複数の学習用テキストを付けるなどして、学習した画像をそのまま表示しないように対応。著

    “著作権への配慮を徹底した”画像生成AI、日本のAIベンチャーが公開 日本語対応で商用利用OK
    ranic
    ranic 2024/09/10
  • 複数LLMの統合による会議動画要約の精度向上 - enechain Tech Blog

    はじめに 背景と課題 システム概要 ワークフローの詳細 動画文字起こし (Gemini, GPT-4o) 文字起こしの議題単位の分割 (Claude 3.5 Sonnet) 議題単位での要約作成 (Claude 3.5 Sonnet, GPT-4o) 出力 実装上の工夫と課題 結果と今後の展望 おわりに はじめに こんにちは。enechainで統計・機械学習モデルの構築やLLM(大規模言語モデル)の活用推進を担当している@udon_tempuraです。 近年、GoogleのGeminiなど生成AIの発展が目覚ましく、多くの企業がこれらの技術を業務に取り入れようとしています。 私たちenechainも例外ではなく、積極的にLLMの活用を進めています。 今回はその活用例の1つとして、複数のLLMを使い分けて構築した「会議動画の要約作成ワークフロー」についてご紹介します。 このワークフローでは会

    複数LLMの統合による会議動画要約の精度向上 - enechain Tech Blog
    ranic
    ranic 2024/08/27
  • 2024年Gitワークフロー再考 | フューチャー技術ブログ

    春の入門祭り2024の2記事目です。 Gitは、出自としては1週間で作られたLinuxカーネルのための分散バージョン管理システムでした。当時のワークフローに合わせてパッチをテキスト化してメールに添付できるような機能だったりが備わっています。 一方で、現代のGitは、デファクトスタンダードなバージョン管理システムになりLinuxカーネル以外のアプリケーション開発で利用されています。分散バージョン管理ではあるものの、サーバー・クライアント型の使われ方をしていて、GitHubGitLabを核にして、ローカルで作ったブランチをpushして、Pull Requestの形にして管理しています。少なくとも周りで見る限りでは、それ以外の使われ方の方が少なくなってきてます。そんなこんなで求められている使われ方が変わってきていて、それに合わせた機能がぼちぼち増えています。それを活用することで、ウェブ画面上で

    ranic
    ranic 2024/08/23
  • RAGを専門用語に強くする手法「Golden-Retriever」

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。記事では、RAGの性能を高めるための「Golden-Retriever」という手法について、ざっくり理解します。 この記事は何 この記事は、RAGシステムを専門用語に強くするための手法「Golden-Retriever」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー Golden-Retrieverは、RAG(Retrieval Augmented Generation)を、業界特有の用語・社内用語を含むような質問に強くするための手法です。カリフォルニア大学の研究者らによって2024年8月に提案されました。 従来のRAGシステム

    RAGを専門用語に強くする手法「Golden-Retriever」
    ranic
    ranic 2024/08/20
  • OCRとLLMを活用した情報抽出業務の効率化|Algomatic

    はじめに企業の業務において、請求書や領収書、名刺などの紙媒体の情報を電子化し、管理・活用することは非常に重要です。しかし、これらの作業は手作業で行うと多大な時間と労力を要します。また、人的ミスも発生しやすく、業務効率化の大きな障壁となっています。そんな中、近年、OCRの性能向上やLLMの性能向上によって、あらゆる業務の効率化できる可能性が高まっています。この記事では、写真や書類から情報を抽出する取り込み業務について、OCRとLLMを利用したソリューションについて紹介します。 情報抽出などの取り込み業務の課題情報抽出などの取り込み業務では、以下のような課題が存在します。 手作業による時間と労力の浪費 大量の書類を処理する場合、作業コストが膨大に 単純作業の繰り返しによる従業員のモチベーション低下 他の付加価値の高い業務に注力できない 人的ミスの発生 量が多くなるほど、入力ミスや誤読などの人的

    OCRとLLMを活用した情報抽出業務の効率化|Algomatic
    ranic
    ranic 2024/08/17
  • ブラウザ内でPostgresのWASM版を利用できる「postgres.new」を発表 Supabase

    ブラウザ内でPostgresのWASM版を利用できる「postgres.new」を発表 Supabase:全てのクエリをブラウザ内で直接実行 基盤技術に「PGlite」を採用 Supabaseは、AI支援を利用しながら、ブラウザ内で直接動作する「Postgres」データベースを即座に幾つでも起動し、サンドボックスとして使用できる「postgres.new」を発表した。

    ブラウザ内でPostgresのWASM版を利用できる「postgres.new」を発表 Supabase
    ranic
    ranic 2024/08/17
  • こいつを待ってた!3万字以上自動的に書いてくれるオープンLLMが登場!三回回せば本一冊分に!

    ranic
    ranic 2024/08/16
  • 【9月17日】自治体・企業の防災担当者向けオンラインセミナー「脱マンネリ!事例から学ぶ新しい防災訓練のつくりかた ~当事者意識を高めるAR・VR技術の活用~」

    【9月17日】自治体・企業の防災担当者向けオンラインセミナー「脱マンネリ!事例から学ぶ新しい防災訓練のつくりかた ~当事者意識を高めるAR・VR技術の活用~」災害大国日・地域の防災訓練未参加は7割の現実。参加者増や防災意識向上のカギとなる"体感する防災訓練"について、最新の取り組みや、AR・VR技術の活用事例を交えてご紹介します。 一般社団法人 AR防災(東京都新宿区、以下 AR防災)は、『防災をリアルに、防災を日常に』をテーマに掲げ、AR・VR技術を活用し、防災教育や啓蒙活動を支援しています。この度、自治体・企業等の防災担当者、および、メディア関係者を対象に、オンラインセミナーを2024年9月17日(火)に開催します。当日は、阪神大震災被災体験とアウトドアの知識を生かして全国で講演活動を展開する、アウトドア防災ガイドのあんどうりす氏をゲストに迎え、参加者が増えない防災訓練の課題を解消し

    【9月17日】自治体・企業の防災担当者向けオンラインセミナー「脱マンネリ!事例から学ぶ新しい防災訓練のつくりかた ~当事者意識を高めるAR・VR技術の活用~」
    ranic
    ranic 2024/08/16
  • 大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」

    GPT-4やLlama、Claudeといった大規模言語モデルは、2017年にGoogleの研究者が発表した「Transformer」というフレームワークの上に構築されています。このTransformerをベースにしたAIモデルがどのように機能するのかを視覚化したツール「Transformer Explainer」が、ジョージア工科大学のPolo Club of Data Scienceによって公開されています。 Transformer Explainer https://poloclub.github.io/transformer-explainer/ Transformer Explainerの見方は、以下のムービーを見ると一発でわかります。 Transformer Explainer: Learn How LLM Transformer Models Work - YouTube Tr

    大規模言語モデルの仕組みが目で見てわかる「Transformer Explainer」
    ranic
    ranic 2024/08/16