関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*techとpythonと*dxに関するmasadreamのブックマーク (3)

  • LLMを悩ませる"Excel文書"をうまく扱う方法

    はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 弊社では製造業向けのRAGを使ったチャットボットの開発を行っていますが、 RAGで読み取りづらいなと感じているドキュメントが"Excel文書"です。 LLMを悩ませる"Excel文書"とは ここで"Excel文書"と呼んでいるドキュメントは、 「構造化されたテーブルを保存しているExcelファイル」 ではなく、 「 セルに文書を書いたり、オブジェクトや画像を挿入することで、いわゆる一般的な文書を作成しているExcelファイル 」 のことを呼んでいます。 そもそも一般的な文書作成においてはExcelではなく、Wordを使えばよいのでは?と思われるかもですが、以下の点でExcelで文書の資料を作成することはそれなりに便利な部分があると思っています。 枠を使って、グルーピングすることでドキュメントの構成が見やすくなる

    LLMを悩ませる"Excel文書"をうまく扱う方法
    masadream
    masadream 2024/12/31
    PDF化して食わせる。結局やってることOCRと本質的に変わらんね…なんでもExcelでやってきて、見て見ぬふりしてきたツケをそろそろ払う時期が来てるのかも。
  • NTTドコモ、Python GUIライブラリ「Streamlit」でデータ可視化アプリを内製開発 | IT Leaders

    IT Leaders トップ > 経営課題一覧 > データ活用 > 事例ニュース > NTTドコモ、Python GUIライブラリ「Streamlit」でデータ可視化アプリを内製開発 データ活用 データ活用記事一覧へ [事例ニュース] NTTドコモ、Python GUIライブラリ「Streamlit」でデータ可視化アプリを内製開発 データ抽出/分析にかかるコストを54%削減 2024年2月22日(木)日川 佳三(IT Leaders編集部) リスト NTTドコモは、全社規模でデータ活用を推進する中で、データ可視化アプリケーションを容易に開発するため、オープンソースのPython GUIライブラリ「Streamlit(ストリームリット)」を導入した。導入効果として、開発に着手してから8営業日でアプリを運用開始している。また、開発したアプリの利用により、データの抽出や分析にかかるコストを54%

    NTTドコモ、Python GUIライブラリ「Streamlit」でデータ可視化アプリを内製開発 | IT Leaders
  • ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama

    イントロChatGPTやBing、NotionAIなどの大規模自然言語モデル(LLM)を活用したサービスが注目を集めています。対話、要約、翻訳、アイデア生成などの多様なタスクにおいて、とても性能が高いです。ただ、ChatGPTでは、ときどき嘘が混じっていたり、文献が捏造されたりすることがあります。 ChatGPTとの対話画面(結果の書籍は存在しない)それを防ぐために、BingやPerplexityでは、文献を引用した上で、なるべく嘘が紛れ込まない形で回答してくれます。 Perplexityでは引用もつけてくれるしかし、これらのAIは、Web上の公開されている一部のデータを元に学習しているので、公開されてないデータに対しては当然ながら、正しく回答できません。 そこで、この記事では、自社が保有しているデータをChatGPTに組み込んで、自社オリジナルのPerplexityのようなシステムを作る

    ChatGPTに自社データを組み込んで新しい検索体験を模索してみました|masa_kazama
    masadream
    masadream 2023/03/06
    超進化版チャットボットという感じ。ファインチューニングが簡単にできるようになったら既存のチャットボットは全滅だろうなあ。
  • 1