サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
災害への備え
qiita.com/jw-automation
それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質
はじめに 2023年はChatGPT元年とも言われ、いわゆるテック業界だけでなく、あらゆる業界でChatGPTが話題となりました。 この空前のChatGPTブームの中で、企業内でもChatGPTを利用しようという取り組みが進み、連日ニュースでも取り上げられていました。 皆さんも「〇〇会社、ChatGPTを従業員約1万人に展開。全従業員の業務効率化を目指す。」といった内容のニュースをよく見かけたのではないでしょうか? 先行企業に遅れを取らないよう「うちも早くやらないと!」と、同じようにChatGPTを社内に配る取り組みを進める企業が相次ぎました。 しかし、最近になって先行導入を進めた企業のデータが出始めており、実際の利用状況を見てみると、2023年これだけChatGPTが注目され、メディアを騒がせたにも関わらず、全体の利用状況は1割程度かそれ以下に留まっているという状態になっています。 この
はじめに 「働き方改革」という言葉が世間の注目の的となり、仮想労働者・デジタルレイバーという言葉が定義され、RPA元年とも言われた2016年から早くも7年の月日が経ちました。 この業界にずっと身を置いてきた立場として、様々なクライアントからご相談も頂く中で最近特によく感じるのは「企業によって自動化推進の二極化が進んできたな」という事です。 これは、単純に予算や人が足りないという問題であればまだ良いのですが、問題はそこではなく、進もうとしている方向性にあります。 つまり二極化が進んでいる理由は、端的に言ってしまうと、自動化推進において「その組織がどの山を登ろうとしているのか?」という点にあります。 そもそも登るべき山を間違えている場合、人とリソースをどれだけ投下しても、本来目指すべき目的地に辿り着く事はなく、むしろ悪い方向にどんどん向かう一方になります。 この業界における力学上の問題もあり、
1. はじめに 前回、Teamsから社内利用できるGPTボットを作りましたが、今回はWeb検索と独自データ検索機能もつけていきたいと思います。 独自データ検索は、CSVやPDF、社内ウェブサイト等も利用可能で、テキスト系の情報検索だけでなく、データベース接続もやります。 2. アーキテクチャ 今回のアーキテクチャは以下です。 機能としては、「①一般問合せ」「②Web検索」「③社内情報検索」「④データアクセス」の4つを持たせ、ユーザーからのモード選択でそれぞれの処理へ分岐させています。 ①一般問合せは、GPTとの直接のやり取りのため、PowerAutomateからそのままAPIをコールさせ、②Web検索は、GoogleのCustom Search APIを利用し、最新情報も取れるようにしています。 ③社内情報検索は、テキスト系の社内情報を事前にインデックス化したものをAzure Blob S
以下、個別に簡単なデモで紹介して行きます。 1. Digit Recognition こちらは、「Deep Metric Learning」で以前紹介した、異常検知付きの手書き文字認識のデモです。 L2-constrained Softmax Lossを入れたCNNで、0~9までの文字を判定し、推定精度付きで返しています。全結合層の1つ前のL2-constrainedの層に、LOFで異常検知を入れているので、数字でないものが入力された場合は、「Not Digit」としてはじいています。 どちらかいうとスマホのほうが遊びやすいと思うので、色々な数字の形を書いたり、数字以外のものを書いてみたりと自由に遊んでみて下さい。 MNISTで学習しており、個人的にはもう少し弱い所のデータを足したいなという感触ですが、概ね人間と変わらないレベルで返してくれます。 2. Image Denoising こち
はじめに 前回「【AI】Deep Metric Learning」でDeep Metric Learningを用いた異常検知について紹介しました。 こちらも教師なし学習の枠組みであり、学習時には正常データのみを用いて、正常データの特徴量空間を学習。そして、未知データに対して、正常データで学習した空間からの逸脱度を基準に異常検知を行いました。 入力した画像が「正常」か「異常」かを高精度で自動判定してくれるのは良いのですが、画像全体での異常検知なので、「異常はわかったけど、どこが異常なの?」と聞きたくなるのが正直な所です。「異常です」とブザーやサイレンを鳴らすだけでなく、「〇〇が異常です」と教えてくれるようにその異常箇所の検知(可視化)をやって行きたいと思います。 異常箇所検知には、Autoencoderベースのもの、GANを利用したもの、その組み合わせなど、様々な手法が提案されていますが、今
はじめに 機械学習の分野でDeep Learningがその地位を揺るがぬものにして久しくなりました。 Deep Learningの応用分野は多岐に渡りますが、今回はその中でも非常に有用性と実用性の高い「Image Denoising」への応用について、簡単なまとめといくつかのデモを紹介していきたいと思います。 通常のデノイズと、実問題に近い設定としてノイズ画像しか手に入らない状態でのデノイズもやります。 Image Denoisingとは Image Denoisingとは、文字通り、「画像からのノイズ除去」です。カメラなどで撮影する写真や映像データには、撮影環境など、様々な要因によってノイズが付加され、本来の画像に比べて視認性の低下を招いてしまいます。こうしたノイズが付加された画像から、元の画像を復元する事をデノイズといい、我々が普段目にする画像だけでなく、CTやMRIの画像からのノイズ
はじめに 機械学習の分野でDeep Learningがその地位を揺るがぬものにして久しくなりました。 今回はその性能と汎用性の高さから、様々な分野で応用が進んでいるDeep Metric Learningについて、簡単なまとめといくつかのデモを紹介していきたいと思います。 手書き文字認識と、手書き文字認識だけでは面白くないので異常検知もやります。 Deep Metric Learning Metric Learningとは「距離学習」と言われる手法で、入力データの特徴量空間から、データの類似度を反映した特徴量空間への変換(写像)を学習する手法です。 一言で言うと、 同じクラスに属するデータは近く 異なるクラスに属するデータは遠く なるような特徴量空間への変換を学習します。 クラス分類などにおいて、距離が近すぎて分類が困難なケースでも、同じクラスは距離が近く、違うクラスは距離が遠く」なるよう
プログラミング未経験の人は自分で作る事はできませんが、VBAが組める人はコードを書くことができます。しかし、VBAが組める人は自分が普段やっている業務の範囲で独自に効率化をしてきた方なので、そもそも自分以外の人がコードを見る想定はなく、自分が見てわかるかどうかという事を基準に作ります。自分が見てわかるかどうかが基準のため、自分の異動後の引継ぎまで意識して作っているわけではありません。 一方プロのエンジニアは、「コードは引き継がれていくもの」という前提のもとで、自分以外の人が見てもわかるかどうかという基準で作ります。またこの基準を満たすための訓練を受けています。 ソフトウェア開発の現場では、自身でコーディングをして終わりではなく、コードレビューと言って自分以外の人(主に自分より経験のある先輩)にコードをチェックしてもらい、エラーが発生しそうな箇所やわかりにくい箇所の指摘を受けて直すというプロ
このページを最初にブックマークしてみませんか?
『@jw-automationのマイページ - Qiita』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く