samurairodeoのブックマーク - はてなブックマーク

【AI Shift Advent Calendar 2023】RAGを強化する | 株式会社AI Shift

こんにちは、AIチームの二宮です。この記事はAI Shift Advent Calendar 2023の20日目の記事です。本記事では、RAG（Retrieval Augmented Generation）を強化する技術について調査した結果をご紹介いたします。RAGの概要や基本的な実装については、以前の記事で詳しく説明していますので、そちらをご覧ください。はじめに RAGは、大規模な文書から関連箇所を効率的に獲得し、それを基に回答を生成する手法です。特にカスタマーサポート分野では、自社情報に基づいて回答することが重要であるため、RAGの導入検討が積極的に行われております。最近では、RAGに関連する技術が多数提案されていますので、改めてどのような改善ができるのか調査してみました。本記事では、詳細な実装までは触れず、関連するリンクを記載することに留めています。RAGの改善の方針を立てる

samurairodeo 2023/12/21

あとで読む

リンク

【AI Shift Advent Calendar 2022】SetFitによるfew-shotテキスト分類 | 株式会社AI Shift

こんにちは！AIチームの戸田です。本記事はAI Shift Advent Calendar 2022の1日目の記事です。本記事では少量データで高精度なテキスト分類モデルを学習できると言われているフレームワークSetF it(Sentence Transf ormer Fine-tuning)をkaggleの入門コンテスト、Natural Language Processing with Disaster Tweetsで試して、他の手法と比較してみようと思います。 SetF itとは背景 BERTをはじめとする大規模言語モデルは、fine-tuningによるタスク適用でデータリソースの少ないドメインでもロバストな精度を実現することができると言われていますが、それでもfine-tuningで安定した精度を出すためには数百のデータは必要になってきます。近年話題になっているGPT-3はfew-s

samurairodeo 2022/12/01

あとで読む

リンク

Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift

こんにちは AIチームの戸田です本記事では前回に引き続き、私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます前回は学習の効率化について書かせていただきましたので、今回は精度改善について書かせていただきますデータ前回に引き続きKaggleのコンペティション、CommonLit-Readabilityのtrainデータを使います validationの分け方などは前回の記事を参照していただければと思います精度改善一般的なニューラルネットワークモデルの精度改善方法として、ハイパーパラメータのチューニングやData Augmentationが上げられますが、ここではBERTを始めとするTransf ormerをベースとしたモデル（以降Transf ormerモデル）特有の工夫について

samurairodeo 2021/09/06

あとで読む

リンク

Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI Shift

こんにちは AIチームの戸田です近年、自然言語処理タスクにおいて、BERTを始めとするTransf ormerをベースとした事前学習モデルを感情分類や質問応答などの下流のタスクでfine-tuningする手法が一般的になっています huggingfaceのTransf ormersなど、事前学習モデルを簡単に使うことのできるライブラリもありますが、Kaggleなどのコンペティションで上位に入るには素のモデルのままでは難しく、ヘッダや損失関数などの工夫などが必要です本記事では私がKaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningのTipsを共有させていただきます書きたい内容が多くなってしまったので、今回は学習の効率化について、次回精度改善について、と２回に分けて書かせていただきます事前準備学習データとして、先日終了したKaggleのコンペティション、C

samurairodeo 2021/08/14

リンク

社内SQL研修のために作った資料を公開します | 株式会社AI Shift

こんにちは、Development Teamの三宅です。先日、社内（AI事業本部内）でSQL研修の講師を担当したので、今回はその内容について簡単に共有したいと思います。はじめに例年、AI事業本部では、新卒エンジニアの育成のためにソフトウェアエンジニア研修を行っております。今年はフルリモートでの実施となりました。研修期間は2週間ほどで、内容は前半が講義、後半が実践（チーム開発）でした。私が担当したのは、講義パートの一部であるSQL研修です。SQLやRDBにあまり慣れていない人でも、できるだけ体系的な学びが得られるようにすることを目標に、様々な資料をまとめて提供する方針で準備しました。結果的には、ハンズオン込みで4時間ほどのやや長い講義となりましたが、勉強になったという声も頂けたのでやって良かったと思っています。研修資料研修内容 SQL研修の内容は、基本的には大学のデータベース講義で

samurairodeo 2021/06/22

あとで読む

リンク

AutoNLPを使った日本語文書分類 | 株式会社AI Shift

こんにちは AIチームの戸田です先日、huggingfaceのAutoNLPで日本語が扱えるようになりました。こんにちは日本 ! 🤗 AutoNLP supports Japanese NOW!!! This means you can now train binary classification, multi-class classification, entity recognition, summarization and speech recognition models for Japanese using AutoNLP 🎉🎉! Check it out here: https://t.co/HyjPGE2eEA pic.twitter.com/VWfYmj9flQ — abhishek (@abhi1thakur) April 21, 2021 今回はAutoNL

samurairodeo 2021/04/26

リンク

はてなブックマーク

タグ

ブックマーク / www.ai-shift.co.jp (6)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス