misshikiのブックマーク - はてなブックマーク

Audio-Mambaを使った音声分類 | 株式会社AI Shift

こんにちは、AIチームの戸田です今回は近年Transf ormerの次のアーキテクチャになるのでは？と話題の状態空間モデル、Mambaを使った音声分類を試してみたいと思います。 Mamba Mambaは近年主流となっているTransf ormerの次のアーキテクチャとして期待されているモデルの一つです。LLMの文脈で目にすることが多いのですが、音声を扱うAudio-Mambaや、画像を扱うVision-Mambaなどの研究もされています。 Mamba自体については本記事では扱いませんので、詳細は論文をご参照ください。 Audio-Mamba https://arxiv.org/abs/2406.03344 Figure 1 Audio-MambaはMambaをベースとした音声分類モデルです。現在主流となっているAudio Spectrogram Transf ormerと同様、Audio Sp

misshiki 2024/06/21

MambaはTransformerの次のアーキテクチャとして期待されるモデルの一つ。LLMだけでなく、音声を扱うAudio-Mambaや、画像を扱うVision-Mambaなどの研究もされている。この記事では、Audio-Mambaを使った音声分類を試している。

リンク

kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift

はじめにこんにちは、AIチームの大竹です。最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸いです。モデルの直近のリリースをまとめると、以下のようになっています。ReazonSpeechコーパスのリリースを皮切りに日本語に特化した音声認識モデルの開発の勢いが加速しているように思えます。ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。公開時期モデル名公

misshiki 2024/06/13

“この記事では、オープンソースの日本語End-to-End音声認識モデルの性能を評価しました。”

リンク

Kaggleで学んだBERTをfine-tuningする際のTips⑥〜LLMでも使える学習効率化編〜 | 株式会社AI Shift

こんにちは！ AIチームの戸田です本記事では私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます。以前も何件か同じテーマで記事を書かせていただきました。 Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜Kaggleで学んだBERTをfine-tuningする際のTips③〜過学習抑制編〜Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜Kaggleで学んだBERTをfine-tuningする際のTips⑤〜ラベルなしデータ活用編〜今回は学習効率化について書かせていただきます。このテーマは以前書かせ

misshiki 2023/08/28

リンク

【PyTorch】GPTをPrompt-tuningしてみた | 株式会社AI Shift

こんにちは．AIチームの二宮です．本記事では，最近話題のPrompt-tuningのご紹介と，実装・実験・分析を行ってみました．はじめに近年，言語モデルの大規模化が著しいです．例えば，huggingfaceで公開されている日本語版のいくつかの言語生成モデルGPTのパラメタ数は以下になります． (M: million, B: billion) rinna/japanese-gpt2-xsmall: 37M rinna/japanese-gpt2-medium: 336M rinna/japanese-gpt-1b: 1.3B abeja/gpt-neox-japanese-2.7b：2.7B naclbit/gpt-j-japanese-6.8b：6.8B BERT-baseが約110M，BERT-largeが約340Mであることを考えると，非常に大規模であることを実感しますね．最近話

misshiki 2023/01/25

“最近話題のPrompt-tuningのご紹介と，実装・実験・分析を行ってみました．”

リンク

Kaggleで学んだBERTをfine-tuningする際のTips⑤〜ラベルなしデータ活用編〜 | 株式会社AI Shift

こんにちは！AIチームの戸田です！本記事では私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます。以前も何件か同じテーマで記事を書かせていただきました。 Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編 Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 Kaggleで学んだBERTをfine-tuningする際のTips③〜過学習抑制編〜 Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜今回はラベルなしデータの活用について書かせていただきます。世の中の様々な問題を、蓄積された大量のデータを使った教師あり学習で解こうとする試みは多くなされてい

misshiki 2023/01/23

“今回はラベルなしデータの活用について”

Kaggle
BERT

リンク

【AI Shift/Kaggle Advent Calendar 2022】Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜 | 株式会社AI Shift

TOP TECH BLOG【AI Shift/Kaggle Advent Calendar 2022】Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜【AI Shift/Kaggle Advent Calendar 2022】Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜こんにちは！AIチームの戸田です！本記事はAI Shift Advent Calendar 2022、及びKaggle Advent Calendar 2022の9日目の記事です。本記事では私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます。以前も何件か同じテーマで記事を書

misshiki 2023/01/23

“今回は最近の自然言語処理系のコンペティションでよく使われていたAdversarial Trainingについて”

Kaggle
BERT

リンク

Kaggleで学んだBERTをfine-tuningする際のTips③〜過学習抑制編〜 | 株式会社AI Shift

こんにちは AIチームの戸田です本記事では前回、前前回に引き続き、私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます前前回は学習の効率化、前回は精度改善について書かせていただきましたが、今回は精度改善にも関わりますが、過学習の抑制について書かせていただきますデータ引き続きKaggleのコンペティション、CommonLit-Readabilityのtrainデータを使います validationの分け方などは前前回の記事を参照していただければと思います過学習対策 Transf ormerモデル以外にも言えることですが、パラメータの多いモデルは表現力が豊かな分、過学習にも気を配る必要があります有名なものでDropoutやBatch Normalization、 Weight

misshiki 2023/01/23

“前前回は学習の効率化、前回は精度改善について書かせていただきましたが、今回は精度改善にも関わりますが、過学習の抑制について”

Kaggle
BERT

リンク

Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI Shift

こんにちは AIチームの戸田です近年、自然言語処理タスクにおいて、BERTを始めとするTransf ormerをベースとした事前学習モデルを感情分類や質問応答などの下流のタスクでfine-tuningする手法が一般的になっています huggingfaceのTransf ormersなど、事前学習モデルを簡単に使うことのできるライブラリもありますが、Kaggleなどのコンペティションで上位に入るには素のモデルのままでは難しく、ヘッダや損失関数などの工夫などが必要です本記事では私がKaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningのTipsを共有させていただきます書きたい内容が多くなってしまったので、今回は学習の効率化について、次回精度改善について、と２回に分けて書かせていただきます事前準備学習データとして、先日終了したKaggleのコンペティション、C

misshiki 2023/01/23

“Kaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningのTipsを共有”

Kaggle
BERT

リンク

GiNZA v5のTransformerモデルによる固有表現抽出 | 株式会社AI Shift

こんにちは AIチームの戸田です今回は日本語NLPライブラリであるGiNZAのv5から実装されたTransf ormerモデルによる固有表現抽出を試します。固有表現抽出とは、入力となる自然文から地名や製品名などの固有名詞を抽出するタスクです。今回固有表現抽出に使用するデータセットとして、ストックマーク株式会社が作成したWikipediaを用いた日本語の固有表現抽出データセットを使用します。また、Transf ormerモデルは処理に時間がかかるので、環境はGoogle ColaboratoryのGPU環境を利用しました。事前準備 wgetを使ってデータセットをダウンロードします。 wget https://raw.githubusercontent.com/stockmarkteam/ner-wikipedia-dataset/main/ner.json 必要なpythonライブラリをダ

misshiki 2022/01/24

“日本語NLPライブラリであるGiNZAのv5から実装されたTransformerモデルによる固有表現抽出を試します。”

リンク

Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift

こんにちは AIチームの戸田です本記事では前回に引き続き、私がKaggleのコンペティションに参加して得た、Transf ormerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます前回は学習の効率化について書かせていただきましたので、今回は精度改善について書かせていただきますデータ前回に引き続きKaggleのコンペティション、CommonLit-Readabilityのtrainデータを使います validationの分け方などは前回の記事を参照していただければと思います精度改善一般的なニューラルネットワークモデルの精度改善方法として、ハイパーパラメータのチューニングやData Augmentationが上げられますが、ここではBERTを始めとするTransf ormerをベースとしたモデル（以降Transf ormerモデル）特有の工夫について

misshiki 2021/09/06

“Kaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningの精度向上に関するTips”

リンク

はてなブックマーク

タグ

ブックマーク / www.ai-shift.co.jp (10)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス