[B! dl] incepのブックマーク

incep id:incep

dlに関するincepのブックマーク (107)

GitHub - THU-KEG/EvaluationPapers4ChatGPT: Resource, Evaluation and Detection Papers for ChatGPT
incep 2023/05/16
chatgpt

ml

dl
リンク
生成モデル - 機械学習の「朱鷺の杜Wiki」
生成モデル (generative model) / 識別モデル (discriminative model)† クラス分類を解くための手法は識別モデルと生成モデルに分けられる．データとクラスの確率変数をそれぞれ \(X\) と\(C\) で表す．パラメータは \(\theta=(\theta_1,\theta_2)\)．生成モデル (generative model) \(X\) と\(C\) の結合確率をモデル化： \[\Pr[X,C|\theta]=\Pr[X|C,\theta_1]\Pr[C|\theta_2]\] パラメータはデータ集合とパラメータの同時確率を最大化するように学習： \[\Pr[\{x_i,c_i\}_i^N,\theta]=\Pr[\theta]\prod_i^N\Pr[x_i,c_i|\theta]=\Pr[\theta]\prod_i^N\Pr[x_i
incep 2023/04/19
「クラス分類を解くための手法は識別モデルと生成モデルに分けられる．」

ml

dl
リンク
Transformer解説：GPT-3、BERT、T5の背後にあるモデルを理解する | AI専門ニュースメディア AINOW
著者のDale Markowitz氏はGoogleクラウド部門に所属するGoogle社員で、最近ではGoogle主催の開発者会議Google I/O 2021で「機械学習のよくある問題の発見と解決」というセッションを担当しました。同氏がMediumに投稿した記事『Transf ormer解説：GPT-3、BERT、T5の背後にあるモデルを理解する』では、現代の言語AIにおける技術的基礎となっているモデルのTransf ormerが数式を使わずに解説されています。 Transf ormer以前に自然言語処理で使われていたモデルは、リカレントニューラルネットワーク（Recurrent Neural Network：RNN）でした。このモデルには長い文章を正しく処理するのが難しい、勾配消失問題の影響を受けやすい、そして処理の並列化が難しいためにモデルの大規模化が困難、というみっつの欠点があったため、自
incep 2023/04/17
dl

ai

ml

llm

mlm

glm

transformer

attention
リンク
OpenAI API
incep 2023/02/07
GPT 系生成モデルの基礎的な考え方から説明してくれている．

nlp

dl

api

openai

gpt
リンク
はじめての自然言語処理 OSS によるテキストマイニング | オブジェクトの広場
前回はグラフベースのキーフレーズ抽出手法と pke での実験結果を紹介しました。今回は、spaCy, scattertext, ... 等々の OSS を用い各種のテキストマイニング手法についてコード例とサンプルプロットを交えながら説明したいと思います。 1. はじめに本記事ではテキストマイニングの概要と代表的な手法について、コード例とサンプルプロットを交えて説明します。分析対象には、この連載で何度か用いている livedoor ニュースコーパスを用い、Google Colaboratory で動かすことを想定したコードスニペットを入れていきますので、実際に動かしたり対象を変えてみたりして試して頂けると良いかと思います。 2. テキストマイニングとはテキストマイニングとは、ざっくり言うと「自然言語の文書データを対象に使用される単語の出現傾向等を分析して何らかの有益な情報を取り出すこと」
incep 2022/07/26
“ginza.STOP_WORDS”

nlp

ginza

dl
リンク
NVIDIA DockerイメージのGPGキー更新に関する備忘録 - OPTiM TECH BLOG
R&D チームの徳田（@dakuton）です。今年のGWあたりにCUDAのGPG更新アナウンス(NVIDIA Technical Blog: Updating the CUDA Linux GPG Repository Key)がありました。記載に従い利用環境の反映作業をしてみたところ、特にDockerイメージ向けの反映については記事に触れられていない範囲でのハマリポイントがいくつかあることがわかったため、対策についてまとめておきます。参考(GitHub issue) NVIDIA/nvidia-docker(Public GPG key error #1631) 影響を受けているプロジェクト例 TensorFlow (Tensorflow docker image has outdated keys #56085) TorchServe (Improvements to docker
incep 2022/07/18
docker

cuda

nvidia

linux

ubuntu

dl

ml
リンク
COCO dataset：セグメンテーションなどに使える大規模なカラー写真の画像データセット
COCO dataset：セグメンテーションなどに使える大規模なカラー写真の画像データセット：AI・機械学習のデータセット辞典データセット「COCO」について説明。約33万枚のカラー写真（教師ラベル付きは20万枚以上）の画像データとアノテーション（＝教師ラベル）が無料でダウンロードでき、物体検知／セグメンテーションや、キーポイント検出／姿勢推定、キャプション作成などに利用できる。
incep 2022/07/15
ml

photo

dl

dataset
リンク
A state-of-the-art open source chatbot
Facebook AI has built and open-sourced BlenderBot, the largest-ever open-domain chatbot. It outperforms others in terms of engagement and also feels more human, according to human evaluators. The culmination of years of research in conversational AI, this is the first chatbot to blend a diverse set of conversational skills — including empathy, knowledge, and personality — together in one system. W
incep 2022/07/14
ai

chatbot

nlp

dl

facebook
リンク
残差接続 (residual connection) [ResNet] | CVMLエキスパートガイド
1. 残差接続 (residual connection)とは [概要] 残差接続 (residual connection)とは，CNNの1種である ResNet [He et al., 2016a], [He et al., 2016b] の構成部品である残差ブロックにおいて，毎ブロックに配置される「スキップ接続 + そのあとの2経路の出力の足し算」の部品のことである．要は「残差接続 ≒ スキップ接続」ではあるが，スキップ接続のうち，ResNetの場合の残差ブロックを形成する形を，特に残差接続と呼ぶ．ResNetで，提案された「残差ブロックの多層化」の文脈では，スキップ接続を「残差接続」と別途呼び分けたほうが「残差ブロックを反復して構成しているネットワーク構造である」ことが伝わりやすくなる．関連記事：ResNetの，従来のCNNと最も異なる点は？【Q and A記事】この記事
incep 2022/05/20
"要は「残差接続＝スキップ接続」である．スキップ接続のうち，ResNetの場合を特に「残差接続」と呼ぶというだけである．"

dl

attention

ml
リンク
google-research/meena/meena.txt at master · google-research/google-research
incep 2022/04/22
2020年1月の段階がこれ．今はどうなっているのか

nlp

ai

dl

chatterbot

chatbot
リンク
ハイパーパラメータのチューニング【グリッドサーチの欠点とそれを補う手法を解説】
グリッドサーチによる探索実際にグリッドサーチによるパラメータのサンプルを実装したうえで解説してきます。検証ライブラリはscikit-learn、検証データはscikit-learnで提供されている癌の判定データを使います。 from sklearn.datasets import load_breast_cancer import pandas as pd from sklearn.model_selection import GridSearchCV from sklearn.linear_model import LogisticRegression # 検証データの取得(癌の判定データ) data = load_breast_cancer() dataX = pd.DataFrame(data=data.data,columns=data.feature_names) dataY
incep 2022/04/19
python

dl

hyper_parameters

parameters

tuning

grid_search

ml
リンク
GitHub - rinnakk/japanese-pretrained-models: Code for producing Japanese pretrained models provided by rinna Co., Ltd.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
incep 2021/05/13
japanese

gpt

dl

nlp
リンク
google/jax: GPU- and TPU-backed NumPy with differentiation and JIT compilation.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
incep 2021/05/13
python

dl

google
リンク
論文解説 Memory Networks - ディープラーニングブログ
こんにちは，Ryobot (りょぼっと) です．概要「メモリネットワーク」は代表的な記憶装置付きニューラルネットワークである．本稿ではメモリモデル (記憶装置付きニューラルネットワーク) をいくつか概説し，論文 2 紙 (1) Memory Networks, (2) Towards AI-Complete Question Answering の理論的な記述を全文翻訳して補足説明している．目次メモリモデルの概説 Memory Networks (MemNN) 1 メモリネットワークの概要 2 基本モデル 3 拡張モデル 4 実験 Towards AI-Complete Question Answering (bAbI task) 1 メモリネットワークの拡張 2 bAbI タスク 3 実験長文である．ざっくり知るだけなら「メモリモデルの概説」と Memory Networks
incep 2021/04/08
ml

dl

qa

memory_network
リンク
GitHub - EleutherAI/gpt-neo: An implementation of model parallel GPT-2 and GPT-3-style models using the mesh-tensorflow library.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
incep 2021/04/03
GPT-3

gpt

dl

language

model
リンク
Huggingface Transformers 入門 (8) - トークナイザー｜npaka
1. トークナイザー「トークナイザー」は、「テキスト」を「トークン」に分割し、それを「ID」に変換する機能を提供します。「テキスト」はそのままではニューラルネットワークで処理できないため、IDに変換する必要があります。 2. トークン化の方法テキストのトークン化は見た目以上に大変な作業で、トークン化の方法は複数あります。・単語・文字・サブワード2-1. 単語によるトークン化◎ スペースによるトークン化一番簡単なトークン化の方法は、「スペースによるトークン化」です。 "Don’t you love 🤗 Transf ormers? We sure do." ↓ ["Don't", "you", "love", "🤗", "Transf ormers?", "We", "sure", "do."] これは良い第1歩ですが、"Transf ormers? " や "do. " というトーク
incep 2021/03/15
learning

m

nlp

tokenizer

dl

transformer

bert
リンク
Papers with Code - T5 Explained
incep 2020/12/11
nlp

t5

dl
リンク
【ディープラーニング自由研究】LSTM+Transformer モデルによるテキスト生成｜tanikawa
Abstract• Transf ormer モデルをテキスト生成タスクで使用する場合、計算コストに難がある • 計算コストを抑えつつ Transf ormer の予測性能を活かすために、Positional Encoding を LSTM に置き換えた LSTM+Transf ormer モデルを考案 • 生成にかかる時間を Transf ormer の約 1/3（CPU 実行時）に抑えることができたはじめにTransf ormer は現在の自然言語処理分野における代表的な深層学習モデルの1つです。さまざまなベンチマークを総なめにした Google の BERT とその派生系 (XLNet, ALBERT, etc.) や、OpenAI の GPT-2 など、最近の研究のベースにあるのが Transf ormer です。 Transf ormer の特徴として、LSTM などの従来の RNN にあっ
incep 2020/11/12
lstm

dl

nlp
リンク
マガジン｜ClassCat Deep Learning / Analytics & Quantum Computingのイベント・技術情報 - TECH PLAY［テックプレイ］
ClassCat Deep Learning / Analytics & Quantum Computingに関するマガジン情報をまとめたページです。
incep 2020/10/12
nlp

allennlp

dl
リンク
Building powerful image classification models using very little data
Note: this post was originally written in June 2016. It is now very outdated. Please see this guide to fine-tuning for an up-to-date alternative, or check out chapter 8 of my book "Deep Learning with Python (2nd edition)". In this tutorial, we will present a few simple yet effective methods that you can use to build a powerful image classifier, using only very few training examples --just a few hu
incep 2020/10/06
keras

dl

ml

finetuning
リンク
1 2 3 4 5 6 次のページ