moro-tyoのブックマーク - はてなブックマーク

moro-tyo id:moro-tyo

moro-tyoのブックマーク (2,883)

Introducing StylEx: A New Approach for Visual Explanation of Classifiers
moro-tyo 2023/12/13
deeplearning

cv
リンク
CoOp：CLIPのテキストテンプレートはどう決めればいい？
3つの要点 ✔️ CLIPのPromptエンジニアリングが実用上大きな課題となる ✔️ そのPrompt エンジニアリングをEnd-to-Endで自動的に学習するCoOpを提案する ✔️ CoOpの有効性とロバスト性を11つのデータセットを用いて示した Learning to Prompt for Vision-Language Models written by Kaiyang Zhou, Jingkang Yang, Chen Change Loy, Ziwei Liu (Submitted on 2 Sep 2021 (v1), last revised 21 Sep 2021 (this version, v2)) Comments: Published on arxiv. Subjects: Computer Vision and Pattern Recognition (cs.
moro-tyo 2023/11/12
cv

deeplearning
リンク
CLIPから見るAttentionの有用性 | Shikoan's ML Blog
Attentionはこれまでの研究から多く有用性は報告されていたのですが、ネットワークの内側で使われることが多く、わかりやすく差を体感できる例を自分は知りませんでした。今回はCLIPのAdapterという点から、Attentionの有無による精度比較を行ってみます。はじめに Adapterとは最近研究でよく見られるようになりました。基盤モデルのような大きな事前訓練済みモデルに対し、小さなネットワークを差し込み、その部分のみ訓練することで任意の訓練データに対して適用させるものです。ファインチューニングとの違いは以下の通りです。 Adapter 追加小さなネットワークのみ訓練、元モデルは訓練しない訓練速度が速い元モデルはそのままなので、破滅的忘却に悩まされるリスクが減るファインチューニングモデルの全体ないし、末尾の特定層のみ訓練特に元モデルが大きくなると、訓練速度がAdapter
moro-tyo 2023/11/12
cv

deeplearning
リンク
staka/fugumt-en-ja · Hugging Face
FuguMT This is a translation model using Marian-NMT. For more details, please see my repository. source language: en target language: ja How to use This model uses transf ormers and sentencepiece. !pip install transf ormers sentencepiece You can use this model directly with a pipeline: from transf ormers import pipeline fugu_translator = pipeline('translation', model='staka/fugumt-en-ja') fugu_transl
moro-tyo 2023/11/07
nlp

english
リンク
GPT-4Vができることをまとめてみた - 電通総研テックブログ
こんにちは。ISID 金融ソリューション事業部の若本です。先日、GPT-4から発展し、画像も扱うことができるGPT-4 with vision（GPT-4V）が発表されました。GPT-4Vは大規模マルチモーダルモデル（LMMs: Large multimodal models）と呼ばれるAIモデルの一種であり、GPT-4の入力として「画像」を拡張したものになります。今日は Microsoft Researchの論文[1]を中心に、Open AIの発表したSystem Card[2]も踏まえ、GPT-4Vでできることや苦手とすること、そして実用上の制限について解説します。 GPT-4Vの特徴 ① 画像とテキストを入力にできる GPT-4Vでは、GPT-4のテキスト入力に加えて画像も入力することが可能になりました。画像は複数枚入力することが可能であり、かつ、画像とテキストを任意に交互に組
moro-tyo 2023/10/31
cv
リンク
Objects365 Dataset
moro-tyo 2023/10/29
cv

dataset
リンク
About
moro-tyo 2023/10/29
cv

dataset
リンク
ワンランク上のSQLを書くためのポイント3つ - Qiita
この記事はNuco Advent Calendar 2022の17日目の記事です。ワンランク上のSQLとは？ 1年近く、データ分析に関わる業務に携わっってきた中で、良いSQL、いまいちなSQLをいろいろ見てきました。自分が書くSQLも、最初の頃は目も当てられないSQLも書いてきました。そんな中で、こんなことを意識していくと、より良いSQLになるのでは？というポイントをまとめていきます。とりあえずSQLの文法は一通り勉強して、取得したいデータをとってくるSQLをかけるようになったぞ。という人に向けたものなので、本当に基礎的な文法は解説していません。ワンランク上のSQLを書くためのポイントは、・読みやすい・再利用しやすい・処理が早いの３つを押さえられているかどうかだと感じています。可読性が高いメリット間違いにくくなる/デバックが容易になるエラーが出てくれれば間違っているこ
moro-tyo 2023/10/24
sql
リンク
aipicasso/emi · Hugging Face
このモデルをこのページからダウンロードするためにはHugging Faceに登録された情報を提供する必要があります。この提供された情報は画像生成AIを活用する情報を案内するために使われます。 To download this model from this page, you need to provide information registered with Hugging Face. The information provided will be used to guide you on how to utilize the image-generation AI. \n","classNames":"hf-sanitized hf-sanitized-NRsr6mDgbv2PS97qYq70K"},"gated":"auto","isLoggedIn":false,"repoId
moro-tyo 2023/09/30
cv

deeplearning
リンク
backbone としての timm 入門
[第３回分析コンペLT会、オンライン開催] (https://kaggle-friends.connpass.com/event/220927/) での発表資料です。画像コンペに出るうえで便利過ぎる timm(pytorch image models) の紹介をしました。Read less
moro-tyo 2023/09/22
cv

deeplearning
リンク
RO-ViT: Region-aware pre-training for open-vocabulary object detection with visi
moro-tyo 2023/09/17
cv

deeplearning
リンク
[CVPR2023 論文紹介] InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions
moro-tyo 2023/09/10
cv

deeplearning
リンク
Responsible AI at Google Research: Perception Fairness
moro-tyo 2023/09/10
deeplearning
リンク
Personalization Offline Think with Google - Thought leadership - Insight
Marketing is at an inflection point. Here’s why that’s an opportunity
moro-tyo 2023/09/10
ad
リンク
Readable
DeepL Pro をお使いの方は ~20 ページを目安に利用してください。 DeepL Free をお使いの方は 1 ページずつ利用してください。
moro-tyo 2023/08/21
paper
リンク
PRIOR
moro-tyo 2023/07/30
cv

deeplearning
リンク
Unifying image-caption and image-classification datasets with prefix conditionin
moro-tyo 2023/07/22
cv

deeplearning
リンク
Pic2Word: Mapping pictures to words for zero-shot composed image retrieval
moro-tyo 2023/07/21
cv

deeplearning
リンク
Open LLM Leaderboard 2 - a Hugging Face Space by open-llm-leaderboard
Track, rank and evaluate open LLMs and chatbots
moro-tyo 2023/07/19
deeplearning

nlp
リンク
GitHub - BradyFU/Awesome-Multimodal-Large-Language-Models: :sparkles::sparkles:Latest Advances on Multimodal Large Language Models
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
moro-tyo 2023/07/05
cv

deeplearning
リンク
前のページ 1 2 3 4 5 6 7 8 9 10 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx