[B! language-model][machine-learning] nabinnoのブックマーク

nabinno id:nabinno

language-modelとmachine-learningに関するnabinnoのブックマーク (8)

GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。今回は、2024/05/14に発表されたGPT4oについてです。返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか？というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通りこのBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の
nabinno 2024/05/15
zenn

gpt-4o

gpt

language-model

object-detection

image-recognition

machine-learning

analytics
リンク
基盤モデルによる生成 AI アプリケーションの構築 - Amazon Bedrock - AWS
Amazon Bedrock は、AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon などの大手 AI 企業が提供する高性能な基盤モデル (FM) を単一の API で選択できるフルマネージド型サービスです。また、生成 AI アプリケーションの構築に必要な幅広い機能も備えているため、プライバシーとセキュリティを維持しながら開発を簡素化できます。Amazon Bedrock を使用すると、ユースケースに最適な FM を簡単に試して評価したり、微調整や検索拡張生成 (RAG) などの手法を使用してデータに合わせてカスタマイズしたり、エンタープライズシステムとデータソースを使用してタスクを実行するエージェントを構築したりできます。Amazon Bedrock はサーバーレスであるため、インフラストラクチャを管理する必要がありません。また、使い慣
nabinno 2023/05/23
amazon-bedrock

language-model

foundation-models

deep-learning

machine-learning
リンク
生成系AIのアナロジー力 - ニューロサイエンスとマーケティングの間 - Between Neuroscience and Marketing
1.4/50 Summilux ASPH, Leica M10P, RAW Midjourney、ChatGPTと立て続けに強烈なアプリケーションが出てきて、Diffusion model（拡散モデル）やtransf ormer architectureに基づくいわゆるGenerative AI（生成系AI）がそこらで話題だ。ガンガン画像を生み出すことで一気に注目を集めたMidjourneyはクリエーター寄りだけれど、11月末、対話型で答えを返してくれるChatGPT*1が出てきたときに*2、あまりの回答力にDS協会*3のスキル定義委員会でもひとしきり話題になり、僕も自分の研究会の学生たちに「君ら、深く考えずにまずは使い倒したほうがいいよ」と早々にアドバイスした。使わないことには凄さも課題も何もわからないからだ。すると二週ほど前のゼミで、ある卒業を控えた学生が ChatGPTがないと生きて
nabinno 2023/02/04
kazuto-ataka

chatgpt

midjourney

stable-diffusion

transformer

language-model

deep-learning

machine-learning
リンク
フリーで使える日本語の主な大規模言語モデル（LLM）まとめ
ありがとうございます！実は私本人がそのモデルの構築に関わっているのですが、詳細はまだ言えない状況です...。来年3月の言語処理学会年次大会(NLP 2023)での続報をお待ちください！このモデルに関する論文が公開される予定です（一応それを待ってからこの記事にも掲載します）。（私が書いたものではありませんが、現段階で公開できる情報をまとめた記事があります: https://note.com/utokyo_itc/n/nb18b2a753f23 ）
nabinno 2023/01/18
zenn

language-model

natural-language-processing

machine-learning
リンク
BERT (言語モデル) - Wikipedia
Bidirectional Encoder Representations from Transf ormers（BERT）は、自然言語処理の事前学習用の Transf ormer ベースの機械学習手法である[1]。BERT は、Google の Jacob Devlin と彼の同僚によって2018年に作成され公開された[2][3]。2019年現在、Google は BERT を活用して、ユーザー検索の理解を深めている[4]。背景[編集] 方向制約[編集] BERT 以前の多くの言語モデルは事前学習に単方向性（英: unidirectional）のタスクを採用しており[5]、学習された表現も単方向の文脈しか考慮しないものであった。この制約は文脈レベルの表現が必要なタスクの性能へ大きなペナルティを与えうる。手法[編集] これらの背景に基づき、BERT は MLM事前タスクと双方向 Trans
nabinno 2023/01/18
bert

language-model

natural-language-processing

transformer

deep-learning

machine-learning
リンク
言語モデル - Wikipedia
言語モデル（げんごモデル、英: language model）は、単語列に対する確率分布を表わすものである[1]。解説[編集] 言語モデルは、長さがm個の単語列が与えられたとき、その単語列全体に対しての確率を与える。この確率分布は、1つまたは複数の言語のテキストコーパスを使用して、言語モデルを訓練することによって得られる。しかし、言語は無限に有効な文を表現することができるため[注釈 1]、言語モデリングは、訓練データでは遭遇しないような言語的に有効な単語列にゼロでない確率を割り当てることが課題となる。この問題を克服するために、マルコフ仮定や、回帰型ニューラルネットワークあるいはトランスフォーマー（transf ormer）などのニューラルアーキテクチャなど、さまざまなモデリング方法が考案されている。言語モデルは、計算言語学におけるさまざまな問題に役立っている。当初は、低確率で無意味な単
nabinno 2023/01/18
language-model

natural-language-processing

machine-learning
リンク
話題爆発中のAI「ChatGPT」の仕組みにせまる！ - Qiita
オミータです。ツイッターで人工知能のことや他媒体の記事などを紹介しています。 @omiita_atiimoもご覧ください！話題爆発中のAI「ChatGPT」の仕組みにせまる！注意：ChatGPTはまだ論文が出ていないため、細かい箇所は不明です。本記事では公式から出た記事およびInstructGPTの論文をもとにChatGPTの仕組みを探っていきます本記事の流れ: 忙しい方へ ChatGPTとは GPT-3 InstructGPT ChatGPT まとめと所感参考 0. 忙しい方へ ChatGPTは、InstructGPTをベースとしたモデルだよ InstructGPTは、「人間の好みに合った文を出力するように微調整したGPT-3」だよ InstructGPTの学習では、以下の3つが重要だよ GPT-3の教師ありファインチューニング Reward Modelの学習 RLHF（＝Re
nabinno 2022/12/13
qiita

chatgpt

gpt-3

language-model

instructgpt

machine-learning

chatbot
リンク
GPT-3の衝撃 - ディープラーニングブログ
この1週間はGPT-3のユースケースの広さに驚かされる毎日でした．シリコンバレーでは話題騒然ですが日本ではほとんど話題になっていないので，勢いで書くことにしました． GPT-3はOpenAIが開発した言語生成モデルです．名前の由来であるGenerative Pretrained Transf ormerの通り，自然言語処理で広く使われるTransf ormerモデルを言語生成タスクで事前学習しています．先月申請すれば誰でもGPT-3を利用できるOpenAI APIが発表され，様々な業種の開発者によって驚くべきデモンストレーションがいくつも公開されています．特に話し言葉からJSXやReactのコードを生成するデモは著名なベンチャーキャピタルから注目を集め，誇大広告気味だと警鐘を鳴らす事態に発展しています． This is mind blowing. With GPT-3, I built
nabinno 2020/07/22
gpt-3

language-model

deep-learning

machine-learning

natural-language-processing

analytics

search-engine
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx