[B! 機械学習] shimanpのブックマーク

shimanp id:shimanp

機械学習に関するshimanpのブックマーク (147)

LLMの現在 - Speaker Deck
今のLLMを取り巻く状況について紹介します。
shimanp 2024/03/30
あとで読む

機械学習

人工知能
リンク
30分で完全理解するTransformerの世界
はじめに初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI 技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。深層学習界隈では、2017年に衝撃的なタイトル（Attention Is All You Need）の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transf ormer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。今回はそんなTransf ormerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transf ormers に倣いつつ、適宜、2023年2月上旬現在ま
shimanp 2023/10/06
あとで読む

transformer

機械学習
リンク
もう初回コードレビューはAIに任せる時代になった - CodeRabbit -
どんな人向けの記事？レビューによって心理的なダメージを受けやすい方非エンジニアだが、エンジニアチームがどんな機能を作っているか知りたい方業務が溜まっていて、レビューに割く時間を捻出するのに苦労している方コピペできるコードも公開します初回レビューをAIに任せると、いろんなロールの人の役に立つレビューは得意ですか？優秀なエンジニアしかいないチームであれば、PRは1トピックに絞って小さく明確なコミットによって作成され、適切な要約とともに提供されることでしょう。しかし、実際にはいろいろな制約から、PRが想定よりずっと大きくなってしまったり、関連トピックと異なるコードが混じってしまうこともあります。実際のところ、大きなPRを適切にレビューするのは難しいことです。また、自分が詳しくない領域のレビューを行わなければいけない機会もあります。今回の記事は、レビューを作成してくれるAI C
shimanp 2023/10/03
AI

プログラム

機械学習

エンジニア
リンク
機械学習と自動微分 (2023)
「最適化法」第15回(ゲストトーク), 2023年1月20日, 同志社大学.
shimanp 2023/09/28
機械学習

math
リンク
LLMのファインチューニングで何ができて何ができないのか｜npaka
LLMのファインチューニングで何ができて、何ができないのかまとめました。 1. LLMのファインチューニングLLMのファインチューニングの目的は、「特定のアプリケーションのニーズとデータに基づいて、モデルの出力の品質を向上させること」にあります。 OpenAIのドキュメントには、次のように記述されています。ファインチューニングは、プロンプトに収まるよりも多くの例で学習することで、Few-Shot学習を改善します。一度モデルをファインチューニングすれば、プロンプトにそれほど多くの例を提供する必要がなくなります。これにより、コストを削減し、低レイテンシのリクエストを可能にします。しかし実際には、それよりもかなり複雑です。 LLMには「大量のデータを投げれば自動的に解決する」ような創発的な特性があるため、ファインチューニングもそのように機能すると人々は考えていますが、必ずしもそうではありませ
shimanp 2023/08/29
機械学習

chatgpt
リンク
大規模言語モデルの驚異と脅威
2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを（Research Preview版ではあるが）無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転換点となり得ることは、驚異的なことである。本講演では、ChatGPTがベースにしているInstructGPTを中心に、大規模言語モデルやプロンプト、人間のフィードバックによる強化学習などの技術を概観する。また、ChatGPTのような生成型の人工知能が社会やビジネス、学術にもたらす脅威について述べる。 https://aip.riken.jp/sympo/sympo202303/
shimanp 2023/03/29
あとで読む

AI

機械学習

自然言語処理
リンク
GPTの仕組みと限界についての考察（１） - conceptualization
GPT4が登場してChatGPTが盛り上がってますね。本記事は、GPT（を支えるTransf ormerという仕組み）をChatGPTユーザにとって分かりやすく説明し、その能力と限界についての見通しをよくしよう、という趣旨になります。少し長くなりそうなので、全部で記事を3回に分けようと思います。（１）大まかな背景と概要：本記事（２）GPTの能力と可能性：実際の使用例とTransf ormerの仕組みを踏まえて説明（３）GPTの限界と未来展望：Transf ormerの仕組みが持つ限界と研究の進展を予想 GPT3と4の違い：トークン長とは何か？まずここから話を始めます。GPT-3は、パラメータ数が750億個（850GBの容量を食う）でトークン長が4097(GPT-3.5)でした。GPT-4は、パラメータ数は非公開でトークン長は32768ですので、ちょうど8倍になります。さて、トーク
shimanp 2023/03/22
機械学習

AI

gpt
リンク
【2023年版】機械学習の日本語無料学習教材まとめ - Qiita
言語&開発基礎編 PythonやSQLなどの言語と開発環境に関連することをまとめました。機械学習に関する教材はこの次のセクションにまとめてあります。学習環境インストール及び使い方チュートリアルのサイトと、ある程度使い慣れた後に役立つtips集を各エディタでまとめました。 Google Colaboratory Python初学者にとって最もわかりやすいPython実行環境です。プログラミングは初めて！という方はまずこのGoogle Colaboratory(通称: Colab)から始めてみて、使い方がある程度わかったら、そのまま次のセクションのPython編に移りましょう。 Pythonプログラミング入門難易度: ★☆☆ 東京大学の公開しているPython講座ですが、冒頭でColabの使い方を解説しています。使ったことのない方はこちらから！ Google Colabの知っておくべき
shimanp 2023/02/28
機械学習
リンク
(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
(数式を使わない) Transf ormer の直感的な説明 RNN の欠点 Transf ormer はこれをどう解決したか Transf ormer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transf ormer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transf ormer を参照のこと。日本語ではこの解説がわかり
shimanp 2023/02/27
あとで読む

機械学習

AI
リンク
VSCodeにChatGPTの拡張機能を入れてコードレビューやバグを発見してもらう - Qiita
ChatGPTとは？ OpenAIが開発するGPT-3という言語モデルをベースとした(執筆当時)チャットアプリです。こちらの質問に対して、AIが色々な質問に答えてくれて、一般的な内容だけではなく、コードレビューやバグなども発見してくれるめっちゃ凄いやつです。細かい内容は以下の記事がとても参考となります。筆者の関連記事 VSCodeと連携して、ブラウザを開かなくてもChatGPTを使用できるようにする通常はブラウザを開いて使用するのですが、コーディング中にサクッとレビューしてもらったり、バグを見つけてもらえるような拡張機能があったので、そちらの設定方法について記述してみます。今回インストールする拡張機能使用までの手順環境 PC: MacBook Pro (Apple M2) OS: macOS Ventura 13.1 VSCode: v1.74.3 OpenAIの価格について
shimanp 2023/01/16
機械学習

AI
リンク
ChatGPT
A conversational AI system that listens, learns, and challenges
shimanp 2022/12/07
これはすごい

Deep Learning

機械学習
リンク
「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め
ビジネスでデータサイエンスを活用するシーンとして、過去データを使って将来を予測するタイプの問題がある。商品販売数や店舗売上高など、折れ線グラフを使って表現するようなデータ（時系列データ）に基づいた時系列分析だ。過去の販売データに基づいて翌月の発注量を決めたり、3年後など中長期の計画を策定したりするのに使う。今回は、この時系列分析に活用しやすい3つのアルゴリズムを見ていこう。 Prophet
shimanp 2022/10/07
アルゴリズム

機械学習

時系列分析
リンク
https://twitter.com/developer_quant/status/1566417479727222784
shimanp 2022/09/05
学習

大学

機械学習
リンク
Stable Diffusion Public Release — Stability AI
It is our pleasure to announce the public release of stable diffusion following our release for researchers [https://stability.ai/stablediffusion] Over the last few weeks, we all have been overwhelmed by the response and have been working hard to ensure a safe and ethical release, incorporating data from our beta model tests and community for the developers to act on. In cooperation with the tirel
shimanp 2022/08/23
deeplearning

AI

画像

機械学習
リンク
君には今から3時間で機械学習Webアプリを作ってもらうよ
新人: 「本日データサイエンス部に配属になりました森本です！」先輩: 「お、君が新人の森本さんか。僕が上司の馬庄だ。よろしく！」新人: 「よろしくお願いします！」先輩: 「さっそくだけど、練習として簡単なアプリを作ってみようか」先輩: 「森本くんは Python なら書けるかな？」新人: 「はい！大学の研究で Python 書いてました！PyTorch でモデル作成もできます！」先輩: 「ほう、流石だね」新人: 😊 先輩: 「じゃ、君には今から 3 時間で機械学習 Web アプリを作ってもらうよ」先輩: 「題材はそうだなぁ、写真に写ってる顔を絵文字で隠すアプリにしよう」先輩: 「あ、デプロイは不要。ローカルで動けばいいからね。顔認識と画像処理でいけるよね？」新人: 😐 新人: (えぇぇぇぇぇぇぇ。3 時間？厳しすぎる...) 新人: (まずモデルどうしよう。てかもら
shimanp 2022/05/30
機械学習

python
リンク
[NAFNet] 機械学習で画像のノイズ除去、ブラー除去、超解像 [Denoise, Deblur, Super Resolution]
[NAFNet] 機械学習で画像のノイズ除去、ブラー除去、超解像 [Denoise, Deblur, Super Resolution] 2022年5月7日土曜日 Artificial Intelligence NAFNet 概要近年、画像復元(Image Resolution)技術は様々な進歩がみられていますが、システムの複雑さも増加しています。 NAFNetは、SOTAを達成しつつ、計算効率の高い単純なベースラインで構成される画像復元技術です。 NAFNetは、Sigmoid, ReLU, GELU, Softmaxなどの非線形活性化関数を使用せず、乗算で置き換えるか、削除することでベースラインを単純化しています。このため、非線形活性化関数フリーなネットワークであることから、Nonlinear Activation Free NetworkでNAFNetと呼ばれています。 NAFN
shimanp 2022/05/08
機械学習

画像
リンク
機械学習が独学できる日本語Youtube難易度別まとめ - Qiita
こんにちは。在宅の機会が増えて以来Youtubeを見る機会が増え、機械学習などが勉強できるチャンネルをいくつか探しては見ていました。探した中でよかったと思ったものをメモしていたのですが、せっかくなので公開したいと思います。日本語のソースがあるもののみ対象にしており、『これ無料でいいのか？』と思ったチャンネルを紹介したいと思います。主観で以下のレベルに分けましたがあくまで参考程度にお願いいたします。基本：Pythonを触ってみた人 Pythonの説明・動かし方などを解説していて、動画によっては踏み込んだ内容になる応用：アルゴリズムを使いこなしたい人「model.fit(X, y)して動かしてみた」よりも踏みこみ、Python自体の説明は少ない発展：研究開発もしたい人最新の手法の仕組みの理解などが主眼であり、Pythonの解説はほぼ無いもしおすすめのチャンネルございましたらぜひコ
shimanp 2022/04/07
学習

数学

機械学習
リンク
畳み込み+Attention=最強？最高性能を叩き出した画像認識モデル「CoAtNet」を解説！ - Qiita
1. CoAtNetの解説 1.1 畳み込みとSAの復習コンピュータビジョンで用いられている大きな仕組みに畳み込みとSelf-Attention(=SA)があります。畳み込みではEfficientNet、SAではViTが有名ですね。EfficientNetについてはこちらの拙著記事、ViTについてはこちらの拙著記事をご参照ください。CoAtNetでは、この畳み込みとSAの良いとこ取りをしたブロックを作ることが一番の目的になっています。畳み込みとSAの式を復習しておきましょう。ここでは畳み込みの中でもDW(=Depthwise)畳み込みを取り扱います。そして、本論文では分かりやすさを優先しているのか、式の細かいところ(SAにおけるqkvの埋め込みなど)はあえて排除しているように見えるので、理解しやすいです。 1.1.1 畳み込みの式本論文では、畳み込みの中でもDW(=Depthwise)
shimanp 2021/11/17
AI

機械学習

あとで読む
リンク
機械学習のパラメータチューニングを「これでもか！」というくらい丁寧に解説 - Qiita
はじめに私はこれまで機械学習のパラメータチューニングに関し、様々な書籍やサイトで学習を進めてきました。しかしどれもテクニックの解説が主体のものが多く、「なぜチューニングが必要なのか？」という目的に関する記載が非常に少なかったため、体系的な理解に苦労しました。この経験を後世に役立てられるよう、「初心者でも体系的に理解できる丁寧さ！」をモットーに記事にまとめたいと思います。具体的には、 1. パラメータチューニングの目的 2. チューニングの手順とアルゴリズム一覧 3. Pythonでの実装手順 (SVMでの分類を例に) の手順で解説を進めます。独自解釈も含まれるため、間違っている点等ございましたら指摘頂けると有難いです。なお、文中のコードはこちらのGitHubにもアップロードしております。 2021/9/6追記：LightGBMのチューニング実行例追加以下の記事に、Ligh
shimanp 2021/06/08
機械学習

勉強
リンク
機械学習で競馬の回収率100%超えを達成した話 - Qiita
はじめにみなさん競馬はお好きでしょうか？私は今年から始めた初心者なのですが、様々な情報をかき集めて予想して当てるのは本当に楽しいですね！最初は予想するだけで楽しかったのですが、『負けたくない』という欲が溢れ出てきてしましました。そこで、なんか勝てる美味しい方法はないかな〜とネットサーフィンしていたところ、機械学習を用いた競馬予想というのが面白そうだったので、勉強がてら挑戦してみることにしました。目標競馬の還元率は70~80%程度らしいので、適当に買っていれば回収率もこのへんに収束しそうです。なのでとりあえず、出走前に得られるデータを使って、回収率100パーセント以上を目指したいと思います！設定を決める一概に競馬予測するといっても、単純に順位を予測するのか、はたまたオッズを考えて賭け方を最適化するのかなど色々とあると思います。また、買う馬券もいろいろな種類があります。今回
shimanp 2020/09/04
機械学習
リンク
1 2 3 4 5 6 7 8 次のページ