[B! machine learning] a_bickyのブックマーク

ChatGPTの仕組みを理解する | HireRoo Tech Blogs

本ブログでは、OpenAI社から発表されたチャットサービスであるChatGPTの仕組みを紹介していきます。どのようにChatGPTを使うかといった話ではなく、ChatGPTそのものがどのような枠組みの上で成り立っているのかをざっくりと理解できることが本記事のゴールとなります。

a_bicky 2023/03/28

machine learning

リンク

Python: Adversarial Validation について - CUBE SUGAR CONTAINER

最近、Kaggle などのデータ分析コンペで使われることの多い Adversarial Validation という手法について調べたり考えていたので書いてみる。もくじもくじ背景 Adversarial Validation 試してみる下準備二つのデータが同じ分布に由来するとき二つのデータが異なる分布に由来するとき異なる分布でそのまま分類してみる検証用データに似ているものを取り出す取り出したデータを使って学習してみるラベルごとに似ているデータを取り出すどれだけ取り出して学習させれば良いのか Adversarial Validation の応用例背景 Adversarial Validation という手法は、データ分析コンペに存在する、ある課題を解決するために考案された。その課題とは、提供される複数のデータセットの分布が異なる場合に、いかにして正しく予測するかとい

a_bicky 2019/04/17

machine learning

リンク

半教師あり学習のモデル仮定 - でかいチーズをベーグルする

Machine Learning Advent Calendar 2014の12日目。最近半教師あり学習に興味があってちょっと勉強してみたのでそれについて書いてみる。自分が勉強した時に読んだ文献も下の方に書いたのでもし興味があれば。半教師あり学習はラベル付きデータに加えてラベル無しデータも使って学習できるということですごく魅力的なんだけど、何も考えずに使うと教師あり学習より精度が落ちることがよくある。ラベル無しデータはその名の通りどのクラスに属すかが分かっていないデータなので、何かしらのモデルに基いてそのデータがどのクラスに属するかを仮定してやらないといけない。つまりデータの分布（モデル）に仮定を置かないといけない。半教師あり学習をする上ではこれが一番重要。 Introduction to Semi-Supervised Learningのp.15にもこう書いてある。 the

a_bicky 2015/02/01

machine learning

リンク

節操の無いクソイナゴ野郎なのでdeep learningで使われるautoencoder実装した - 糞糞糞ネット弁慶

身内でdeep learningの勉強会をやったらできそうだったので実装した．読んだのは大体ここらへん． NEURAL NETS FOR VISION(CVPR2012 tutorial) CS294A Lecture notes Sparse autoencoder ImageNet Classification with Deep Convolutional Neural Networks autoencoder autoencoderはunsupervised feature learningの一種．Convolutional Neural Netとは違って，最後の判別器の予測誤差をback propagationさせる，という事はせずある種特徴抽出で完結させている． autoencoderを一言でまとめると，「次元削減を繰り返すNeural Netを多段に繋げて特徴抽出を行う手法

a_bicky 2014/03/04

リンク

第1回IBISML研究会 | 情報論的学習理論と機械学習 (IBISML) 研究会

a_bicky 2013/09/09

machine learning

リンク

SVM実践ガイド (A Practical Guide to Support Vector Classification) - シリコンの谷のゾンビ

SVMツールで有名なLIBSVMの作者らがまとめた "A Practical Guide to Support Vector Classification" という良資料[1]の日本語解説資料をまとめてみたので公開． SVM実践ガイド (A Practical Guide to Support Vector Classification) View more presentations from sleepy_yoshi 元資料はこちら本資料作成のきっかけは，まわりの人に「SVMとかいう手法使ったんだけど，機械学習よくわからなくてさ」という感じで相談を受けて「カーネルは何使ってるの?」「素性のスケーリングはした?」「Cパラメータは調整した?」というようなことを聞くのだけれど，「???」というやりとりにうんざりしたから．その都度，Cパラメータというものがありまして〜，カーネルというものが

a_bicky 2013/06/16

リンク

［4］機械学習におけるApache Mahoutの可能性と課題

第2回、第3回では、音声データと、画像データに関するメディア認識技術について解説してきました。今回は、メディア認識技術に共通する課題である、機械学習の高速化について取り上げます。まず、機械学習とは何かということから簡単に説明すると、ある程度大量のデータの中から規則性やパターンを見いだすことで、データの認識や判定などに役立てる取り組みのことを指します。例えば、皆さんが使用しているパソコンや情報システムの多くには、メールを受信したときに、ウイルスが含まれていないかどうか、スパムメールでないかどうか、判定するソフトウエアが入っていると思います。これも、過去の大量データに基づいて、ウイルスが入っていたり、スパムメールだったりする可能性が高いパターンを機械学習することで判定の仕組みを作り、そのロジックを活用しているのです。そしてメディア処理システムには、音声、画像、テキストなどデータの種類を問わ

a_bicky 2012/11/01

リンク

サービス終了のお知らせ - NAVER まとめ

サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

a_bicky 2012/09/09

machine learning

リンク

Machine learning textbook

Machine Learning: a Probabilistic Perspective by Kevin Patrick Murphy. MIT Press, 2012. See new web page.

a_bicky 2012/08/19

リンク

「機械学習とパターン認識」(PRML)のアンチョコ by herumi - 木曜不足

社内で「機械学習とパターン認識」(PRML) の読書会をやっているのだけど、計算がやっぱり難しいようでみんな苦戦中。そんなこんなで、光成さん(@herumi さん)が PRML の数式を手抜き無しで解説するアンチョコ(虎の巻 / PRML教科書ガイド)をマメに作ってくれている。*1 PRML のための数学(PDF) 内容は PRML の2章から4章と、9章、PRMLでもっとも計算が難しいと評判の10章を対象としている。たとえば2章のアンチョコでは、2章の中で必要とされる解析や線形代数の道具(積分の変数変換、行列の各種操作)を一通り取り上げた後、ガウス分布の最尤推定における平均や分散による偏微分という、おそらく多くの人がつまづくのだろう計算がきちんと説明されている。また3章のアンチョコでは、Woodbury の公式やヘッセ行列を解説しつつ、エビデンス関数などを導出しているし、4章になる

a_bicky 2012/03/15

懇親会で話題になっていた、PRMLを読むための数学の知識とか式展開とかの資料

リンク

Gradient boosting - Wikipedia

Gradient boosting is a machine learning technique based on boosting in a functional space, where the target is pseudo-residuals rather than the typical residuals used in traditional boosting. It gives a prediction model in the form of an ensem ble of weak prediction models, i.e., models that make very few assumptions about the data, which are typically simple decision trees.[1][2] When a decision t

a_bicky 2012/01/07

リンク

String Kernel Implementation - MetaOptimize Q+A

a_bicky 2011/09/12

ちゃんとfor文でGap-weighted String Kernelを実装してるっぽい。Pythonだけど。

リンク

mloss | All entries

Alpenglow 1.0.6 About: A recommender systems research framework aimed at modeling non-stationary environments. Changes: Initial Announcement on mloss.org.

a_bicky 2011/09/09

Machine Learning Open Source Softwareだそうな

machine learning

リンク

サービス終了のお知らせ

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

a_bicky 2011/05/12

machine learning

リンク

http://www.mayo.edu/hsr/techrpt/61.pdf

a_bicky 2011/02/22

An Introduction to Recursive Partitioning Using the RPART Routines

リンク

ML4NL - PukiWiki

言語処理のための機械学習入門 † 高村大也著コロナ社 2010年7月1日出版 (自然言語処理シリーズ１　奥村学監修) 機械学習を用いた自然言語処理の初学者向けに、なんらかの足がかりになることを狙って、この本を書きました。特に念頭においていたのは、研究室にまだ属していない、もしくは属したばかりの学生の方々、あるいは身近に教えてくれる人のいない方々、機械学習ベースの言語処理をこれから取り入れようとしているエンジニアの方々、などです。たとえば、言語処理専門の先生がいない環境で頑張っている学生さんは、いいアイデアを持っていても機械学習の基礎知識が足りなくて形にできなかったりするかもしれません。僕自身、修士までは言語処理と無関係の研究室に属しており、思うように言語処理の勉強ができなかった経験があります。この本がそんな方々の助けに少しでもなれば、執筆に費やした

a_bicky 2010/08/19

リンク

Cognitive Computation Group

a_bicky 2010/07/28

リンク

UCI Machine Learning Repository

Welcome to the UC Irvine Machine Learning Repository We currently maintain 664 datasets as a service to the machine learning community. Here, you can donate and find datasets used by millions of people all around the world!

a_bicky 2010/07/27

machine learning

リンク

BLOG::broomie.net: 機械学習の勉強を始めるには

thriftとかhadoopなど，何やらいろいろと手を出してしまい，ここのところブログの更新が滞ってしまっていますが，今日は前から書きたかったトピックについて自分へのメモの意味も含めて記しておきたいと思います．はじめに最近，といっても結構前からなのですが，海外のブログなどで「機械学習の勉強を始めるガイドライン」についてのエントリーがいくつか見られ，かつ，議論も少し盛り上がっています．僕は機械学習が好きなだけで，専門というにはほど遠いのですが，僕も一利用者としてはこのトピックに関してはとても興味があります．機械学習というと，色々な数学的な知識が必要であったり，統計学や人工知能の知識も必要になったりしまったりと，専門的に学ぶ機会が無かった人にとっては興味が湧いてもなかなか始めるには尻込みしてしまうことかと思います．今日紹介するエントリーは，そんな方々にヒントになるような内容になっていると