タグ

機械学習に関するatm_09_tdのブックマーク (180)

  • [初級編]LLMへ至る道~ニューラルネットワークってなんだ?~[4日目] | DevelopersIO

    みなさんこんにちは!クルトンです。 前回は、活性化関数について確認をしました。機械学習モデルの「表現力を豊かにする」という部分で活躍するものでしたね。 日のブログは、ここまでの内容で確認してきた内容を理解した状態で、下記のAWS公式サイトにある図を理解する事を目的とします。 日より前のアドベントカレンダーを見てもらえると、実は理解できる部分もあるのではないでしょうか?まずは簡単なニューラルネットワークについての説明をし、最後に上図について確認していきましょう! それでは、まずはニューラルネットワークの簡単な説明からです。 ニューラルネットワークの簡単なイメージについて 一言で説明するとニューラルネットワークとは事前に定義した計算式を行なっていき、出力をするものです。 「え、それだけ?」と思われた方がいるかもしれません。ただ意外とやっている事の概要は単純なのです。 では、基形をイメージ

    [初級編]LLMへ至る道~ニューラルネットワークってなんだ?~[4日目] | DevelopersIO
  • [初級編]LLMへ至る道~活性化関数ってなにをしているの?~[3日目] | DevelopersIO

    みなさんこんにちは!クルトンです。 前回のブログは損失関数についてでした。2乗和誤差や交差エントロピー誤差について、簡単にですがご紹介していきました。 今回は活性化関数について説明していきます!活性化関数ってなんだ?ってところなのですが、機械学習のモデルでよく出てくる用語ですので、しっかり説明していきます! では早速、活性化関数について見ていきましょう。 活性化関数ってなんだ?その説明とイメージ 活性化関数とは、一言で言うと、機械学習の表現力を高めるための関数となります。 活性化関数でどのように表現力を高めるのかについては、実際の関数について見ていただければ理解できるかと思います。 ですが先に 「表現力を高める」 という部分について説明をしていきます。 表現力を高めるってなんだろう 表現力が高いというと、みなさんはどのような事を想像するでしょうか。 クリエイティブな人を思い浮かべたりする人

    [初級編]LLMへ至る道~活性化関数ってなにをしているの?~[3日目] | DevelopersIO
  • [初級編]LLMへ至る道~損失関数ってなにをしているの?~[2日目] | DevelopersIO

    みなさんこんにちは!クルトンです。 前日のブログは初回という事で、「機械学習とはなんぞや」について説明しました。 日のブログは損失関数についてです。 なぜ2日目に持ってきたかというと、機械学習の理解において損失関数が重要であると考えているためです。 データの特徴によって機械学習で使うモデル(アルゴリズム)の種類が違うという話をしている書籍やブログはあります。 ただしアドベントカレンダーでは、人間の言葉を理解する機械学習モデルについて説明しようと考えているため、対象外のモデルも説明に含めてしまいます。 また実際に、さまざまな機械学習モデルを動かす必要がある方でなく、対象読者を「(ChatGPTなどLLMについて)どういう動きをしているか中身を知りたいなー」という人からするとなくても良い情報なのではないか?と考え、思い切ってそちらは説明せずに機械学習モデルなら共通で必要な内容の中でいくつか

    [初級編]LLMへ至る道~損失関数ってなにをしているの?~[2日目] | DevelopersIO
  • [初級編]LLMへ至る道 ~そもそも機械学習ってなんなの?本企画の説明を添えて~[1日目] | DevelopersIO

    みなさんこんにちは!クルトンです。 日からアドベントカレンダー2023年の企画として、一人アドベントカレンダーをやっていきます。 初めてアドベントカレンダーという企画をやっていくのですが、頑張っていきます。 アドベントカレンダーの内容や対象読者については以下に記載します。 どういった内容のアドベントカレンダーなのか LLMという単語をお聞きした事があるでしょうか。大規模言語モデルというもので英語だとLarge Language Modelです。以降ではLLMという略称を使っていきます。ChatGPTなどをニュースで見聞きする中で、もしかするとお聞きした人がいるかもしれませんね。 今回のアドベントカレンダーでは、LLMへ至るまでの内容で重要な内容をピックアップしながら書いていこうと考えています。 LLMの一つであるGPTについての説明はもちろんのこと、GPTを理解するためにも必要であるTr

    [初級編]LLMへ至る道 ~そもそも機械学習ってなんなの?本企画の説明を添えて~[1日目] | DevelopersIO
  • ChatGPTはプログラミング言語マスター(語弊ありまくり) - kmizuの日記

    皆さんおはようございます。見ている人は見ていたかもしれませんが、昨夜はかなり遅くまで巷で話題沸騰のChatGPTによくわからんクエリを投げて、その結果をみてげらげら笑っていました。特に存在しないプログラミング言語であり「ScalaにHaskellと同じ型推論を加えた」言語Scalayがあることにしたら、ChatGPT当にHaskellぽい(単なるHMでなく、Haskellぽいというのは型クラスまで推論される辺り)型推論を持つ架空のScalayコードを解釈実行してくれたりしたところは、控えめに言っても予想外の結果で深夜なのに部屋で忍び笑いをしていました。 Scalaに引数の型推論を追加したようなパチもんのプログラミング言語Scalay(仮)ができてしまった(ChatGPTと対話してる間だけの短い命)。 一応、add: (Int, Int) => Int が推論されてるのすばらですね。 p

    ChatGPTはプログラミング言語マスター(語弊ありまくり) - kmizuの日記
  • クラスメソッド データアナリティクス通信(機械学習編) – 2022年12月号 | DevelopersIO

    データアナリティクス事業部の鈴木です。 先月から始まりましたクラスメソッド データアナリティクス通信(機械学習編) の12月号です。 今月は特にAWSでre:Invent2022が開催されるため、少し早いですが現時点までのアップデートを12月号としてご紹介します。 機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。 AWS SageMaker Autopilotに関するアップデート 一括でバッチ推論が実行できるようになりました。 これまでAutopilotでバッチ推論をするには、以下の手順を踏む必要がありましたが、一括できるようになりました。 DescribeAutoMLJob APIを使用して一

    クラスメソッド データアナリティクス通信(機械学習編) – 2022年12月号 | DevelopersIO
    atm_09_td
    atm_09_td 2022/11/27
    学習
  • 機械学習での外れ値や異常値の扱いについて考えてみる | DevelopersIO

    こんにちは、小澤です。 データ分析をする際には注意したいことの1つとして、外れ値の存在による影響があります。 これはもちろん、機械学習をする際にも手法によってモデルの精度に影響が出ることを意味しており、 ブラックボックス化されていて、気付かなったという事態も起こりえるものとなります。 また、外れ値だからと言って常に異常な値であるとは限らないケースもあるため、 外れ値と異常値を区別して考える必要がある場合もあります。 今回は、そんな外れ値や異常値について、考えていきたいと思います。 外れ値が何なのかを考える 何らかの定義に基づくものとしてではなく、他と比較して極端な値を外れ値と呼ぶケースが一般によくあります。 「外れ値を除外したい」といった時に、何が外れ値なのか明確でないまま何となく極端な値を削除したいケースです。 たった1つの外れ値が全体に大きな影響を及ぼしてしまうケースは実際に多くありま

    機械学習での外れ値や異常値の扱いについて考えてみる | DevelopersIO
  • 東京工業大学、機械学習の講義ノートが無料公開 Pythonの実装も学べる | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    東京工業大学、機械学習の講義ノートが無料公開 Pythonの実装も学べる | Ledge.ai
  • Googleが大量の機械学習用データベースを無料公開してた - Qiita

    個人用メモです。 機械学習は素材集めがとても大変です。 でもこの素材集め、実は無理してやらなくても、元から良質な無料データベースがあったようなのです。 URLはこちら YouTube8-M https://research.google.com/youtube8m/explore.html 提供されているサービスは以下の通り 800万個の動画 19億個のフレーム 4800個の分類 使い方はExploreから画像セットを探し、ダウンロードするだけ。 他の方法も見つけた open images dataset 「すごい神だな」と思ったのは これもう完成されてますよね もちろんこの認識前の画像もセットでダウンロードできます。 Youtube-8Mとは、画像数を取るか、精度で取るか、という違いでしょうか。 他にも良い素材集を教えていただきました (はてなブックマーク情報 @sek_165 さん )

    Googleが大量の機械学習用データベースを無料公開してた - Qiita
  • マイクロソフト、初心者向けのIoTカリキュラム無料公開 12週間で学習できる | Ledge.ai

    米マイクロソフト(Microsoft)は、あらゆる年齢層の人がIoT(モノのインターネット)の基礎を学べるように、GitHub上に無料のカリキュラム「はじめてのIoT、カリキュラム(IoT for Beginners, curriculum)」を無料公開した。 カリキュラムは「IoT入門」「デバイスをインターネットに接続する」「アプリケーションロジックのクラウドへの移行」「IoTデバイスから在庫を確認」などで構成している。12週間/24レッスンで学習できる。 >>公式ブログ 該当ページ(英語) マイクロソフト、初心者向けの機械学習カリキュラム無料公開 12週間で学習できるまた、米マイクロソフトは、無料のカリキュラム「Machine Learning for Beginners(初心者のための機械学習)」も公開している。カリキュラムは12週間/24レッスンで学習できる。 カリキュラムは

    マイクロソフト、初心者向けのIoTカリキュラム無料公開 12週間で学習できる | Ledge.ai
  • Kaggle Expertになるまで勉強したことを全て書く - Qiita

    はじめに こんにちは。Yuki | Kagglerです! 先日、Shopeeコンペの順位が確定して銀メダルをいただき、晴れてCompetition Expertになることができました。区切りがいいのでここまで取り組んできたことをまとめてみました。 ※ 6/28追記:Amazonのリンクが切れていたので貼り直しました! プログラミング&機械学習を始めて一年、ようやく Kaggle Expertになることができました!! 行列も正規分布も知らず、ターミナルなんて触ったこともない状態からのスタートでしたが、ようやくここまで来ました。 ここまで来れたのは偏にこれまで関わってきた皆様のお陰です。これからも頑張ります!! pic.twitter.com/kMkaFhqhU9 — ユウキ | Kaggler (@Yuki_Kaggler) May 12, 2021 この記事の対象者 Kaggleをやって

    Kaggle Expertになるまで勉強したことを全て書く - Qiita
  • 機械学習のパラメータチューニングを「これでもか!」というくらい丁寧に解説 - Qiita

    はじめに 私はこれまで機械学習のパラメータチューニングに関し、様々な書籍やサイトで学習を進めてきました。 しかしどれもテクニックの解説が主体のものが多く、 「なぜチューニングが必要なのか?」 という目的に関する記載が非常に少なかったため、体系的な理解に苦労しました。 この経験を後世に役立てられるよう、「初心者でも体系的に理解できる丁寧さ!」をモットーに記事にまとめたいと思います。 具体的には、 1. パラメータチューニングの目的 2. チューニングの手順とアルゴリズム一覧 3. Pythonでの実装手順 (SVMでの分類を例に) の手順で解説を進めます。 独自解釈も含まれるため、間違っている点等ございましたら指摘頂けると有難いです。 なお、文中のコードはこちらのGitHubにもアップロードしております。 2021/9/6追記:LightGBMのチューニング実行例追加 以下の記事に、Ligh

    機械学習のパラメータチューニングを「これでもか!」というくらい丁寧に解説 - Qiita
  • Opyrator - 機械学習向けのマイクロサービス作成ソフトウェア MOONGIFT

  • Hiroshi Takahashi

    Skip to the content. 機械学習の研究者を目指す人へ 機械学習の研究を行うためには、プログラミングや数学などの前提知識から、サーベイの方法や資料・論文の作成方法まで、幅広い知識が必要になります。レポジトリは、学生や新社会人を対象に、機械学習の研究を行うにあたって必要になる知識や、それらを学ぶための書籍やWebサイトをまとめたものです。 目次 プログラミングの準備 Pythonを勉強しよう 分かりやすいコードを書けるようになろう 数学の準備 最適化数学を学ぼう 基的なアルゴリズムとその実践 機械学習の全体像を学ぼう 基的なアルゴリズムを学ぼう 深層学習の基礎を学ぼう scikit-learnやPyTorchのチュートリアルをやってみよう サーベイの方法 国際会議論文を読もう Google Scholarを活用しよう arXivをチェックしよう スライドの作り方 論文の

  • 統計学と機械学習の違いは、データの説明かデータの予測か - プログラマの思索

  • Pythonやデータサイエンティスト入門が無料に | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    Pythonやデータサイエンティスト入門が無料に | Ledge.ai
  • 今すぐ無料でPythonやデータサイエンスを学べる学習コンテンツ7選 | Ledge.ai

    画像はUnsplashより 在宅時間が増加したであろう現在は、学生や社会人が人工知能AI)やデータサイエンスについて身につける絶好のチャンスと言える。「AIについて何か勉強したい」「統計学について知りたい」という人も少なくないのでは。 近頃、Pythonなどのプログラミングについて勉強したり、データサイエンスについて知識を深めたりできる学習コンテンツが無料で公開される機会が増えつつある。そこで、2021年1月27日現在、無料で学べるAIやデータサイエンス関連の学習コンテンツを集めてみた。 総務省、社会人のためのデータサイエンス入門を無料開講 総務省は2021年1月12日開講した「誰でも使える統計オープンデータ」に先駆け、「社会人のためのデータサイエンス入門」を特別開講している。登録料および受講料は無料。 講座では入門編として、統計学の基礎やデータの見方・データの取得方法などを学べる。統

    今すぐ無料でPythonやデータサイエンスを学べる学習コンテンツ7選 | Ledge.ai
  • ローカルで機械学習モデル(データ作成から学習・推論まで)が5分で出来てしまう、Lobeが凄すぎる | DevelopersIO

    1 はじめに CX事業部の平内(SIN)です。 Lobeは、Microsoftによって無料で公開されている機械学習ツール(アプリ)です。Windows及び、Macで利用でき、学習から推論まで全てローカルで実行するようになっています。 https://lobe.ai/ ローカルで簡単に機械学習のモデルが作成できるという事で、早速やってみました。 アヒルとトマト羊を分類するモデルが、データ作成から学習、推論まで、5分程度で出来てしまいました。動画は、作成したモデルで推論している様子です。 2 テンプレート 現在、ベータ版ということで、「イメージ分類」だけとなってますが、Object DetectionとData ClassficationがCOMING SOONとなっていました。 3 作業環境 Macにも対応しているとの事ですが、私の手元では、Windowsの方が安定して利用できたので、今回

    ローカルで機械学習モデル(データ作成から学習・推論まで)が5分で出来てしまう、Lobeが凄すぎる | DevelopersIO
  • ディープラーニング(Deep Learning)の歴史を振り返る - 渋谷駅前で働くデータサイエンティストのブログ

    先日Quora日語版でこんな回答を書いたのですが、ついでなので少し文脈情報を付け足してブログの方に再録することにしました。理由は単純で、このブログでディープラーニングの歴史についてまとめた記事を今まで書いてきたことがなく、そしてブログ記事にした方がより認識違いや調査不足などについての指摘をもらいやすいと思われたからです。ということで、以下の説明に関してツッコミがあれば是非コメント欄などにお寄せくださいm(_ _)m (A Neural Network Playground) ディープラーニングを語る上で、その前史であるパーセプトロン、そして(人工)ニューラルネットワークの話題は欠かせません。以下大まかに説明していきましょう。(※歴史解説中では敬称略、各種用語は原則カナ表記*1) パーセプトロンの登場 ミンスキーによる批判と第1の冬の時代 誤差逆伝播学習則と中間層を用いたニューラルネットワ

    ディープラーニング(Deep Learning)の歴史を振り返る - 渋谷駅前で働くデータサイエンティストのブログ
  • データサイエンティスト生活でお世話になった本|武田邦敬|Kunihiro TAKEDA

    みなさんこんにちは。くにです。 データ分析の世界に足を踏み入れてから9年が過ぎました。 分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。 ポジションは変われど、データを扱う仕事をまだ続けています。 私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびにを買い、そのでわからないことがあればまた屋に行き、自分が少しでも理解できそうなを探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。 こんな生活を続けているうちに、部屋がだらけになってしまいました。 正直に言って読み切ったという実感のあるはありません。しかし、実務で何かしらお世話になったは数多くあり、そういうは手放さずに手元に置いています。

    データサイエンティスト生活でお世話になった本|武田邦敬|Kunihiro TAKEDA