タグ

予測に関するp_tanのブックマーク (17)

  • 逐次ベイズフィルタ【カルマンフィルタ、粒子フィルタの基礎】 - HELLO CYBERNETICS

    はじめに 必要なパーツ 予測 観測更新 逐次ベイズフィルタの流れ 前提 流れ 予測の密度関数をどう使うのか 各パーツの式展開 予測の密度関数 更新の密度関数 まとめ はじめに 逐次ベイズフィルタの基的な概要は極めて単純です。しかし非常に強力です。 制御の分野では遥か昔から状態観測器としてカルマンフィルタとして知られる逐次ベイズフィルタが有効活用されてきました。また、数理モデルによる演繹的なシミュレーションと、観測データによる機能的な推測を統合したデータ同化と呼ばれる分野でも、主にパーティクルフィルタが強力なツールとして利用されています。また自己位置推定、SLAMなど近年の自律移動ロボット技術に欠かせない物となっています。 必要なパーツ 逐次ベイズフィルタに必要なパーツは下記の通り、たったの2つです。これらを紹介する前に記法について整理しておきましょう。 時刻 $t$ での状態を $x _

    逐次ベイズフィルタ【カルマンフィルタ、粒子フィルタの基礎】 - HELLO CYBERNETICS
  • 予測の不確かさを扱える新しい勾配ブースティング「NGBoost」

    3つの要点 ✔️ 予測の不確かさを扱える勾配ブースティングの新手法「NGBoost」の提案 ✔️多変数の予測をするときに問題となる勾配の歪みを自然勾配で補正する ✔️任意の弱学習器・確率分布・スコア関数で使える NGBoost: Natural Gradient Boosting for Probabilistic Prediction written by Tony Duan, Anand Avati, Daisy Yi Ding, Khanh K. Thai, Sanjay Basu, Andrew Y. Ng, Alejandro Schuler (Submitted on 8 Oct 2019 (v1), last revised 9 Jun 2020 (this version, v4)) Comments: Published by ICML 2020. Project Pag

    予測の不確かさを扱える新しい勾配ブースティング「NGBoost」
  • 機械学習で入ってはいけないデータが混入する「リーケージ」とその対策

    機械学習で入ってはいけないデータが混入する「リーケージ」とその対策:もう失敗しない!製造業向け機械学習Tips(1)(1/2 ページ) 製造業が機械学習で間違いやすいポイントと、その回避の仕方、データ解釈の方法のコツなどについて、広く知見を共有することを目指す連載。第1回では「リーケージ」について取り上げる。 ⇒連載「もう失敗しない!製造業向け機械学習Tips」バックナンバー 筆者はデータサイエンティストとして、機械学習自動化プラットフォーム「DataRobot」の導入サポートをさまざまな製造業のクライアントに提供してきました。連載では、その経験に基づいてお話させていただきます。 機械学習が使われる製造業特有の分野は、物性予測、工程管理、予防保全、故障予測、要因分析など多岐にわたります。しかし筆者は、それらの多くで同様のミスが繰り返されていることに気が付きました。これらの間違うポイント

    機械学習で入ってはいけないデータが混入する「リーケージ」とその対策
  • 化合物でもDeep Learningがしたい! - kivantium活動日記

    この記事は2017年12月15日に https://kivantium.net/deep-for-chem/ に投稿したものです。 情報が古くなっていますが、まだ参照されているようなので再掲します。 この記事はDeep Learningやっていき Advent Calendar 2017の15日目です。 Deep Learningの威力が有名になったのは画像認識コンテストでの圧勝がきっかけでしたが、今ではDeep Learningはあらゆる分野に応用され始めています。NIPS2017でもMachine Learning for Molecules and Materialsが開催されたように、物質化学における機械学習の存在感が高まりつつあります。この記事ではその一例として化学の研究にDeep Learningが使われている例を紹介していきます。 化学物質の研究に機械学習が使われる主なパター

    化合物でもDeep Learningがしたい! - kivantium活動日記
  • Gpy vs scikit-learn: pythonでガウス過程回帰 - nykergoto’s blog

    Gpy と Scikit-learn Python でガウス過程を行うモジュールには大きく分けて2つが存在します。 一つは Gpy (Gaussian Process の専門ライブラリ) で、もう一つは Scikit-learn 内部の Gaussian Process です。 GPy: GitHub - SheffieldML/GPy: Gaussian processes framework in python Scikit-Learn 1.7. Gaussian Processes — scikit-learn 0.24.1 documentation この2つのモジュールでどのような違いがあるのかを以下の項目で比較していきます。 カーネルの種類, 可視化 どんな種類のカーネルがあるのか 可視化は容易か 予測モデルの作成 モデルの作成はどのように行うのか モデルの訓練方法, 結果の可

    Gpy vs scikit-learn: pythonでガウス過程回帰 - nykergoto’s blog
  • AlphaGoの衝撃再び — タンパク質構造予測でAlphaFoldが今までのモデルに圧勝|Zhubo.JP

    原文記事: [阿尔法狗再下一城 | 蛋白结构预测AlphaFold大胜传统人类模型] (2018/12/03公開) 「研究したいタンパク質があるのだが、その構造と機能がわからない」 — これは分子細胞生物学の研究者が日々直面する最大の難題の一つである*a。アミノ酸配列測定技術が発展する中で、多くのタンパク質の配列がハイスループット*1に解析されているが、この配列決定の段階から実際に3次元構造を決定するまでの間には、未だに大きな距離がある。 生物の基単位が細胞だとして、細胞の基的な機能単位こそが、複雑多岐なタンパク質の1つ1つである。そしてまさにタンパク質の機能の質を決定しているのが、タンパク質の構造である。タンパク質の機能を研究したり、それをターゲットとする薬剤を開発したいというとき、タンパク質の構造はとても重要な要素の一つになる。だからこそ、生物学には、構造生物学という学問領域まで

    AlphaGoの衝撃再び — タンパク質構造予測でAlphaFoldが今までのモデルに圧勝|Zhubo.JP
  • ナメクジの出現を予測する!- 市民科学と最新統計の融合

    外来種問題は突然に 2014年7月某日、札幌市の円山原始林で私が出会ったのは、体長15cmもの巨大な豹柄のナメクジ、マダラコウラナメクジでした。私はそれを知っていました。過去に一度だけ、ドイツ・ドレスデンの森の中で見たことがあったからです。北欧原産のナメクジがどうしてここに? 慣れ親しんだ円山の森に現れた、不似合いな新参者との突然の出会いに、目眩がしました。私の知る北海道の生態系は、これからいったいどうなってしまうのか? 我々ヒトの生活への影響は? 体長15 cmほどのマダラコウラナメクジ 市民のブログが教えてくれた 予期せぬ出会いに衝撃を受けた私は、研究室に戻るや否や、飛びつくように現状を調べ始めました。わかったことは、マダラコウラナメクジが2006年に茨城県で最初に侵入・定着が確認されたということ、さらに2010年には福島県、2012年には長野県にも侵入し勢力を拡大しているということで

    ナメクジの出現を予測する!- 市民科学と最新統計の融合
  • このままでいいの?“出せない”天気予報|NHK NEWS WEB

    周辺だけが網掛けになっている地図。そして「NO FORECAST(予報なし)」の文字。実はこれ、日の研究機関が発表している雨の予測です。何か機密が隠されているのか?それともハッカーによるものか?取材を進めると、気象の予報技術が急速に進む一方で、昔からの規制が残っているため、その成果が一般に共有されにくいという皮肉な現実が見えてきました。(社会部記者・災害担当 島川英介) さきほどの画面は、理化学研究所計算科学研究センターの研究グループが運営する「理研天気予報研究」のホームページです。 現在、「世界の降水予報」と「関西の降水予報」の2つが一般に公開されています。 このうち「世界の降水予報」は、複数の人工衛星のデータから、世界全体で降っている雨の強さを確認。そのデータをもとに12時間先までの世界の雨雲の動きを予測します。 一方、「関西の降水予報」は、予測が困難で、突如激しく降り始める局地

    このままでいいの?“出せない”天気予報|NHK NEWS WEB
    p_tan
    p_tan 2018/06/07
    TOCの方針制約よなぁ。ただ、この方針が有効だった時代はあった訳で、いかに方針を現状にフィットさせていくかが重要なんだろう。
  • AI:誤って「回転」と錯視…人間同様に 立命大など発見 | 毎日新聞

    静止画なのに回っているように見える「錯視」について、深層学習(ディープラーニング)で自ら学習する人工知能(AI)も、人間と同様に「回っている」と誤って判断し、錯視が起きていることを、基礎生物学研究所(愛知県岡崎市)と立命館大学(京都市)などの共同研究グループが発見し、国際学術誌で発表した。 AIの深層学習は、世界のトップ棋士を次々と破った「アルファ碁」で注目を集めた新技術。画像など膨大なデータを読み込み、判…

    AI:誤って「回転」と錯視…人間同様に 立命大など発見 | 毎日新聞
    p_tan
    p_tan 2018/03/23
    なるほど、錯視画像は、いかにも回転「しそうな」画像ってことなのか。人間は予測でものを見てるって事なんすね。
  • KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog

    週末KagglerとしてavazuのCTR予測コンペに参加しました。Kaggleは機械学習版のISUCONだと思ってもらえばよいです。コンペ自体は終わっているので、late submiteであまり意味はないかもしれません、練習です。leaderboard上で上位10%以内に行けたので、そこまでの試行錯誤をメモしておきます。謎ノウハウ(?)を持っているガチ勢じゃないと上位に行けないものかと思っていましたが、基に忠実にやればこれくらいの順位(上位7.6%)に行けましたし、他の人の工夫を垣間見えるという意味でも現場の機械学習やり始めたエンジニアにお薦めできそうでした。 参加の動機 目標感: 頑張りすぎずに上位10%以内に入る 試行錯誤 AthenaとRedashによる探索的データ解析 ベンチマークをまず超える 線形分類器でシンプルな特徴量 時系列要素を忘れていて過学習発生 特徴量エンジニアリン

    KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog
  • 機械学習で予測モデルを作る際の概要のオレオレまとめ - HELLO CYBERNETICS

    はじめに 機械学習のモデル 教師あり学習 機械学習における予測モデルの基的な作り方 予測モデルfの考え方 $\phi(x)$の決め方 特徴量エンジニアリング モデル選択 ニューラルネットワーク 複数の予測モデルの活用 アンサンブル ベイズ予測分布 はじめに 機械学習のモデルには数多くのものが存在します。 例えばサポートベクターマシンやニューラルネットワーク、ロジスティック回帰モデルなど、初学者にとってどれが何のために生み出され、 そしてどのような時に有効なのかを把握することは難しいように思います。 そこで今回はある特定のモデルについて細かく見るのではなく、機械学習のモデルが何を表し何を達成しようとしているのかの概観を与え、 それぞれのモデルがどういう時に使えそうなのかの感覚を身につける手がかりのようなものを書いてみたいと思います。 (最初、一般化線形モデルからベイズまでそれなりにしっかり

    機械学習で予測モデルを作る際の概要のオレオレまとめ - HELLO CYBERNETICS
    p_tan
    p_tan 2018/03/07
    予測モデルに対する、とてもわかり易い説明。多分すでに研究されてると思うけど、アンサンブルの重み分布p(w)自体もxに依存するようにp(w|x)にしたら、xに応じて適切なモデルを選択するようになるんだろうな。
  • Private Presentation

    Private content!This content has been marked as private by the uploader.

    Private Presentation
  • 情報系の人が株をやってみたくなった時にまず読むべき10冊 - ペリャウドの日

    情報系の学生さんなどが株をやってみたくなるというのはTLを見ていてもよくあることだと思います。 しかし、情報系の方が予備知識なく株や為替の取引に手を出そうとすると、ついつい時系列データをニューラルネットワークにぶちこんで予測をはじめたりなど、気がつけばコンピュータ占星術の世界に突入してしまうことが多いようです。 教授が、「株をやりたいんだったらまず10冊を読んでください。読み終わったら好きにやってもいいです。」と言っていましたが当にそのとおりです。それに、プログラマなんだから、車輪の再発明は避けたいです。 そこで今日は皆さんが占星術の誘惑を跳ね除け、株投資をはじめるまでに読むべき10冊をピックアップしました。 ウォール街のランダム・ウォーカー ウォール街のランダム・ウォーカー <原著第10版>―株式投資の不滅の真理 作者: バートン・マルキール,井手正介出版社/メーカー: 日経済新聞

    情報系の人が株をやってみたくなった時にまず読むべき10冊 - ペリャウドの日
  • random forestを予測以外の目的で使う - 琥珀色呑んだくれ備忘録

    数年ほど前には最強と言われて一世を風靡していたrandom forestだが、予測以外にも使い道が提案されている。Rのパッケージから紹介したい。 予測全体の把握と仮説ルールの抽出 決定木分析が便利な理由の一つは「どういうルールでその予測が成り立っているのか」を極めて簡単に可視化出来る点。inTreesパッケージは予測ルールを集計し、適当に枝狩りして全体を要約することで、アンサンブルモデルにおいても決定木と同じような情報を可視化してくれる。 Interpreting Tree Ensembles with inTrees from Satoshi Kato www.slideshare.net このパッケージではもう一つ、すべての木から取り出した1つずつの枝をトランザクションとみなしてアソシエーション分析する機能を提供する。メジャーな関連ルールを取り出す方に力点が置かれているが、変数同士の稀

    random forestを予測以外の目的で使う - 琥珀色呑んだくれ備忘録
  • 為替と株の予測の話

    3. もくじ • はじめに • 為替や株の予測の何が難しいのか • 2つの通貨問題からみるレバレッジと期待値の関係 • 収益率の分散を抑えるには • いもすアルゴリズムの変遷 • ボラティリティのフラクタル性 • 最新いもすアルゴリズム 為替と株の予測の話 2 5. なぜ投資を考えるのか 生活費ために働いてお金を稼ぐのは不自由であるので、 経済的独立 (Financial independence) を目指すのは自然な発想。 経済的独立とは 「運用益>消費」となる状態を指し、 これを達成するには「資産を増やす」「運用効率を上げる」「消費を 減らす」方法がある。 しかし、運用効率が0%では経済的独立を達成するのに必要な資産 が何倍にもなるので、運用効率を上げる方法を考える。 為替と株の予測の話 4

    為替と株の予測の話
  • Engadget | Technology News & Reviews

    Nintendo Switch 2: Everything we know about the coming release

    Engadget | Technology News & Reviews
    p_tan
    p_tan 2016/11/30
    短い動画からの未来予測ならもっと精度上がりそう
  • 機械学習を用いた予測モデル構築・評価

    質的変数(順序尺度)に有用なポリコリック相関係数を紹介しています。 また、ポリコリック相関係数を使った因子分析の方法も説明しています。

    機械学習を用いた予測モデル構築・評価
  • 1