マイクロソフトリサーチの研究者らによる,データサイエンス・機械学習の基礎となる数理的な側面を解説した教科書 筆者が「今後40年間有益と思われる理論」をカバーしていると言っている通り,最近話題のトピックにとらわれない,高次元データの… https://t.co/YekKiDu60B
![えるエル on Twitter: "マイクロソフトリサーチの研究者らによる,データサイエンス・機械学習の基礎となる数理的な側面を解説した教科書 筆者が「今後40年間有益と思われる理論」をカバーしていると言っている通り,最近話題のトピックにとらわれない,高次元データの… https://t.co/YekKiDu60B"](https://cdn-ak-scissors.b.st-hatena.com/image/square/012e46b32aea8d95f0fa3baecbdbc4aafa12a2ad/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fprofile_images%2F1090990418106273792%2FBgMc28cF.jpg)
マイクロソフトリサーチの研究者らによる,データサイエンス・機械学習の基礎となる数理的な側面を解説した教科書 筆者が「今後40年間有益と思われる理論」をカバーしていると言っている通り,最近話題のトピックにとらわれない,高次元データの… https://t.co/YekKiDu60B
今、若手ビジネスパーソンは、「働くこと」に関して、どのような課題をもっているのでしょうか? 彼らの語りに耳を傾けてみましょう ・ ・ ・ 就職して、会社に実際に入ると「絶望」するんです 就職のときには、 「何でもやれるよ、希望の部署にも行けるよ」 と言われていたのに、大嘘なのです 部署間の異動は、ほとんど御法度。 本人が望んでも、受け入れ先があっても、異動はNO。 出す側の上司がNOといえば、それだけで異動できません ああ、わたしは「一生、ここなんだ」と思ってしまう わたしは「一生を、この村で終える」のでしょうか? ▼ うちの会社は、5年いれば、「いっちょあがり」です。 どんなに優秀で技術をもった若手でも、 5年間、うちの会社で仕事をすれば、 技術に、ついていけなくなります なぜか? それは、プロジェクトの多くは下請けにだして、 自分たちは、プロマネしかしていないからです。 外注するのが仕
いやこれマジで本当なの? 千田先生一人の放言とかじゃなくて? 社会学者さん達がちゃんと「この人(この大学)だけの問題」とか「社会学は査読論文以外の検証システムが構築されてる」とかツイートしてくれたら、まとめにもキチンと追加するのでマジで意見求む。 意見求めた結果いろいろな人が有益な呟きしてくれたので追記。2ページ目まで読んで欲しい所。
少し前に新卒で入社した富士通株式会社を退職した 理由は簡単に言ってしまえば自分の目指すキャリアパスとのミスマッチ。 おそらく人事部の書類にも、今頃そんな感じのことが書かれているんだと思う。 ただ、それだけで済ませてしまっては腹の虫が治まらないので、 なぜ好き好んでそんな会社に入社して、短期間で退職するはめになったのかを書こうと思う。 入社する前は大学の情報系学部に通い、大学院まで進学して専門分野の研究にそれなりに熱意をもって取り組んでいた。 それもあって、同じ分野の研究を企業として行なっている同社に入社しようと考えた。 内定の前後にいくつかの職種のマッチングを行う機会はあり、自分の希望についてはしっかりと主張したつもりだったけれど、 入社して1週間後に告げられた自分の配属先は、山奥の工場でメインフレームを主とするシステムの開発・保守を行う関連会社への出向だった。 当然この決定に対して人事に
【機械学習アドベントカレンダー2015 8日目】 ストリームデータ解析 という分野がある。ある生成元から絶えずデータが到来する環境で、いかにそれらを捌くかという話。「時間計算量はほぼ線形であって欲しいし、空間計算量も小さく抑えつつ精度を担保したいよね」ということを考える世界。個人的に最近はそのあたりの情報を追いかけていたので、整理も兼ねてその世界を俯瞰したい。 すごいリンク集 はじめに、この分野で外せないと思うリンクを3つ挙げておく。 ■ SML: Data Streams YahooやGoogleの研究所を経てCMUの教授をしているAlex Smola先生の講義の一部(スライド+動画あり)。理論からシステムアーキテクチャまで包括した実際的な機械学習ならこの人。この人の機械学習サマースクールの講義は最高だった。 古典的なものから最近のものまで、代表的なアルゴリズムについて直感的な説明といい
(図書館学系の話題でもあるからちょっと悩んだけれど、文献読解全般に関する内容だからこちらへ) 既に日々論文をバリバリ読んでいるひとには今更な記事だろうけれど、分野ごとの違いもあって興味深かったのでざっくり記録する。 論文を大量に読む際に、頭から几帳面に読んでいると時間がどれほどあっても足りないし、後から「こんなことが書いてあった論文なんだったっけ?」という問題も発生してしまう。 研究者の皆様はMendeley などの文献管理ツールをを用いていることが多いかとは思うが、それでも論文の読み方そのものに工夫をすればインプット/アウトプットの効率が圧倒的によくなるので、やってみるにこしたことはない。 その工夫とは何かというと、論文を読むときに「特定の問いに集中して読む」というものだ。学術論文は分野ごとの違いはあれ、必ず特定の流れに従って構成されている。そこで要点のみに注目して読み、他の事項を捨てる
Pythonで機械学習アプリケーションの開発環境、具体的にはNumpy/Scipy/scikit-learnを導入する手順について解説します。 なお、環境はPython3ベースを想定しています。 Minicondaベース(推奨) 機械学習系のパッケージはコンパイルが面倒なものが多いため、コンパイル済みバイナリをインストールできるconda(Miniconda)での環境構築を推奨します。 まずはPython本体(Python3想定)、パッケージ管理ツールであるpip、仮想環境を作成するvirtualenv、といった基本的な環境の構築を行います。 ※virtualenvについては今回(condaを使う場合)は不要ですが、Pythonで開発を行うなら入れておくべきパッケージなので併せて入れておきます。 Mac/Linux デフォルトのPythonと分けてインストールするため、pyenvを利用しま
東京大学出版会から出ている『基礎統計学I 統計学入門』という本がある。 東京大学教養学部統計学教室〔編〕 (1991). 『基礎統計学I 統計学入門』 東京:東京大学出版会. この本は、統計を学ぶ際によくすすめられる一冊である。例えば、ウェブ上にある記事で、『統計学入門』を挙げているものに以下のようなものがある。 2014年春版:ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊(銀座で働くData Scientistのブログ) 一年で身に付ける!Rと統計学・機械学習の4ステップ(iAnalysis ~おとうさんの解析日記~) 統計分析を学ぶための書籍20選(XICA-Labs データ・統計分析研究所) それでは、なぜこの本はすすめられるのだろうか? そして、どういう人がこの本を読むべきなのだろうか? タイトルに『統計学入門』とあるように、統計の初心者にとって良い本なのだろう
統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標本分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手
「機械学習」というワードになんとなく惹かれつつも、具体的にやりたいことがあるわけでもないので、手を動かすことなくただひたすら「いつかやる」ために解説記事やチュートリアル記事を集める日々を過ごしていたのですが、このままじゃイカン!と Machine Learning Advent Calendar 2014 - Qiita に参加登録してみました。 が、やはり何もしないまま当日を迎えてしまったので、お茶濁しではありますが、せめて「機械学習ってどんな手法やライブラリがあって、どんな応用先があるのか?」というあたりをざっくり把握して最初に何をやるのか方向付けをするためにも、たまりにたまった機械学習系の記事をいったん整理してみようと思います。 機械学習の概要 特定のライブラリや手法の話ではなく、機械学習全般に関する解説。 機械学習チュートリアル@Jubatus Casual Talks 機械学習チ
2016-12-09追記 「Pythonクローリング&スクレイピング」という本を書きました! Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型本この商品を含むブログを見る これはクローラー/スクレイピング Advent Calendar 2014の7日目の記事です。 Pythonでクローリング・スクレイピングするにあたって、いろいろなライブラリがあるので一覧でまとめてみます。 以下の4つのカテゴリにわけて紹介します。 Webページを取得する Webページからデータを抜き出す Webページの自動操作 総合的なフレームワーク なんでこれが載ってないの?この説明はおかしい!などありましたらお気軽にお知らせください。なお、この記事はいろいろなライブラリを紹介することを目
11月の19,20日に開催されたWebDB Forumに参加してきた。カンファレンスそのものは、いろんな人に久しぶりに会えたり、ネット上でなんとなく知っていても話したことなかった人と話したり、意外な人の意外な一面をみることができたりと、とても楽しむことができた。立場としては所属している会社のスポンサー枠で参加して目的もあって発表もしてきたわけだが、いくつか思うところがあるのでここにまとめておきたい。 現実にアカデミックで起きていること WebDB Forumと銘打ってはいるものの、データベースに関する研究発表は非常に少ない。OSやネットワーク、システム系の研究と併せても、機械学習やNLP、Webなどの技術に感心を持つ人は多く数で圧倒されている。体感では 90% だ。それをいえば別に VLDB や SIGMOD などのトップカンファレンスもデータベースの技術を直接扱うことは少ないし、データベ
書籍化し、12万部突破しました。 【SlideShare広告回避用】 https://www.docswell.com/s/morishige/K3MXPZ-howtodesignslides ・PDFは無料でダウンロードできます ・自己学習や勉強会などの目的でしたらご自由にお使いいただけます ・授業・研修への利用はフォーム( https://forms.gle/WwgXTT974xFW78mFA )にご報告ください ・記事への参考資料にする際は適切な出典明記をお願いいたします 【使っているフォントについて】 M+フォント「MigMix1P」です。こちらもメイリオ同様おすすめです。 フリーで使えます。 【個人HP】 > https://mocks.jp > 仕事のご依頼はこちらから 【書籍情報】 デザイン入門:https://amzn.asia/d/4WDsTI6 デザイン図鑑:https
我らが自称ゆるふわ*1ガチ勢代表@motivic_氏がこんな記事をupしてました。 ということで、こんなに簡単にDeep LearningをR上で試せるんだったらついでに僕もやってみようと思ったのでした。ただし同じirisでやるのも芸がないので*2、そこはちょっと変えてみましたよーということで。 そうそう、Deep Learningの原理については@0kayuさんのまとめがめちゃくちゃ参考になると思うので、是非是非ご参照ください。 実装ディープラーニング 今回はまだ初歩の初歩しか触りませんが、それでもチューニングのところなどにこのスライドにも出てくるような様々な原理的側面がかかわってきます。 そもそもH2Oって何だっけ 0xdata - H2O h2o/R at master · 0xdata/h2o · GitHub 元々H2Oはin-memoryプラットフォームとしてHadoop上や最
チュートリアル 画像解析入門 ~簡単なこと、困難なこと~ 国立情報学研究所 北本 朝展 http://agora.ex.nii.ac.jp/~kitamoto/ 2 自己紹介 • 東京大学生産技術研究所(工学系研究 科博士課程) 1992-1997 • 文部省学術情報センター 1997-2000 • 国立情報学研究所 2000-2006 • 大学院ではリモートセンシング画像処理 および画像データベースの枠組みと設計 に関する研究をおこなった。 • その後はメテオインフォマティクスやデジ タルアーカイブの研究へ。 3 融合研究プロジェクト • 情報研傘テーマ – 地球環境ポータル、極限環境生物データベース • 遺伝研傘テーマ – 3D画像による体脂肪計測法 • 統数研傘テーマ – オーロラ画像処理 • 極地研傘テーマ – ?? • 育成融合テーマ – シミュレーションデータの可視化 4 画像
前回からだいぶ間が空いた上に、要は{dlm}パッケージで遊ぼう!という大袈裟なタイトルの割に中身のないこのシリーズ記事ですが(笑)、取るものもとりあえずちょっと例題をやってみようと思います。参考文献はまずこちらのPetris本。 Rによるベイジアン動的線形モデル (統計ライブラリー) 作者: G.ペトリス,S.ペトローネ,P.カンパニョーリ,和合肇,萩原淳一郎出版社/メーカー: 朝倉書店発売日: 2013/05/08メディア: 単行本この商品を含むブログを見る あと、以前買ったけどまだ全部読み切ってないこちらのCommandeur*1本も。 状態空間時系列分析入門 作者: J.J.F.コマンダー,S.J.クープマン,Jacques J.F. Commandeur,Sime Jan Koopman,和合肇出版社/メーカー: シーエーピー出版発売日: 2008/09メディア: 単行本購入: 2
先日行われた第9回「データ解析のための統計モデリング入門」読書会にて、 「可視化で理解するマルコフ連鎖モンテカルロ法」というタイトルで発表させて頂きました。 発表スライドは以下です。 可視化で理解するマルコフ連鎖モンテカルロ法 from hoxo_m この発表は、みどりぼんに登場する、マルコフ連鎖モンテカルロ法(MCMC)のアルゴリズムである「メトロポリス法」と「ギブス・サンプラー」について、可視化して理解しようというお話です。 「マルコフ連鎖モンテカルロ法」というのは、字面だけ見ると難しそうですが、この発表で理解すべきポイントは、次のスライド 1枚に凝縮されています。 このことを念頭に置いて、それぞれの手法を見ていきましょう。 まず、メトロポリス法ですが、これは、 前の状態の近くの点を次の遷移先候補として選ぶ(マルコフ連鎖) そのときの確率比 r < 1 ならば確率 r で棄却する。それ
ビッグデータ時代とも言われる昨今においては、膨大なデータをビジネスの枠組みの中に組み込んで活用することが重要課題となっています。つまり、データ収集を行ってビジネスの全体像を把握し、適切なデータ分析を行って正確な予測をした上でビジネス戦略を決めることが求められています。本書は、データをビジネスに活かすために身に付けておくべき基本的な考え方と、データマイニングやモデリングの根底に存在するコンセプトについて、体系的に解説しています。データサイエンスの重要性とその威力を学べる一冊です。 訳者前書き はじめに 1章 はじめに:データ分析思考 1.1 データを使ったビジネスチャンスの広がり 1.2 例:ハリケーン・フランシス 1.3 例:顧客の乗り換えの予測 1.4 データサイエンス、エンジニアリング、そしてデータ主導による意思決定 1.5 データ処理とビッグデータ 1.6 ビッグデータ1.0からビッ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く