Recent Advances on Transfer Learning and Related Topics Ver.2

【プログラミング】初心者がPythonでウェブスクレイピングをするためのURL資料まとめ JavaScriptにPHPに覚えることが山ほどあるにもかかわらず、Pythonにも興味が湧いてきた…。どうやら、ウェブの情報をスクレイピング(自動収集)できる。これだけでもかなり魅力的だ。さらにAI化することもできるらしい…。 ということで2018年からPython生活もスタートするためにも資料URLを集めてみたよ…。 ❏Python(パイソン)は、汎用のプログラミング言語である。コードがシンプルで扱いやすく設計されており、C言語などに比べて、さまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴がある ❏Pythonは、オランダ人のグイド・ヴァンロッサムが開発した。名前の由来は、イギリスのテレビ局 BBC が製作したコメディ番組『空飛ぶモンティ・パイソン』である。Pythonとい
なぜ機械学習なのか 私たちは、多くのデータに囲まれて生活しています。日々の通勤のなかでも、駅の自動改札機を通り、コンビニで買い物をし、スマートフォンでニュースを読む——これらすべての作業のなかでデータが作られていきます。さらに今後はさまざまなモノがインターネットにつながることにより、膨大かつ複雑なデータがこれまで以上に蓄積されるため、より効率的にデータを捌き、分析や判断を行うことが重要となります。 その手段として注目されているのが人工知能(AI)であり、人工知能(AI)を実現する手法のが機械学習やディープラーニングなのです。膨大なデータで溢れる世の中を賢く生きるために、機械学習を理解することの重要性は増していくでしょう。そこで本連載では、プログラミング言語Pythonを用いて実際に手を動かしながら機械学習に触れ、機械学習でどんなことができるのかを紹介していきます。専門性を問わず機械学習の世
はじめに この記事は、すでにPythonやRubyといったプログラミング言語に触れたことはあるが、Webアプリケーションは作ったことがない、もしくはDjangoには触れたことがないといった方を対象にしています。 Webアプリケーションと調べると、PHPやRubyがよく出てくるのですが、機械学習など複雑な数学的演算を行う場合にはやはりPythonが優れていると感じます。 以前、Ruby on Railsでアプリケーションを作成し、数学的な計算の部分はR言語で組み込むといったことをしたことがありますが、言語間を繋ぐパイプを構築するにも一手間必要でした。 そういった点で、色々な数学的なトリックを含ませたWebアプリケーションを作成する際にはPythonをオススメします。 ただ、PHPやRubyのWebアプリケーションと比較すると、PythonのWebアプリケーションは参考文献が不足しているように
データ分析ガチ勉強アドベントカレンダー 24日目。 当サイトでも、Pythonを使ったデータ分析や機械学習について、勉強しながらそれをアウトプットとして出すと言うかたちで、何個も記事を書いてきました。 記事数で言えば50とかそのくらいあるような気がします。 カレンダーも完成しつつあるので、個々では当サイトの総まとめとして、機械学習やデータ分析に触れたいという人がゼロから始めて触れられるように、記事をまとめていきたいと思います。 何か面白いことを勉強したい学生、就職までの勉強に、急に機械学習を使わなければならない社会人方々は、読んで見てください。 0. 環境構築 0.1. Pythonの導入 (Anaconda) 0.2. エディタ (Pycharm/VSCode) 0.3. バージョン管理 (Git) 1. Pythonの使い方(基本ライブラリ) 1.1. 数値計算 : numpy 1.2
【2021/1/11】2021年版を公開しました 【2020/1/9】2020年版もあります, こちらもよろしくおねがいします! 【2019/8/12】一部書籍のリンクを最新版に更新しました 【2018/12/24追記】最新版を公開しました!「Python本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで - Lean Baseball」 機械学習にWebアプリ,そしてFintechと,今年(2017年)は昨年(2016年)以上にPython界隈が賑やかな一年でした. Pythonでお仕事と野球データ分析を生業としている@shinyorke(野球の人)ですこんにちは. このエントリーでは,そんなPythonの学び方・本が充実した今年から来年(2018年)に移るにあたり, 最短距離でPythonレベルを上げるための学び方・読むべき本の選び方〜2018 をまとめてみました.
初めに 最近、「機械学習に強い」、「簡単」などの理由からPythonを選ぶ人が多いと思います。 そんな人たちがWebを書こうと思った時にぶつかるのがDjangoの壁ですよね。 (あれ、そんなことない?いやいや難しいですよね!) 僕は最初、Django Tutorialだけ日本語でやって、それ以降は全部英語の文献を読んだり、会社のコードをみて勉強をしたりしましたが、結構大変でした。 webを書きたいけど、Pythonより◯ubyの方が書きやすいから◯ubyの方がいい...となってしまわないように、これまで僕が勉強したDjangoの基本や応用を詰め込んで、Djangoを最速でマスターできるような記事を書いていきます!(3, 4記事の長さになる予定です) * 最速でDjangoをマスターする part2 準備 Djangoが入っていない場合は、 でインストールできるらしいです。 僕はAnacon
はじめに¶ 先日、Kaggleのタイタニック問題に挑んで惨憺たる結果を出しました。 Kaggle のタイタニック問題に Keras で挑戦した。前処理が課題だと分かった。 | Futurismo データ分析をするスキルが自分にはない。なんとか身につけたいと思っていたところ、 Udemyの講座でKaggleのタイタニック問題を元にデータ分析を行っている講座を発見した。 【世界で5万人が受講】実践 Python データサイエンス | Udemy これはいい。まずは、講義にしたがってデータ分析してみたので、これはその講義メモです。 目的¶ 以下について、講義では調べている。 タイタニック号の乗客はどのような人達だったのか? それぞれの乗客はどのデッキにいたか?また、それは客室の種類とどのような関係にあったか? 乗客は主にどこから来たのか? 家族連れか、単身者か?
とりあえず試してみる binder (mybinder.org) の設定を用意しておきました。上のlaunch binderボタンからlgoを試すことができます。使い捨てのコンテナ上でJupyter Notebookが起動し利用可能になります。コードは実行せずノートの例を眺めるだけであれば、こちらからnbviewerで例を開いてみてください。 はじめに 僕は元々ちょっとしたツールや趣味のプログラミングには常にPythonを使うPythonのファンでした。しかし最近は将来のメンテナビリティなどを考えるとそういう用途にも型のあるGoの方がいいなと思うことが多くなり、趣味や小規模プロジェクトで言語を選べるときはGoをメインで使うようになりました。 一方で、近年データサイエンスや機械学習などの分野の盛り上がりと共に、Pythonに再び追い風が吹いているように思います。特にJupyter Noteb
O’Reilly Japan - Pythonではじめる機械学習 を読んだ。 Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎: Andreas C. Muller https://amzn.to/3d4gJ16 動機# ニューラルネットを学ぶ、その前に# 今まで、機械学習を通り越してディープラーニングの勉強をしてきた。 つまり基礎をすっ飛ばして、応用にいってしまったのだ。 自分の手法はただひとつ、ニューラルネットワークのみ!! これでは、機械学習を勉強しているといえるのだろうか? 自分のなかで、疑問が湧き上がった。 本に付いている帯が印象的だった。 ニューラルネットワークを学ぶ、その前に! とのことだ。 これだ!ニューラルネットを学んで、 その後に行ってしまった自分にとってはこの帯はまさに心のうちをいい得ているものだった。 機械学習コ
この記事は移転しました。約2秒後に新記事へ移動します。移動しない場合はココをクリックしてください。 こんなことをしてみたい ↑これがしたい pythonによる機械学習の勉強をしたので、実践ということで、人気アイドル「乃木坂46」の個人的に好きな5人のメンバーを区別して見ました。大きな流れはこんな感じです。 web上から五人の画像を100枚ずつ取ってくる 画像から顔部分を取り出して保存、テストデータの取り出し 画像の水増し モデルを定義して、学習 テスト(顔を四角く囲って、その人の名前を出力) 説明はこんなもんにして、彼女らの可愛さについて語りたいところですが、そういうブログではないので、少し技術的なことを書きます。 今回はjupyterを使って作業を進めました。notebook形式なので結果が見やすく初心者にはいい環境でした。環境は以下。 macOS:10.13.1 python:3.6.
データ分析ガチ勉強アドベントカレンダー 14日目。 時系列データでまず思いつくのは、株価のチャートですよね。 また、最近はやっている仮想通貨。私も最近coincheckに入金しました。 ビットコイン取引所 "coincheck" やっぱ、実際にお金が絡むとちゃんと勉強しようって言う気になる!笑 せっかくチャートを見るわけだし、その見方について勉強しておこうと思いました。 そしてせっかくなので、自分で実装してどういう仕組みなのかまで知っておこうと思いました。 理系だからね、分からないものを使うのは嫌だからね。 というわけで、Python(主にPandasとMatplotlibを用いながら)でテクニカル指標についてやっていきます。扱うデータは三年分の日経平均株価。 指標について知りたい人も、自分で実装してみたいという人もどうぞ。 テクニカル分析とファンダメンタル分析 実装において ローソク足
今回は機械学習アルゴリズムの一つである決定木を scikit-learn で試してみることにする。 決定木は、その名の通り木構造のモデルとなっていて、分類問題ないし回帰問題を解くのに使える。 また、決定木自体はランダムフォレストのような、より高度なアルゴリズムのベースとなっている。 使うときの API は scikit-learn が抽象化しているので、まずは軽く触ってみるところから始めよう。 決定木がどんな構造を持ったモデルなのかは最後にグラフで示す。 また、決定木自体は回帰問題にも使えるけど、今回は分類問題だけにフォーカスしている。 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.4 BuildVersion: 16E195 $ python --version Python 3.5.3 下準備 まずは
前回まで、決定木・ランダムフォレストの理論について勉強しました。 www.randpy.tokyo www.randpy.tokyo 今回はPythonで実際に動かしていきたいと思います。扱うのは、タイタニック号の生存者データです。性別や年齢など、どんな要素が生存率に影響を与えていたのか、分析してみます。 なお、Pythonによる決定木・ランダムフォレスト のコード例は、以下の書籍にも記載されてますので、参考にしてみてください。 Pythonと実データで遊んで学ぶ データ分析講座 作者: 梅津雄一,中野貴広出版社/メーカー: シーアンドアール研究所発売日: 2019/08/10メディア: 単行本(ソフトカバー)この商品を含むブログを見る これは、kaggleという世界的なデータ分析コンペティションで提供されているサンプルデータですので、ご存知の方も多く少し面白みには欠けますが、決定木とラン
はじめに 12月といえばadvent calendar、そして忘年会。 忘年会に参加する人が色んな場所に散らばってると 場所を決めるのが結構苦労しますよね 参加する人の職場(最寄り駅)の座標から重心取って そこらへんを開催場所にすれば公平になるな、 わかりやすく地図にプロットして可視化したいな、と思い 実際にやってみた、という内容です。 googleマップでできるかな?と思いましたが、 各駅調べて座標取って計算する、とかが大変そうでした。 (もしかしたらうまいやり方があるのかもしれません。。。) 簡単に地図に座標プロットして、計算もできるものないかなと色々調べた結果 foliumを活用しました。 folium foliumはleaflet.jsというマップライブラリを使い、 簡単にデータを可視化できるpythonライブラリです。 インストールはconda(もしくはpip)にて簡単に行えます
このサイトについて このサイトでは、データ加工や集計、統計分析などインタラクティブに実行されるスクリプトやバッチプログラム、本格的な Web アプリケーションの実装まで、多彩な機能を持ちながらも初心者にも扱いやすいプログラミング言語 Python (パイソン) を使ったデータの統計分析の手順や使い方について紹介します。 初めてプログラムに触れる人や、R や SAS, Ruby のような言語のプログラミング経験はあっても、Python をあまり扱った経験のない初心者向けに理解できるような内容としてまとめています。 また、本格的な統計分析(基本統計量や多変量解析、データマイニング、機械学習)を学んだことがない人でも理解できるよう、統計(アナリティクス)の解説も必要に応じて述べています。 このサイトで提供できる情報を通して、皆さんが Python を使ったビッグデータ解析を思いのままに使いこなせ
ブロックチェ-ンの仕組みを知るには構築するのが最短の方法 この記事を読んでいるということは、仮想通貨の拡大に興奮しているということですね。ブロックチェ-ンの仕組み、背後にある基本的なテクノロジーについて知りたいのでしょう。 しかしブロックチェ-ンを理解するのは簡単ではありません。少なくとも私にはそうでした。大量の動画の中をさまよい、抜けだらけのチュートリアルに従い、結局、実例が少なすぎてフラストレーションが大きくなりました。 私は手を動かして学ぶのが好きです。コードのレベルで内容を扱わざるを得なくなり、そうすることで身に付くからです。同じようにやってもらえば、この解説が終わる頃には、機能するブロックチェーンが出来上がり、どのように動くかがしっかりと把握できるようになるでしょう。 準備 ブロックチェ-ンとはブロックという名の 不変でシーケンシャルな 一連のレコードだということを覚えてください
データ分析言語としてデータサイエンスの世界での存在を日々増している(と言われる)Python。 Pythonでのデータ分析、特にPandasの使い方についてまとめてみました。 ・Rユーザーの方がPythonを使いたい場合には特に有用だと思います。 ・基本的なデータハンドリングの方法に主眼をおいています。 RユーザーがPandas,Numpyを使う場合の早見表 【Slide Share】Python for R uses Rで使う記法をPythonで再現するにはどうしたらいいかの 比較早見表が列記されており、RでやっていたことをPythonでやろうと 思ったらかなり有用だと思います。 http://www.slideshare.net/ajayohri/python-for-r-users 【Pandas Official】Pandas -comparison with R 上記と同様、Rで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く