「Python」と「Google Colaboratory」で株価データ分析に挑戦:「Python」×「株価データ」で学ぶデータ分析のいろは(1) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。第1回はPythonを実行する環境とデータの前準備について。 はじめに 連載第1回は「Google Colaboratory」でサンプルプログラムを実行するための環境を用意する方法や利用するPythonのライブラリを説明します。「Google Chrome」と「Googleアカウント」を用意して読み進めてください。 なお、連載の趣旨がデータ分析であるため、Pythonの言語仕様や文法の詳細を割愛する場合があることをご了承ください。 Google Colaboratoryの準備 Google Colaboratoryとは、Googleが提供するブラウザ上でPy
前回はカーソル位置の型名を取得する方法について書きました。 今回は詳細な型名を取得する方法について書きます。 さて、前回使用した方法では例えば以下のように typedef されている場合、typedef した型名を取得します。 typedef int hoge; hoge h; // h は hoge 型として取得する 今回は typedef した型名ではなくて typedef された型名を取得する方法についてのコードを書きます。 [ソース] # -*- coding: utf-8 -* import clang.cindex from clang.cindex import Cursor from clang.cindex import Config from clang.cindex import _CXString from clang.cindex import Type # Cl
中学・高校数学で学ぶ、数学×Pythonプログラミングの第一歩:数学×Pythonプログラミング入門 「Pythonの文法は分かったけど、自分では数学や数式をプログラミングコードに起こせない」という人に向けて、中学や高校で学んだ数学を題材に「数学的な考え方×Pythonプログラミング」を習得するための新連載がスタート。連載コンセプトから、前提知識、目標、本格的に始めるための準備までを説明する。 連載目次 この連載では、中学や高校で学んだ数学を題材にして、Pythonによるプログラミングを学びます。といっても、数学の教科書に載っている定理や公式だけに限らず、興味深い数式の例やAI/機械学習の基本となる例を取り上げながら、数学的な考え方を背景としてプログラミングを学ぶお話にしていこうと思います。 今回は、それに先だって、プログラミングを学ぶ上で数学を使うことのメリットや、Pythonでどのよう
最近、とある興味 *1 から量子力学(とりわけ量子化学)の勉強をしています。 水素原子の電子の軌道を計算すると、s軌道とかp軌道とかd軌道とかの計算が載っていて、対応する図が教科書に載っていたりしますよね。 こういうやつです: Wikipedia「球面調和関数」より引用 Attribution: I, Sarxos 個人的な体験ですが、予備校の頃は先生の影響で「化学」に大ハマりしていました *2。 ここから「Emanの物理学」というサイトの影響で「物理」に目覚め、そこからなぜか「数学」に目覚めて現在に至ります。そういった経緯もあって、化学には大変思い入れがあります。 特にこの水素原子の軌道の図は当時から気になっていて、自分で描いてみたいと思っていました。先日ようやく理解でき、実際に自分で描画できるまでになりました。以下がその画像です: これはタイトルにもある「球面調和関数」と呼ばれる関数を
Windowsユーザーの皆さん、手軽にLinux環境で開発したいですよね!そんなときWSL2やコンテナが選択肢に上がるでしょう。VSCodeのRemote Development機能を使い、どちらも試してみました。Windows・WSL・コンテナを使い分けつつ、VSCodeで快適に開発ができるようになります! おおまかな流れ 【準備編】WSL2の有効化と拡張機能のインストール 【WSL編】VSCodeからWSL2にリモート接続する 【コンテナ編】Dockerのインストール 【コンテナ編】VSCodeからDockerコンテナにリモート接続する 【コンテナ編】コンテナでWebサーバーを立て、ブラウザからアクセスする ※ 筆者の環境は Windows10 Home 21H1 です。Windows10 Pro/Enterpriseとは手順が異なるかもしれません。
さまざまなデータを地理空間情報として重畳する上で有用なPythonのライブラリであるGeoPandas。前編ではGeoPandasを用いたデータの描画方法など基礎的な扱い方を紹介し、後編では衛星データと組み合わせて解析結果を可視化する方法を紹介します。 Pythonで地理空間情報を行う場合、GeoPandasの使い方を覚えておくととても便利です。 例えば、都道府県別の気象データを持っていたとします。そのテーブルデータ(csv)には地理情報と言えば、都道府県の名称くらいしかありません。このような場合、これを日本地図の上に重畳して可視化することはできません。 しかし、このデータに地図上に描画できる情報を与えることさえできれば、好きなデータを地図の上に重ねることができます。このようなことをしたい場合に、GeoPandasの使い方を知っておけば助けになります。 今回は、簡単な例を通じて、GeoPa
地理空間情報を扱う上で知っておきたいPythonライブラリ、GeoPandas入門~応用編・衛星データと組み合わせ~ 地理空間情報を解析する上で有用なPythonライブラリGeoPandas。後編では、衛星データとシェープファイルを組み合わせて解析することで、テーブルデータを作成することにチャレンジします。筆ポリゴンを任意の大きさのベクターデータで切り取り、切り取ったデータを用いて、衛星データをその範囲で取得し、NDVIの推移を求めます。 前編ではシェープファイルのような地図に重ねることのできる幾何的な情報を含んだデータと、単なるテーブルデータ(ただし、そのシェープファイルと同様のデータを含む場合。例えば都道府県の名称)を重ねて、作成したデータを描画するということを学びました。 後編となる本記事では、シェープファイルと同様に幾何的なデータを含みつつ、ラスターデータとして扱われているもの(代
東大の2024年版が公開されています。本稿は、2021年5月26日に公開した記事を「2024年11月14日の最新情報」に合わせて改訂したものです。『初心者向けTellus学習コース』はリンク切れのため削除しました。 プログラミング言語Pythonを習得したい場合、まずは教科書型のコンテンツなどで一通りの基礎知識を学ぶ必要があるだろう。そういった目的に合うコンテンツは、書籍を含めてさまざまなものがある。本稿ではその中でも、東京大学もしくは京都大学の授業で使われており信頼性が高い電子書籍、しかも無料で入手可能なものを紹介する。 東大/京大の「Python教科書」電子書籍 東京大学『Pythonプログラミング入門』
Jupyter Notebookでmatplotlibを使用する場合には、インポートする前に %matplotlib inline と記述しますよね?では… なぜinlineと入力しているのでしょうか? 入力し忘れても動くことがあるのはなぜでしょうか? %matplotlib notebookというコマンドもあるのをご存じでしょうか? この記事では、matplotlib inlineの謎について解説していきたいと思います! Jupyte Notebookのmatplotlibの読み込み|%matplotlib inline %matplotlib inlineを指定したときの挙動 グラフがアウトプット行に出力される plt.show()を省略してもグラフが出力される plt.show()でアウトプット行に2つのグラフ表示 %matplotlib inlineの意味はバックエンドの指定 バッ
指針 厳密解法に対しては、解ける問題例の規模の指針を与える。数理最適化ソルバーを使う場合には、Gurobi かmypulpを用い、それぞれの限界を調べる。動的最適化の場合には、メモリの限界について調べる。 近似解法に対しては、近似誤差の指針を与える。 複数の定式化を示し、どの定式化が実務的に良いかの指針を示す。 出来るだけベンチマーク問題例を用いる。OR-Libraryなどから問題例をダウンロードし、ディレクトリごとに保管しておく。 解説ビデオもYoutubeで公開する. 主要な問題に対してはアプリを作ってデモをする. 以下,デモビデオ: 注意 基本的には,コードも公開するが, github自体はプライベート そのうち本にするかもしれない(予約はしているが, 保証はない). プロジェクトに参加したい人は,以下の技量が必要(github, nbdev, poetry, gurobi); ペー
自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。 主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。 環境はPython3系、Google Colaboratory(Ubuntu)で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。 機械学習、ディープラーニングは出てきません!テキストデータの前処理が中心です。 前処理系 大文字小文字 日本語のテキストにも英語が出てくることはあるので。 s = "Youmou" print(s.upper()) # YOUMOU print(s.lower()) # youmou 全角半角 日本語だとこちらのほうが大事。 全角半角変換のライブラリはいくつかありますが、自分はjaconv派。 MIT Licenseで利用可能です。 import jaco
概要 OCRを使った文字読み取りの開発をしていると、読み取られたテキストと画像と見比べて結果の確認をすることがよくあります。読み取られたこの文字は画像のどこから出てきたのかとか、単語の区切りが不自然なときになぜそうなったのかとかといった確認の際には、テキストとその座標から画像中の該当箇所を見つける必要があり、人間が目視で行うにはなかなか大変な作業です。物体認識などのタスクでは、画像上に四角形のバウンディングボックスを物体名のラベルとともに描写して可視化していますが、OCRの読み取りの場合は文字が画像上で密に配置されていたりと、画像上に直接描写するには情報量が過多になってしまいます。なるべくインタラクティブに操作出来る形で情報を表示し、必要な部分だけを確認できるようにしたい場合が多いです。 この記事では、OCR読み取りの結果を画像上に描写して、インタラクティブに結果を確認する方法を紹介します
「spaCy 3.0.0」では、新機能としてマルチタスク学習をサポートするトランスフォーマーベースのパイプラインや、18以上の言語用に再トレーニングされたモデルファミリーと5つのトランスフォーマーベースパイプラインを含む計58のトレーニング済みパイプラインが追加されている。 ほかにも、サポートされているすべての言語用に再トレーニングされたパイプラインとともに、マケドニア語とロシア語用の新しいコアパイプライン、新しいトレーニングワークフローと構成システム、PyTorch、TensorFlow、MXNetといった機械学習フレームワークを使用したカスタムモデル、前処理からモデル展開までのエンドツーエンドのマルチステップワークフローを管理するためのspaCyプロジェクトが実装された。 機能改善としては、データバージョン管理(DVC)、Streamlit、Weights&Biases、Rayなどとの
2020年も多くの素晴らしい技術書がたくさん出ました. その中でも(昨今のトレンド・流行りも手伝ってか)Python本の多さ・充実度合いは目立つものがあります. (このエントリーを執筆した12/19時点で)Amazonの本カテゴリで「Python」と検索すると1,000件以上出てきます*1. これだと目的の本にたどり着くだけで疲れそうです. このエントリーでは, 主にPythonを学びたい・現在使っている方 手元の業務を効率化したり, RPAっぽいことをやりたい方 エンジニア・データサイエンティストとして業務や趣味・個人開発をされている方 を対象に, 今そして来年2021年に読んでおきたいPython関連書籍(と抑えておきたいサービス) をエンジニアでありデータサイエンティストである私独自の視点で紹介します*2. なおこのエントリーはこのブログで例年執筆している「Python本まとめ」の2
Pythonの魅力の1つが豊富なパッケージ群を持っていることだ。しかし、その多種多様なパッケージを適切に管理する方法についてはよく考える必要がある。ほとんどのPythonパッケージはPython Package Index(PyPI)と呼ばれるリポジトリに登録されているが、問題なのはこのリポジトリから実際にパッケージを取得してインストールする方法だ。 一般的には、何らかのパッケージマネージャーを利用して一元管理するのが望ましい。しかし具体的にどのパッケージマネージャーを利用するのが最適なのだろうか。本稿では、Opensource.comの記事「Managing Python packages the right way」を参考に、Pythonのパッケージを管理するためのベストプラクティスを紹介しよう。 Python.org グローバルインストールで留意すべき点 pipは優れたPython用
【短期集中連載】〈第3回〉何万回のコピペがゼロに!Excel作業を自動化するPythonプログラム実例 テレワークで上司から大量の単純作業を振られ、家で黙々と作業をこなすビジネスパーソンの救世主! 単純な事務作業の手間をなんと10分の1以下に圧縮する時短化ツール、Python。 『めんどうな作業が秒速で終わる! Excel×Python自動化の超基本』(宝島社)の著者である伊沢剛さんにExcel×Pythonのすごさを解説していただく連載も、第3回を迎えました。 今回は、実際の作業を自動化するプログラムの一例として、「コピペ」のプログラムの動作を紹介します。Excel×Pythonのすごさを実感してみてください! 第1回はこちら 第2回はこちら 複数のExcelシートにあるデータを1つのシートに統合! Excel×Pythonの実例として、Excelブックの中にある複数のシートに入力された
【短期集中連載】〈第1回〉作業時間が10分の1に!?事務作業に革命を起こす自動化ツール「Excel×Python」 みなさんは、話題のプログラミング言語、「Python(パイソン)」をご存じでしょうか? Pythonは他の言語に比べてコードが短くシンプルになって使いやすかったり、AIやビッグデータといった話題のジャンルのプログラムを作成できたりすることで、近年とても人気が高まっています。 そして、最近特に話題になっているのが、Pythonが「Excelで行う業務の自動化」に使えるということです! 何百回と繰り返されるコピペ、複雑なフォーマットへの手入力、時間のかかるウェブからの情報収集……Pythonプログラムを使えば、単純な事務作業の手間はなんと10分の1以下に! ビジネスパーソン向けの時短ツールとして、大きな注目を集めているのです。 今回は『めんどうな作業が秒速で終わる! Excel×
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く