book-eaterのブックマーク (35)

  • 調和振動子の対称性とspectrum generating algebra -

    ただのSegal-Shale-Weil表現(振動子表現という名前もある)の話。無限次元既約ユニタリー表現の研究は、Lorentz群やPoincare群で始まったけど、ある意味では、それより以前から知られていた、最初の無限次元既約ユニタリー表現の例でもある。 水素原子の表現論 http://d.hatena.ne.jp/m-a-o/20140130#p1 水素原子の表現論(1.5-2)spectrum generating algebra http://d.hatena.ne.jp/m-a-o/20161010#p1 などで、 ・3次元Kepler系の相空間には、群$SO(4,2)$が推移的にsymplectic変換として作用し、symplectic等質多様体であること ・水素原子の束縛状態の空間は、Lie環$so(4,2)$のある既約ユニタリー表現(極小表現)であり、$so(4,2)$はs

    調和振動子の対称性とspectrum generating algebra -
  • Pythonを爆速にする「Cython」チュートリアル: C++のコードがライブラリに依存しているとき。まずはCMake。 - Qiita

    wget https://gmplib.org/download/gmp/gmp-6.1.2.tar.xz &&\ tar xvf gmp-6.1.2.tar.xz &&\ cd gmp-6.1.2 &&\ ./configure --prefix=/usr/local/gmp/6_1_2 &&\ make && make check && make install として、gmpライブラリをインストールしました。 今回何をするか 今回は、まず gmpライブラリを使った簡単なコードを書き、コマンドでコンパイルできることを確かめる。 そもそもC++のライブラリがどのようにインストールされており、どのように参照しているのか。 依存関係を持つプログラムのコンパイルはCMakeを使ってどのように実行されるのか。 それがcython化するときにsetup.pyにどのように書かれるのか。 の、3まで解

    Pythonを爆速にする「Cython」チュートリアル: C++のコードがライブラリに依存しているとき。まずはCMake。 - Qiita
  • データ視覚化のプロが選ぶデータ分析のオススメ本32選

    データ分析&データ視覚化のコンサルティングをしております、永田ゆかりと申します。 これまで2000人以上の方にデータ分析や活用の研修・トレーニング講師、企業への分析コンサルティングをさせていただいており、仕事をさせていただく中で必要なを読み続けているうちに、気がついたらデータ分析領域のを200冊以上読んでいました。 中でもデータビジュアライゼーション・視覚化の領域に関しては私自身の得意領域ということもあり、数多く読み込んでいます。 記事では数多くのクライアントの方々との問題解決に役立った知識・ノウハウが書かれている良書をご紹介させていただきますので、是非最後までご覧ください。 データ可視化そのものについて知りたいたは、こちらの記事からどうぞ。 データ可視化とは?その重要性や手法、よくある課題と解決策を解説 データ分析における視覚化(ビジュアライゼーション)系のおすすめの17選1 S

    データ視覚化のプロが選ぶデータ分析のオススメ本32選
  • ビジネスで使えるPythonを使った統計的データ分析手法まとめ - Qiita

    概要 WEB系のサービスで色々な試作を実施した後に効果を検証するのは非常に重要だと思いますが、 そのやり方として基的な統計学が十分に使えると思っています。 今回は基的な統計学からビジネスで使える試作の効果検証、データ分析を目的にPython+JupyterLab(Docker)を使った統計的データ分析のやり方をまとめました。 また今回使ったnotebookは以下にもありますのでご参考ください。 https://github.com/hikarut/Data-Science/tree/master/notebooks/statisticsSample 環境 以下を参考にDockerでJupyterLabが使える状態を前提とします。 Dockerで起動したJupyterLabでvimキーバインドを使う

    ビジネスで使えるPythonを使った統計的データ分析手法まとめ - Qiita
  • Web スクレイピングで河川水位データを自動で取得する - Qiita

    はじめに 記事の目的は、国土交通省が公開している「水文水質データベース」から観測データを自動取得する方法を紹介することです。国土交通省や気象庁といった公機関は、天気・河川水位といった計測データを一般公開しており、「水文水質データベース」はその1つです。(サイトurl: http://www1.river.go.jp/) データによっては数十年もの蓄積があり、気候変動の調査やビジネスへの活用が期待できると考えています。 水文水質データベースの概要をサイトから引用します このデータベースは水文水質にかかわる国土交通省水管理・国土保全>局が所管する観測所における観測データを公開することを目的として> います。掲載対象としているデータは、雨量、水位、流量、水質、底質、地下水位、地下水質、積雪深、ダム堰等の管理諸量、海象です。 しかし、水文水質データベースは有益なデータが豊富に揃っていながらも、C

    Web スクレイピングで河川水位データを自動で取得する - Qiita
  • Pythonで作って学ぶ統計モデリング | AIdrops

    Pythonで作って学ぶ統計モデリング 近年、AI機械学習、深層学習といった用語に代表されるように、多種多様のデータを高度なアルゴリズムと計算機の力で解析し、将来予測などの価値を生み出す技術に注目が集まっています。 これらの技術の土台となっているのが、記事で解説する統計モデリング(statistical modeling) と呼ばれる考え方です。元々は手計算が可能なレベルの比較的シンプルな数学的仮定を置いてデータを解析する方法論として発展しましたが、近年の計算機の性能発達に伴い、従来では取り扱えなかったより複雑なモデルを利用した高度な解析を実施する事例が増えてきています。特に、現在実践で広く使われている機械学習のモデルや、複雑な非線形関数を組み合わせた深層学習モデルなども、その多くは突き詰めれば統計モデルの一種であることが言えます。したがって、統計モデリングはそれ自体がデータ解析に対し

    Pythonで作って学ぶ統計モデリング | AIdrops
  • 【python】csvファイルの読み込みを使いこなす。pandas.read_csvの主要オプション一覧。 - Qiita

    Help us understand the problem. What are the problem?

    【python】csvファイルの読み込みを使いこなす。pandas.read_csvの主要オプション一覧。 - Qiita
  • Pythonの列挙型 (enum) - け日記

    これまで定数クラスを作ってやり過ごすことが多かったのですが、enumが比較的使いやすかったので、 enum enumはPython 3.4から標準ライブラリに追加されたモジュールで、列挙型をサポートするものです。 docs.python.org 実装 最初にenumをインポートしておきます。Python 3.7.4を使っています。 import enum BTreeなどの木構造のノードを考えてみます。各ノードは根ノード (ROOT) 、中間ノード (INTERNAL) 、葉ノード (LEAF) の3種類のいずれかに分類されるものとします。 それをTreeNodeTypeという列挙型で表現すると、以下のようになります。Enumクラスを継承することで実装します。 列挙子 (ROOTなどの識別子) はnameとvalueとプロパティを持ってます 列挙子同士は比較可能ですが、列挙子と同じEnumオ

    Pythonの列挙型 (enum) - け日記
  • 衛星画像データの解析を行うために学んだこと - 世界銀行で働くデータサイエンティストのブログ

    先日の記事で紹介した通り,東大のディープラーニング講座DL4USを受講し,最終課題として「衛星画像とCNNを用いたスラムの特定」というテーマで解析を行いました。 この解析を行うにあたって,衛星画像の取得やQGISPythonを用いた前処理が必要でした。今回の記事では,それについて私がどのような勉強をしたか順を追って紹介します。 学習のステップ データ解析に関する私の事前知識ですが,普段の業務でテーブルデータは扱うものの,生の衛星画像を扱った経験はなく,観測衛星や地理データに関する知識もほとんどありませんでした。 そんな状態から以下のステップで学んで行きました。 観測衛星/衛星画像データに関する知識の学習 地理データ(ラスター/ベクター) に関する知識の学習 QGISを用いた地理データの可視化/加工 Pythonを用いた地理データの加工 観測衛星/衛星画像データの知識 まず基礎知識として衛

    衛星画像データの解析を行うために学んだこと - 世界銀行で働くデータサイエンティストのブログ
  • これを見ればPythonの内包表記を完全に理解できる - Qiita

    これはとても簡単な例ですが、まあなんとなくどんなものかはわかったと思います。(内部処理はまだ理解できていなくて良いです。) aとbは、結果は同じものになっていますが、具体的にどんな処理を行っているのかを説明していきましょう。 前者は、 1. まず空のリスト(可変長オブジェクト)を生成してaという変数に代入します。 2. rangeオブジェクトを生成します。 3. 2のオブジェクトから各値を取り出し、iという変数に代入します。 4. iを1で作成したリストにappendしていきます。(3, 4を繰り返します。) 後者は 1. まず空のリスト(可変長オブジェクト)を生成します。(この中で行われるiterationの結果を格納していくための箱です) 2. rangeオブジェクトを生成します。 3. 2のオブジェクトから各値を取り出し、iという変数に代入します。 4. 内包表記を使うことで、結果の

    これを見ればPythonの内包表記を完全に理解できる - Qiita
  • 京都大学のPython講義資料から見る重要単元 - Qiita

    はじめに 2月13日 京都大学がPythonの講義資料を無料公開しました。 関連: 講義資料リポジトリ 紹介記事-Qiita 紹介記事-CodeZine かなり充実した内容となっています。(完璧ではありませんが。。。) COVID-19のせいもあり自宅での学習が今後の鍵になると思われますので、有効活用させていただきましょう。 私自身、Pythonの基礎がうやむやなまま使っているので、これを機にしっかりと理解しておきたいと思います。 ちなみに講義資料とコラム編の二つに分かれていて、記事では講義資料のみ取り扱います。 Pythonなんとなく使えるぜって人はコラム編を読んでみてください。面白いですよ。 コラム編もおまけ程度に書いたので暇すぎて死にそうな人は見てみてください。 京都大学のPython講義資料:コラム編の紹介 この記事で何をするか この記事では、京都大学様の講義資料の中から、私の個

    京都大学のPython講義資料から見る重要単元 - Qiita
  • 機械学習や統計学で使う主な確率分布一覧とpythonでのコード - Qiita

    はじめに 機械学習では多数の確率分布を使いますが、それぞれの特徴などを覚えるのが大変なので、一覧でまとめてみました。 確率分布一覧 | 確率分布名 | 表記 | 確率(密度)関数 | 範囲 | パラメータ | 最頻値 | 分散 | pythonでの確率密度関数(もしくは確率質量関数)のコード | | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- | |ベルヌーイ | $B_r(q)$ | $q^x(1-q)^{1-x}$ | $x=0,1$ | $0\le q \le 1$ | $q$ | 0 or 1 | 0 or 1 | $q(1-q)$ | scipy.stats.bernoulli.pmf | | ポアソン | $Po(\lambda)$ | $\Large\frac{\lambda^x e^

    機械学習や統計学で使う主な確率分布一覧とpythonでのコード - Qiita
  • Pythonプログラミングの部屋

    マンガを描くとき、シナリオを先に書く人もいるかと思います(私は、そうしています)。 また、原作付きマンガを描いている人で、シナリオをテキストファイルやワープロソフトのファイルで受け取る人もいるでしょう。 いまマンガを描く人は、ほとんどがClipStudioを使っているはずです。そのようなマンガ家なら、シナリオからネーム部分(セリフとナレーション)だけ抜き出せたら便利だと思いませんか? そこで自作シナリオのネーム部分だけを抜き出し、句読点や「!・!!・?・!?・空白」が来ると、そこで改行するプログラムを作ってみました。 元のシナリオを「input.txt」という名前で保存し、同じフォルダにこのプログラムを置いてください。Pythonのインストールがすんでいれば、あとはこのプログラムのアイコンをダブルクリックするだけで、改行されたネームだけになったファイルが「output.txt」という名前で

  • Pythonの基本文法をJupyter Labで書いてみた - Qiita

    print('{one}{two}'.format(one='hello', two='world'))

    Pythonの基本文法をJupyter Labで書いてみた - Qiita
  • Pythonを会得する考え方やポイント5選! 『パーフェクトPython』著者が魅力を語る! - FLEXY(フレキシー)

    記事は2020年4月に公開した内容です。 株式会社ディー・エヌ・エーのシステム部CTO室の露木誠です。PythonやDjangoについて執筆した『パーフェクトPython』や『Django×Python』などの著書が技術系出版社から数冊出版されています。DjangoのAUTHORSファイルにも実は名前が掲載されています。 記事では、Pythonを始めたいと思っている方向けに、Pythonの魅力をお伝えできればと思います。知っておきたいPythonの言語仕様や特徴的な考え方をご紹介しますので、参考にしてください。 Python関連のエンジニア案件を見てみる 自己紹介とPython、Djangoに関わる活動について ディー・エヌ・エーのCTO室に所属、元々は異業種からIT業界に参入 現在は、株式会社ディー・エヌ・エーのシステム部CTO室で、エンジニア組織の課題解決を主な活動として、日

    Pythonを会得する考え方やポイント5選! 『パーフェクトPython』著者が魅力を語る! - FLEXY(フレキシー)
  • Excelを活用したデータ分析の方法

    多くの人は、エクセルでのデータ分析はなかなか難しいと思っているかもしれません。しかし、専門の分析ツールを使わなくとも、できることは意外に多いんです。 エクセルには「分析ツール」という大変便利な機能があります。 「分析ツール」とはエクセルのアドインの一つで、クリックや簡単なパラメータの入力のみでデータ分析を可能にしてくれる機能です。 「分析ツール」機能を使用すれば、特別な関数やコードを書く必要が一切ありません。導入も簡単ですので、初心者でも気軽にデータ分析を行うことができます。 記事では、エクセルにある「分析ツール」機能を使って、「エクセルのデータ分析でどこまでいけるのか」を8つのケースを通じて解説します。 この記事を読み終えたころには、「分析ツール」機能でデータ分析ができるようになっているはずです! 1. 「分析ツール」機能は、短い時間で少量のデータを分析したいときに最適な機能である「デ

    Excelを活用したデータ分析の方法
  • 【NLP】fakerを使用したダミーデータの作成 - Qiita

    はじめに 自然言語処理(NLP)で学習データを準備する際に、実際のデータだけでは足りなかったり、集めるのが難しかったりすることがあります。 その場合、ダミーデータを作成してデータ量を増やす流れが多いでしょう。 今回は、Pythonのfakerというライブラリを使用して、様々なダミーデータをつくってみます。 準備 環境はGoogle Colaboratoryを使用します。 Pythonのバージョンは以下です。

    【NLP】fakerを使用したダミーデータの作成 - Qiita
  • 使える統計モデル10選(後編) | AIdrops

    使える統計モデル10選(後編) 前回の記事では、使える統計モデル10選の前編として、主に回帰モデルに焦点を絞って紹介しました。 今回はその後編に当たる生成モデル編です。生成モデル(generative model)は、端的に言うと、コンピュータシミュレーションによりデータを人工的に作ることができるモデルです。データが作られる過程をうまく表現したモデルを構築することができれば、予測だけではなく異常検知やデータ圧縮など幅広いタスクに応用することができます。 生成系(教師なし系) 回帰モデルと同様、生成モデルも数個のパラメータから構成される簡単なものから、複数のモデルを巧みに組み合わせた複雑なものまで無限に存在します。ここでは、データ圧縮から自然言語処理、ソーシャルネット解析までさまざまなデータ解析のタスクで利用されている代表的な生成モデルを5つ選んで紹介します。また、生成モデルのすべては潜在変

    使える統計モデル10選(後編) | AIdrops
  • 時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft

    時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、MicrosoftPythonやR向け Microsoftは、時系列予測のベストプラクティスを共有するためのGitHubリポジトリを開設した。PythonやRを使っている開発者に向けたものだ。 Microsoftの「R」コミュニティー向けブログサイト「Revolutions」は、2020年4月14日(米国時間)、時系列予測のベストプラクティスを共有するためのGitHubリポジトリ「Time Series Forecasting Best Practices & Examples」を開設したと発表した。 Microsoftはこのリポジトリについて、README.mdで次のように説明している。 「時系列予測は、データサイエンスで最も重要なトピックの一つだ。的確な意思決定と効果的な資源配分を行うために、ほぼ全ての企業には未来

    時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft
  • PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 - ガンマソフト

    ブログ PythonPDFを画像ファイル(JPEG、PNG)に変換する方法 [PR] 2020/1/7 | OCR PDF Python 今回はPDFを画像ファイル(JPEG、PNG)にPythonで変換する方法をご紹介します。 PDFを画像ファイルに変換するには、通常は有料のAdobe® Acrobat®などのソフトを用いますが、Pythonなら無料で入手できるライブラリで実施できます。 PythonPDFを画像に変換できれば、PDFの書類をOCRで文字認識したり、多量のPDFファイルをプレビューしやすくするなど、PDFをもっと効率化に利用できるようになります。 記事の目次 pdf2imageのインストール popplerのダウンロード プロジェクトフォルダ構成 プログラミング(JPEG、PNGへの変換) マルチページのTIFFに変換したい場合 様々に応用できます pdf2imag

    PythonでPDFを画像ファイル(JPEG、PNG)に変換する方法 - ガンマソフト