[B! Python][python] [11ページ] Aobeiのブックマーク

pythonのアンダーバーこれなんやねん - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

Aobei 2020/04/05

Python

リンク

Kaggleで戦いたい人のためのpandas実戦入門 - ML_BearのKaggleな日常

はじめに自分は元々pandasが苦手でKaggleコンペ参加時は基本的にBigQuery上のSQLで特徴量を作り、最低限のpandas操作でデータ処理をしていました。しかし、あるコードコンペティションに参加することになり、pythonで軽快にデータ処理をこなす必要が出てきたので勉強しました。そこで、当時の勉強メモをもとに「これだけ知っていればKaggleでそこそこ戦えるかな」と思っているpandasの主要機能をまとめました。注記実戦入門のつもりがほぼ辞書になってしまいました orz pandasとはなんぞや的な内容は書いていません (import pandasやDataFrameとは何かなど) pandas1.0系でも動くように書いたつもりですが間違ってたらすみません目次はじめに注記目次 Options DaraFrame 読み書き CSVファイル読み込み書き出

Aobei 2020/04/01

リンク

Python OpenCVで動画をフレーム毎に画像保存 - Qiita

import cv2 import os def extractFrames(pathIn, pathOut): if not os.path.exists(pathOut): os.mkdir(pathOut) cap = cv2.VideoCapture(pathIn) count = 0 while (cap.isOpened()): ret, frame = cap.read() if ret == True: cv2.imwrite(os.path.join(pathOut, "frame_{:06d}.jpg".format(count)), frame) count += 1 else: break cap.release() cv2.destroyAllWindows() def main(): extractFrames('video.mp4', 'outputdir')

Aobei 2020/03/30

リンク

【Python】KerasでVGG16を使って画像認識をしてみよう！

ではせっかくなのでモデルの中身をみてみましょう．以下のコードでその中身を見ることができます． model.summary() 以下のようなモデルの構造が表示されるかと思います． Layer (type) Output Shape Param # ================================================================= input_1 (InputLayer) (None, 224, 224, 3) 0 _________________________________________________________________ block1_conv1 (Conv2D) (None, 224, 224, 64) 1792 ______________________________________________________

Aobei 2020/03/24

リンク

GitHub - walkingmask/movinc

Aobei 2020/03/06

動画の類似度

リンク

２つの動画の類似度を求める - walkingmask’s development log

ググっても意外と出てこなかったので、シンプルな実装をログ。より効率的なアルゴリズム、高パフォーマンスな方法が他にあることは明らかなので、見つけ次第追記していければと思う。実験用リポジトリは以下。 github.com 画像の類似度動画はただの画像の連続なので、基本的な仕組みは画像の場合と同じ。以下の記事が非常にわかりやすくて面白い。 qiita.com Perceptual Hashを使っている。動画の類似度では、何が違い、何が問題となるのか？動画間の比較は、言い換えると「時系列関係を持った画像集合間の比較」なので、主な違いとしては、単体の比較か？集合の比較か？だと思う。また、大きく問題になってくるのは、特に「動画間のフレーム数が異なる」点だと考えられる。例として FPS が違う前後に異なるフレームがあるトリミング広告の挿入などコマ落ち等によって、時系列情報に違いが出

Aobei 2020/03/06

リンク

Jupyter Notebook Viewer

このモデルは、林祐輔氏（@hayashiyus）がTwitterで公開されたSEIRモデル[1]を参考に、ダイアモンド・プリンセスにおけるCOVID-19発症日別報告数[2]を観測データとして、最適化ツールOptuna[3]を用いてパラメターフィッティングを行ったものである。 https://twitter.com/hayashiyus/status/1231154537030774785 国立感染症研究所, 現場からの概況：ダイアモンドプリンセス号におけるCOVID-19症例(2020年2月19日掲載)https://www.niid.go.jp/niid/ja/diseases/ka/corona-virus/2019-ncov/2484-idsc/9410-covid-dp-01.html https://optuna.org/ ダイアモンド・プリンセスは乗客2,666人、乗員1,0

Aobei 2020/02/26

SIR,感染症の流行過程

Python

リンク

GitHub - pistatium/about_python_logging: 「すっきり分かる Python のログ」の資料です

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

Aobei 2020/02/22

python

リンク

【これなら分かる！】変分ベイズ詳解＆Python実装。最尤推定/MAP推定との比較まで。Beginaid

本記事の内容は新ブログに移行されました。新しい記事へこちらのブログにコメントをいただいてもご返信が遅れてしまう場合がございます。予めご了承ください。ご質問やフィードバックは上記サイトへお願い致します。今回は，確率モデルの潜在変数・パラメータの事後分布を求めるための繰り返し近似法である変分ベイズ法（Variational Bayesian methods）の解説とPythonで実装する方法をお伝えしていこうと思います。本記事はpython実践講座シリーズの内容になります。その他の記事は，こちらの「Python入門講座/実践講座まとめ」をご覧ください。また，本記事の実装はPRML「パターン認識と機械学習＜第10章＞」に基づいています。演習問題は当サイトにて簡単に解答を載せていますので，参考にしていただければと思います。【目次ページ】PRML演習問題解答を全力で分かりやすく解説

Aobei 2020/01/18

リンク

AllenNLPで簡単にDeepな自然言語処理 - Qiita

0. はじめにこの記事では最新の自然言語処理のフレームワークであるAllenNLPの使い方について紹介します。日本語のデータを使用して、簡単なattentionつき文書分類モデルを作成することを通して、AllenNLPの強力な機能を説明できればと思います。本記事で使用する、AllenNLPを使用して日本語の文書分類モデルを作成するサンプルはここにあります。また、本記事を執筆するに際して下記の記事がとても参考になりました。公式チュートリアル An In-Depth Tutorial to AllenNLP (From Basics to ELMo and BERT) Training a Sentiment Analyzer using AllenNLP (in less than 100 lines of Python code) 1. AllenNLPとは AllenNLPはPy

Aobei 2020/01/12

リンク

Joint Topic Modelを実装した - でかいチーズをベーグルする

LDAの簡単な拡張になっている Joint Topic Model を実装した。青いトピックモデル本で紹介されてた。この本はいろんなモデルが載ってるのでいいね。トピックモデル (機械学習プロフェッショナルシリーズ) 作者: 岩田具治出版社/メーカー: 講談社発売日: 2015/04/08メディア: 単行本（ソフトカバー）この商品を含むブログ (2件) を見る実装したあとで気づいたけど既にnzw君が実装して実験してたのでこちらも参考に。 nzw0301.github.io Joint Topic Model Joint Topic Model (JTM) はLDAとほとんど同じなんだけど、文書に付加情報（カテゴリとか）がついてる場合、それも使うことができる。どんな付加情報を扱えるかというと、基本的にはカテゴリ変数だけ。生成過程を見ると分かるように、付加情報の生成にはカテゴリカル分布が使

Aobei 2020/01/11

トピックモデル (機械学習プロフェッショナルシリーズ)

Python

リンク

【Python実装】LDAのトピックをParticle Filter（SMC）で推論 - ガシンラーニング

今回は、LDA（Latent Dirichlet Allocation）の逐次モンテカルロ法（Sequential Monte Calro）であるパーティクルフィルター（Particle Filter）によるトピック推論をPythonで実装しました。コードは全てgithubに載せています。githubはこちら Twitterフォローよろしくお願いいたします。twitterはこちら以下の書籍3.5章とこの書籍が参照している元論文を参考にしました。 Online Inference of Topics with Latent Dirichlet Allocation [Canini 2009]こちらこちらの書籍はトピックモデルに限らずベイズモデリング推論の良書です。トピックモデルによる統計的潜在意味解析 (自然言語処理シリーズ) 作者: 佐藤一誠,奥村学出版社/メーカー: コロナ社

Aobei 2019/11/03

トピックモデル

リンク

Visual Studio CodeがPython対応強化。Jupyter Notebooksネイティブ編集、Pythonファイルの直接実行など

Visual Studio CodeがPython対応強化。Jupyter Notebooksネイティブ編集、Pythonファイルの直接実行などオープンソースのコードエディタ「Visual Studio Code」が10月のアップデートでPython関連機能の強化などを行いました。機能強化はおもにPython 拡張機能を通じて提供されます。 The October release of the #Python extension for @code is here! Try out native editing of #JupyterNotebook files , a button to run Python files in the terminal ▶, and improvements to the Python Language Server. Learn more on our

Aobei 2019/10/15

リンク

gaiaskyの技術メモ

以前、アヒル本の多項ロジスティック回帰についてpymc3版を紹介した。 gaiasky.hatena blog.com 今回は、多項ロジスティック回帰の例として、「μ's とAqours の人気の差」を題材とした記事があったので、これを紹介したいと思う。これらの記事ではモデルはStanで実装されていたので、これをpymc3でトレースしてみることにする。 http://mikuhatsune.hatenadiary.com/entry/20170320/1490011326 http://abrahamcow.hatena blog.com/entry/2017/06/24/154902 データ生成のモデルは以下の通り各9人が所属する2つのグループがある。メンバーの効果（人気）を、μ'sグループの効果（人気）をとする。メンバーが所属するグループをとする。はμ's、はAqousに所属。各

Aobei 2019/09/19

Pythonでアヒル本を学べる。

Python

リンク

【転職エントリ】Googleに入社します｜Lillian

はじめに　この記事には、Googleのオンサイト面接に向けて勉強した内容が記載されていますが、それらはすべて面接を受ける直前に書いておいたものです。このエントリを読むことで面接で聞かれた内容が予測されてしまわないようにそのようにさせていただきました。ご了承お願いします。この記事について　令和元年に医師を退職し、ソフトウェアエンジニアに転職します。自分にとって大きな転機であったのと、とても大変な道のりであったので、私という人間が辿った道筋を最初から最後までちゃんとまとめておきたいと思いこの記事を書くことにしました。私のような他業種から未経験での転職を目指されている方にとっても、何らかの参考になる内容であれば幸いです。私の生い立ち　私は小さい頃からテレビゲームが大好きで、学校から帰るとずっと家でゲームをしている子でした。あまりにもゲームが好きだったので、遊ぶだけではなく自分で作ってみた

Aobei 2019/08/01

リンク

Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう

検索エンジンを何故作ってみたかったかもともとこのブログのコンセプトのNLP的なことで、情報を整理してなにか便利にしたかった(Googleと同じモチベーションの世界の情報を整理する) 4年前にほぼ同じシステムを作ろうとしたとき、500万を超える大量のインデックスを検索するシステムは、数学的な理解度が十分でない＋エンジニアリング力が伴わないなどでギブアップした背景があり、今回再チャレンジしたくなったほぼすべての機能をpure python(+いくつかの例外はある)で実装して、世の中のソフトウェアを使うだけの検索エンジンをやってみたなどではなく、実際に理解して組んでみることを目的としたかった依存パッケージと依存ソフトウェア GitHubのコードを参照してください様々なサイトを巡回する必要があり、requestsが文字コードの推論を高確率で失敗するので、nkf をlinux環境で入れて

Aobei 2019/07/06

リンク

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 – かものはしの分析ブログ

都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリストテキストデータの特徴量化について仕事ではテキストデータを多用するので、機械学習などで扱うためにテキストデータを特徴量にするためのアプローチを色々と整理してソースコードを残しておきたいと思います。今回はあくまでも私の知っているものだけなので、網羅性はないかもしれませんが悪しからず。（2019/08/18 追記）Stackingをカジュアルに行えるvecstackというモジュールを用いた予測も試してみました。下の方の追記をご覧ください。アプローチテキストデータを特

Aobei 2019/06/24

リンク

小説家になろうを機械学習でデータ分析してブックマーク10以上を獲得しやすい条件を探す - Qiita

はじめにこれを書いてる人の機械学習・データ分析のスキルはpythonの拡張子が.pyであることを知ってから10日目ぐらい、「決定木」「最小二乗法」「特徴量」「RMSE」といった単語を初めて見てから7日目ぐらいといったレベルです。なのでより良い方法がある場合や、分析の途中間違っている箇所などがあればコメント欄等でどんどん指摘してくださると有り難いです。(コードが汚い、変数の命名がおかしい等はご容赦ください) 本記事について小説家になろうの作品でブックマーク10以上を獲得するために、有利なジャンルはあるのか、作品のタイトルとあらすじの文字数は重要か、本文の文字数は重要か、ジャンルが重要ならどのジャンルが良いのか、文字数が重要ならどのぐらいの文字数が良いのか、といったことを調べていきます。先に分析の結果を書くと大ジャンルジャンル 15禁止作品かどうか、タイトルの文字数、あらすじの文字数

Aobei 2019/06/15

リンク

PythonでDataFrameを省メモリに縦横変換する - MicroAd Developers Blog

マイクロアドの京都研究所で機械学習エンジニアをしている田中です。機械学習を利用したユーザーの行動予測の研究開発などを担当しています。今回は、データの前処理に関するお話をしたいと思います。データの縦横変換縦横変換するためのpandasの関数省メモリに縦横変換するサンプルデータの準備 pandas.Categoricalの活用 scipy.sparseの疎行列クラスの活用さいごに参考データの縦横変換機械学習や統計解析をする際に頻出するデータの前処理の1つに、データの縦横変換があります。縦横変換とは、縦持ち（またはlong型）のデータと、横持ち（またはwide型）のデータを互いに変換することを指します。縦持ちのデータの例横持ちのデータの例例示したこの２つのテーブルは、表現形式こそ異なりますが、表しているデータ自体はどちらも同じものになります。ユーザーの行動予測をする

Aobei 2019/05/10

リンク

教師なしLDAから、半教師有りLDA（ガイド付きLDA）へ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 教師有りLDAモデルを使って、何か面白いことができないか調べてみたいと思います。今回は、そもそも日本語での教師有りLDAモデルの解説記事が少なかったようなので、参考になったVikash Singh氏の英語版の記事の流れに沿って、半教師有りLDA（ガイド付きLDA）を解説していきたいと思います。【元記事】「How our startup switched from Unsupervised LDA to Semi-Supervised GuidedLDA」 LDA（トピックモデル）とは何か？ニュース記事のような文章を、「政治」「ス

Aobei 2019/05/07

Python

リンク

はてなブックマーク

タグ

関連タグで絞り込む (103)

Pythonとpythonに関するAobeiのブックマーク (279)

お知らせ

「あとで読む」タグで振り返る2025年〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2025年12月第2週）

今週のはてなブックマーク数ランキング（2025年12月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (103)

Pythonとpythonに関するAobeiのブックマーク (279)

お知らせ

「あとで読む」タグで振り返る2025年 〜今年の「あとで読む」、今年のうちに〜

今週のはてなブックマーク数ランキング（2025年12月第2週）

今週のはてなブックマーク数ランキング（2025年12月第1週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス

「あとで読む」タグで振り返る2025年〜今年の「あとで読む」、今年のうちに〜