[B! python] [9ページ] lepton9のブックマーク

Python Serverless Microframework for AWS (Chalice) を使うと、サーバーレスアーキテクチャの IAM ポリシーの管理が劇的に簡単になる！ | DevelopersIO

lepton9 2019/07/23

リンク

うわっ…私のpandas、遅すぎ…?って時にやるべきこと（先人の知恵より） - Lean Baseball

※あくまでもイメージです（適当）仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、約19万レコード（110MBちょい）のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectancy.py events-2018.csv RUNS_ROI outs 0 1 2 runner 0_000 0.49 0.26 0.10 1_001 1.43 1.00 0.35 2_010 1.13 0.68 0.32 3_011 1.94 1.36 0.57 4_100 0.87 0.53 0.22 5_101 1.79 1.21 0.50 6_110 1.42 0.93 0.44 7_111 2.35 1.47 0.77 python run_expectancy.py events-2018.c

lepton9 2019/07/16

リンク

入門pandas - 明日からはじめるデータ分析のきほん - Lean Baseball

こういうことやぞサムネイルで描いた事がこのエントリーの全てです. Pythonでは、「pandas」というライブラリを使ってデータ分析や解析をすることが非常に多いです. でも、「利用方法（またはユースケース）」に合わせた入門ってあんまりない気がします. ということで、「PyCon mini Sapporo 2019」でそんな話をしてきました. sapporo.pycon.jp 訳あって資料およびJupyter notebookは非公開*1ですが、こちらにその基本とかをまとめます. TL;DR - このエントリーは実務や趣味のデータ分析でpandasを使う例を紹介します. 初歩的な使い方から中級者になるまでのヒントになると思います. なお,統計テクニック・機械学習には触れません・やりません. なお、対象読者は「そこそこPythonとJupyter notebookが使えてこれからデータ分

lepton9 2019/07/16

リンク

退屈なことはPythonにやらせる...前に考えるべきこと - Lean Baseball

機械学習, データサイエンスを志向してPythonを勉強したり,この辺のエントリーで本を読み漁ったりすると*1, もしかして, 私の仕事ってプログラミングで楽になるのでは！？と気がつく(もしくはそういう記事・本を読んで触発される)瞬間があるかと思います, この本とかあの本とか. このエントリーではそんな素晴らしい学び*2に対して,一つの回答を示してみたいと思います. TL;DR（ここは読んでほしい）プログラミングで解決できる「退屈なこと」とは「回数が多く, 属人性が少ない」作業のことである. 属人性がある仕事はプログラミングをする前に因数分解しよう or 「仕事ごっこ」だったらやめる努力をしよう. Pythonで「退屈なこと」をやるなら,「退屈なことはPythonにやらせよう」もいいですが,「できる仕事がはかどるPython自動処理全部入り。」が個人的にはおすすめです. 言いたいこと

lepton9 2019/07/16

リンク

namedtupleで美しいpythonを書く！（翻訳） - Qiita

namedtupleの解説記事です。この記事の想定読者 namedtupleの基本を知りたい人 namedtupleの存在意義がよく分からない人 namedtupleの活用場面を知りたい人そこそこ多量のデータを上手に管理する方法を探している人【2019年10月4日追記】結構な数のいいねをいただいたため、きちんとした記事にしなければと改めて思っております。見直しますと、typing.NamedTupleの利用方法など、重要な情報が不足していると思いましたので（執筆当時の知識不足によります。申し訳ありません）、本日追記して記述を補いました。はじめにあまりメジャーではないかもしれませんが、pythonにはnamedtupleというデータ型があります。標準ライブラリのcollectionsモジュールからインポートできます。私自身はnamedtupleに関しては、 dictionar

lepton9 2019/07/11

リンク

AWS Lambdaで運用した実績から得られた、serverless frameworkのオススメ設定とプラグインの知見 - GA technologies Tech Blog

はじめまして。株式会社GA techno logies のService Development Division (開発部門) エンジニアの永冶といいます。今後、この技術ブログを通して様々なことをアウトプットし、記事を閲覧する方の力に少しでもなれたらと思います。よろしくお願いします。この記事を書いた経緯弊社ではAWS Lambdaを画像の圧縮 Slackへの通知外部サービスとの連携などで幅広く使用しています。数多くのLambda関数を管理する上で、設定の可視化とデプロイの自動化は避けては通れません。設定の可視化とデプロイの自動化を達成するために、弊社のいくつかのプロジェクトではserverless frameworkを使用しています。社内で運用を続けていく上で、serverless frameworkを使用する時のオススメの設定やプラグインが洗練されてきました。この記事を読

lepton9 2019/07/10

リンク

Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう

検索エンジンを何故作ってみたかったかもともとこのブログのコンセプトのNLP的なことで、情報を整理してなにか便利にしたかった(Googleと同じモチベーションの世界の情報を整理する) 4年前にほぼ同じシステムを作ろうとしたとき、500万を超える大量のインデックスを検索するシステムは、数学的な理解度が十分でない＋エンジニアリング力が伴わないなどでギブアップした背景があり、今回再チャレンジしたくなったほぼすべての機能をpure python(+いくつかの例外はある)で実装して、世の中のソフトウェアを使うだけの検索エンジンをやってみたなどではなく、実際に理解して組んでみることを目的としたかった依存パッケージと依存ソフトウェア GitHubのコードを参照してください様々なサイトを巡回する必要があり、requestsが文字コードの推論を高確率で失敗するので、nkf をlinux環境で入れて

lepton9 2019/07/06

リンク

Python pandas パフォーマンス維持のための 3 つの TIPS - StatsFragments

pandas でそこそこ大きいデータを扱う場合、その処理速度が気になってくる。公式ドキュメントではパフォーマンス向上のために Cython や Numba を使う方法を記載している。 Enhancing Performance — pandas 0.16.2 documentation が、軽く試したいだけなのにわざわざ Cythonや Numba を使うのは手間だし、かといってあまりに遅いのも嫌だ。そんなとき、pandas 本来のパフォーマンスをできるだけ維持するためのポイントを整理したい。 pandas に限らず、パフォーマンス改善の際にはボトルネックの箇所によってとるべき対策は異なる。pandas では速度向上/エッジケース処理のためにデータの型や条件によって内部で処理を細かく分けており、常にこうすれば速くなる！という方法を出すのは難しい。以下はこの前提のうえで、内部実装からみ

lepton9 2019/07/04

リンク

「データ分析をやるならRとPythonのどちらを使うべき？」への個人的な回答 - 渋谷駅前で働くデータサイエンティストのブログ

(Background image by Pixabay) 最近また「データ分析をやるならRとPythonのどちらでやるべきか」という話題が出ていたようです。言語仕様やその他の使い勝手という点では、大体この記事に書いてあることを参考にすれば良いと思います。その上で、人には当然ながら趣味嗜好がありますので、個々人が好みだと思う方を使えば良い話ではあります。とは言え、僕自身もクソコードの羅列ながらこのブログにR & Pythonのコードを載せているということもあるので、便乗して今回の記事では僕個人の意見と感想も書いてみようと思います。いつもながらど素人の意見（特にPythonは本業ではない）なのと、自分がメインに使っているRでもtidyverseをほとんど使わないなど割とout-of-dateな使い方をしているということもあり、読んでいておかしなところなどあればどしどしご指摘くださると有難

lepton9 2019/06/28

リンク

ロボットエンジニアのためのgRPC入門 - MyEnigma

WEB+DB PRESS Vol.110 目次目次はじめに gRPCとは? gPRCの特徴 Protocol buffersでRPCを定義することで、様々な言語のサーバ・クライアント実装が自動生成可能通信プロトコルにHTTP/2を使うことで高速化、双方向通信、streaming等を実現通信のデータ量が小さく、データ解釈時の計算時間も短い ProtoファイルでのRPCの宣言 Unary RPC Server streaming RPC Client streaming RPC Bidirectional streaming RPC gRPCのサンプルコード Python Unary RPC Server streaming RPC Client streaming RPC Bidirectional streaming RPC gPRCのgの意味参考資料 MyEnigma Supp

lepton9 2019/06/24

リンク

あらゆるデータセットに使える3つの可視化テクニック | Yakst

Python の可視化ライブラリである Seaborn を利用して表現豊かなグラフを生成するためのテクニックを紹介する記事です。グラフの選択基準としてデータを構成する値が分類のある値かそれとも連続値であるかに注目しており、この記事を通して実践的なテクニックを身につけることができます。可視化は素晴らしいものです。ですが、優れた可視化の実現は悩ましく容易ではありません。また、大勢に対して優れた可視化をプレゼンするような場合には時間と労力がかかりますよね。私たちは棒グラフ、散布図、ヒストグラムの作り方についてはよく知っていますが、それらを美しくすることに対してはそこまでの注意を払っていません。このことは同僚やマネージャーからの信頼に影響します。今あなたがそれを感じることはありませんが、それは起こることです。さらに、私はコードの再利用が重要であることを知っています。新しいデータセットに触

lepton9 2019/06/15

リンク

30歳を過ぎて機械学習エンジニアに転身して半年になったのでこれまでやってきた勉強についてまとめる - Qiita

はじめにどうも、30過ぎて情シスから機械学習エンジニアに転身するという割と変態的なキャリアを形成しているものです。これまでの自分の反省も元にどう勉強してきたか振り返ってみたいと思います。もともと理系出身ですし、IT業界の経験自体はあるので完全未経験というわけでもないので、理系の情報系の学生さんとか、大学卒業してあまり年数が経たない社会人の方であれば参考になる部分があるのではと思います。基本スペック年齢…32 学歴…理系大学院修士修了。物理系(大学初年度の線形代数、微分積分、確率統計ならギリギリなんとかなる。Python 機械学習プログラミングやはじめてのパターン認識を見て数式でつまづくことはほとんどない。) これまでのキャリア…ERPのパッケージ開発1.75年(Javaなど)→ネットワークエンジニア1.75年(ツール作成程度にPython)→社内SE3年(社内システムの企画/保守。

lepton9 2019/06/04

リンク

Python で大量のファイルを並列で速く読み込む - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

lepton9 2019/06/03

リンク

高校生全員が「Python」を履修するかも。「情報科」における学習内容、Pythonやmicro:bitが例示に挙がりましたが致命的なミスが！→訂正されました - パパ教員の戯れ言日記

2019年5月27日追記：この記事のオチに使われている事態は修正された模様です。その点をご勘案の上、お読みください。小学生では「プログラミング的思考」が導入される新学習指導要領ですが、高等学校では更に進みます。高等学校においては、情報科において共通必履修科目「情報Ⅰ」を新設し、全ての生徒がプログラミングのほか、ネットワーク（情報セキュリティを含む）やデータベースの基礎等について学習文科省の資料より教育新聞の記事によれば、情報科は現在、「社会と情報」か「情報の科学」を選択することになっている。全国的に、プログラミングが学習内容にない「社会と情報」のみを開設している学校が多く、情報科の専任教員を配置せずに他教科の教員が兼任で受け持つケースも少なくないとなっていますが、新学習指導要領では、「情報Ⅰ」は必修になるので、全ての学校で指導されるはず。そして、教員用の研修教材として文科省が

lepton9 2019/05/20

リンク

連休中に「ディープラーニングの数学」と「身近な数学」と「Google Colaboratory（Python）」でじっくり数学を復習しました - karaage. [からあげ]

「最短コースでわかるディープラーニングの数学」「身近な数学」を読む GW（ゴールデンウィーク）中は日経BPさんから献本いただいた「最短コースでわかるディープラーニングの数学」（以降ディープラーニングの数学）と、ほけきよ（id:imslotter）さんから献本いただいた「身近な数学」と数学と名のつく本2冊をじっくり読みました。全然違う繋がりで献本いただいた両本ですが、奇しくも同じ「数学」というキーワードがタイトルにあるということで、大胆にもまとめて書評を書いてみたいと思います（笑）また、両者とも付録として、内容の理解を深めるためのPythonコードがGitHubで公開されているのですが「Google Colaboratory」（以降Google Colab）を使うことで、Python環境を構築することなく、手軽にコードを実行できることが分かったので、その活用方法も合わせて紹介しようと

lepton9 2019/05/08

リンク

サーバーレスを使用して最初の６ヶ月で学んだ６つのこと - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こちらの記事は6 things I’ve learned in my first 6 months using serverlessの和訳になります。サーバーレスの世界は適切なツールさえ見つければミドルレイヤーを省けるのでとても良いものです。 10月に行われたServerlessconfの後、自分の会社を全てサーバーレスにすることに決めました。最初の２ヶ月は　Python Flask appにLambdaを導入するのに必死でしたが、そのおかげでより良い方法を思いつきました。そして６ヶ月後、私たちにとって４番目に大きいプロジェクトをサ

lepton9 2019/05/07

リンク

競技プログラミングで使う有名グラフアルゴリズムまとめ

0. はじめに AtCoderなどでは、グラフを扱った問題が多く出るが、その度に一から実装していると時間が掛かりすぎてしまうため、有名なものをあらかじめ持っておく必要がありそう。そこで、Pythonを用いて、ダイクストラ法、ベルマンフォード法、プリム法、クラスカル法、ワーシャルフロイド法を実装した。コメント、意見等ある方は是非! お待ちしてます! 1. ダイクストラ法 1.1. ダイクストラ法(defaultdictで実装) defaultdictで実装すると、リストで実装するよりも、ノード数$N$が大きい際には高速に動作する。ただし、経路復元の関数は、うまく書けなかった......。 (2019/7/6 追記)結局できました。1.1.1. を参照してください。 import collections import heapq class Dijkstra: def __init__(se

lepton9 2019/05/06

リンク

Python at Netflix

By Pythonistas at Netflix, coordinated by Amjith Ramanujam and edited by Ellen Livengood As many of us prepare to go to PyCon, we wanted to share a sampling of how Python is used at Netflix. We use Python through the full content lifecycle, from deciding which content to fund all the way to operating the CDN that serves the final video to 148 million members. We use and contribute to many open-sou

lepton9 2019/04/30

リンク

Pythonと機械学習ができること画像認識を工場の事例で試してみた

工場を想定した事例をPythonで画像認識今回は「工場の制御機器で使われているPLC(シーケンサ)」+「画像認識+測定」含めた事例を想定してPythonで制御してみます。想定しているイメージとしては下記です。「PLC(シーケンサ)で工場内の機器を操作する」+「製品を画像認識で測定する」工程をまとめて管理したいと思います但し、工場の制御機器におけるPLC(シーケンサ)に関しては「ラダー」という特殊なプログラミング言語で書かれていることが大半でPythonでは直接プログラムできません。そのためPLC(シーケンサ)自身にはそのままのラダープログラムで動いてもらいます。ラダーの箇所(製造工程)が終わったらGPIO経由でPythonに通知して画像認識(測定工程)を行います Pythonへの通知方法はGPIOでなくても何でも構いません(筆者が使いやすかっただけです)。 Python側はPLCか

lepton9 2019/04/15

リンク

Python開発環境JupyterLabをローカルマシンにインストールしてみた | DevelopersIO

こんにちは。しもじです。今回は以前からずっと気になっていたPython開発環境、JupyterLabをインストールしてみたので、ご報告したいと思います。 JupyterLabとは? Pythonをお使いの方で Jupyter Notebook をご利用の方もいらっしゃると思います。起動するとwebページ中でノートを記述するようにコードを残すことができ、実行結果と合わせて1ファイルとしてシェア可能なので便利です。 Amazon SageMakerでも利用されています。 Jupyter Notebook Jupyter Notebookを開発、提供しているProject Jupyterが次世代版Jupyter Notebookとして開発しているのがJupyterLabです。 JupyterLab changelogによると、現在v1.0.0へのリリースに向けて作業が進んでいるようです。また

lepton9 2019/04/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (140)

pythonに関するlepton9のブックマーク (492)

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第3週）

新サービスベータテスター募集のお知らせ

今週のはてなブックマーク数ランキング（2026年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (140)

pythonに関するlepton9のブックマーク (492)

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第3週）

新サービス ベータテスター募集のお知らせ

今週のはてなブックマーク数ランキング（2026年5月第2週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス

新サービスベータテスター募集のお知らせ