[B! python] footnoteのブックマーク

きれいなPythonプログラミング（パイソニックなコードを書こう）を読んでみた - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

footnote 2022/03/24

リンク

【Python】形態素解析エンジン MeCabの使い方

自然言語処理（NLP）で用いられる日本語の形態素解析エンジンとして、MeCabが知られています。本記事では、Mecabを使った日本語文章の形態素解析について、 Linux（Ubuntu)へのMeCabおよび辞書のインストールと使い方の基本 Pythonバインディング（mecab-python3モジュール）の使い方を具体例を挙げて解説します。 Pythonバインディングのみ確認したい場合はこちらからご参照ください。 MeCabとは日本語の形態素解析のためのツールです。下記は公式サイトより抜粋 MeCabは京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジンです。言語, 辞書,コーパスに依存しない汎用的な設計を基本方針としています。パラメータの推定に Conditional R

footnote 2022/03/02

MeCab
python

リンク

図とコードで必ず分かるニューラルネットワークの逆伝播

連載目次本稿は、ニューラルネットワーク（以下、ニューラルネット）の仕組みや挙動を、数学理論からではなくPythonコードから学ぶことを目標とした連載（基礎編）の第2回です。「難しい高校以降の数学は苦手だけど、コードを読んでロジックを理解するのは得意！」という方にはピッタリの記事です。前回の第1回では、本連載の目的や特徴を示した後で、「ニューラルネットの訓練（学習）処理を実現するために必要なこと」として、ステップ（1）順伝播： forward_prop()関数として実装（前回）ステップ（2）逆伝播： back_prop()関数として実装（今回）ステップ（3）パラメーター（重みとバイアス）の更新： update_params()関数として実装（次回）。これによりモデルが最適化されるという3大ステップを示しました。前回はこのうちの「ステップ（1）順伝播」まで実装が完了しています。今回

footnote 2022/02/19

[

リンク

Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary

概要 pysocviz が提供する機能 ggplot2 と同じようにできないところとその対策 aes() にクオートされてない変数を指定できない R のように改行できない ggplot2 で使えた色名が使えない ggplot2 で使えた linetype が使えない文字化けの回避 ggrepel パッケージの利用 scales::percent などの単位・スケール指定テーマや色パレットのプリセットを変更したい場合 subtitle/caption が表示されない複数のグラフを連結できない hjust/vjust が使えないグラフ内の図形やテキストの大きさのバランスがおかしい geom_smooth/stat_smooth で一般化加法モデル (GAM) による平滑化ができない geom_quantile の method 指定ができない geom_smooth/stat_smoo

footnote 2021/08/08

リンク

東大が無料公開している超良質なPython/Data Science/Cloud教材まとめ (*随時更新) - Digital, digital and digital

東京大学がちょっとびっくりするくらいの超良質な教材を無料公開していたので、まとめました Python入門講座東大のPython入門が無料公開されています。scikit-learnといった機械学習関連についても説明されています。ホントいいです Pythonプログラミング入門東京大学数理・情報教育研究センター: utokyo-ipp.github.io 東大のPython 本も非常にオススメです Pythonによるプログラミング入門　東京大学教養学部テキスト: アルゴリズムと情報科学の基礎を学ぶ https://amzn.to/2oSw4ws Pythonプログラミング入門 - 東京大学数理・情報教育研究センター Google Colabで学習出来るようになっています。練習問題も豊富です https://colab.research.google.com/github/utokyo-ip

footnote 2021/05/03

リンク

Python自然言語処理テクニック集【基礎編】

自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。環境はPython3系、Google Colaboratory（Ubuntu）で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。機械学習、ディープラーニングは出てきません！テキストデータの前処理が中心です。前処理系大文字小文字日本語のテキストにも英語が出てくることはあるので。 s = "Youmou" print(s.upper()) # YOUMOU print(s.lower()) # youmou 全角半角日本語だとこちらのほうが大事。全角半角変換のライブラリはいくつかありますが、自分はjaconv派。 MIT Licenseで利用可能です。 import jaco

footnote 2021/03/29

リンク

Pythonでデスクトップアプリを簡単に作る方法

PyCon mini Shizuoka で発表する内容のスライドです。 PythonのGUIライブラリPySimpleGUIを使用してデスクトップアプリを作成する方法を紹介します https://shizuoka.pycon.jp/session/dario_okazaki/ code: …

footnote 2020/03/01

python

リンク

まだExcelで消耗してるの？Pythonによる自動集計ガイド基礎編 - Qiita

ちょっとしたデータの加工や集計に、ExcelやGoogle Spreadsheetは便利ですが、それが日常的な作業になってしまったら自動化したいですよね？そこでお勧めなのがpandasです。 Pandasは Python 用のデータ処理パッケージであり、ExcelファイルやCSVなどの表形式データを読みこみ、加工や集計した上で、出力するといったことがプログラムで記述できます。また開発環境を用意しなくとも、Googleが提供する無料の開発環境であるColaboratory上で、すぐに試すことができます。そしてPythonは、Office 98以降20年以降更新されていないVBAに代わる新たなスクリプト言語として、Microsoftが採用を検討しているという話もあります。 ExcelにPython搭載、マイクロソフトが検討。アンケートを実施中まずPandasの全体像を掴んでみる Pand

footnote 2019/03/17

リンク

2018年のPythonプロジェクトのはじめかた - Qiita

4/30 公開 5/1 増補改訂: 大幅加筆しました。この記事では、2018年以降に実現可能になったモダンなPython プロジェクトのはじめかたを整理して紹介します。 PythonにもPipenvという公式推奨の高機能なパッケージマネージャーが登場し、さらに2018年に入ってからの機能向上で、npmやyarnのような開発体験が得られるようになってきました。私はここしばらくはフロントエンドやNode.jsに携わっていて、npmやyarnに慣れきっていたせいか、pipenv導入以前はvirtualenvやpipを組み合わせた開発が面倒で仕方なかったですが、Pipenv導入によって一変しました。これからはPythonのプロジェクトがよりクリーンかつ簡単にはじめられるようになり、開発体験も向上するでしょう。それでは、まずはPythonのインストールからです。 Pythonのインストール P

footnote 2018/05/02

リンク

シェルスクリプトの代わりにPythonを使う - オープンソースこねこね

これまで、開発や運用時に使う、ちょっとしたコマンドラインツール、自動化スクリプトは、主にBashのシェルスクリプトで実装していたのですが、最近このような用途にはPythonを使うようにしています。 Bashスクリプトへの不満スクリプトの実装方針ポータビリティ重視のための縛りPythonプログラミング Tips __future__モジュールでバージョン2、3両方に対応させるバージョン2、3で異なるモジュールを、同じ名前で読み込むバージョン2、3を判別する関数を用意するよく使うスニペット文字に色をつける赤い文字でエラーメッセージを出力して終了する外部コマンド実行するテキストをファイルに出力するファイルに実行権限をつけるスクリプトの同時、多重起動防止するコマンドライン・オプションの解析 HTTPリクエストまとめ Bashスクリプトへの不満 Bashのスクリプト実装にお

footnote 2018/01/20

リンク

Pythonの学び方と,読むべき本を体系化しました2018〜初心者から上級者まで - Lean Baseball

【2021/1/11】2021年版を公開しました【2020/1/9】2020年版もあります, こちらもよろしくおねがいします！【2019/8/12】一部書籍のリンクを最新版に更新しました【2018/12/24追記】最新版を公開しました！「Python 本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで - Lean Baseball」機械学習にWebアプリ,そしてFintechと,今年（2017年）は昨年（2016年）以上にPython界隈が賑やかな一年でした. Pythonでお仕事と野球データ分析を生業としている@shinyorke（野球の人）ですこんにちは. このエントリーでは,そんなPythonの学び方・本が充実した今年から来年（2018年）に移るにあたり, 最短距離でPythonレベルを上げるための学び方・読むべき本の選び方〜2018 をまとめてみました.

footnote 2017/12/24

python

リンク

第１回　環の定義 - Pythonで学ぶ「プログラミング可換環論」

はじめにどうも初めまして、グレブナー基底大好きbot (Twitter:@groebner_basis) です。最近、プログラマ向けの数学のセミナーや勉強会*1が開催されるなど、コンピュータを専門にする人が純粋数学に興味を持つ機会が増えてきました。そこで、この記事では、計算科学とも関わりの深い「可換環論」について、プログラミングの側面から解説していきたいと思います。可換環論とは可換環論は、代数学に含まれる分野で、140年以上の歴史があります。名前の通り、「可換環」と呼ばれる数学的対象を研究する分野です。この可換環については、後々詳しく説明したいと思います。かつての数学者は、計算といえば紙に書く「手計算」が主な手法でした。しかし、近年では、コンピュータの発達に伴い、可換環論の色々な計算が数式処理システム(Computer Algebra System) で実現できるようになりまし

footnote 2017/10/23

math
python

リンク

PythonでWebスクレイピングする時の知見をまとめておく - Stimulator

- はじめに - 最近はWebスクレイピングにお熱である。趣味の機械学習のデータセット集めに利用したり、自身のカードの情報や各アカウントの支払い状況をスクレイピングしてスプレッドシートで管理したりしている。最近この手の記事は多くあるものの「～してみた」から抜けた記事が見当たらないので、大規模に処理する場合も含めた大きめの記事として知見をまとめておく。追記 2018/03/05：大きな内容なのでここに追記します。 github.com phantomJSについての記載が記事内でありますが、phantomJSのメンテナが止めたニュースが記憶に新しいですが、上記issueにて正式にこれ以上バージョンアップされないとの通達。記事内でも推奨していますがheadless Chrome等を使う方が良さそうです。 - アジェンダ - 主に以下のような話をします。 - はじめに - - アジェンダ

footnote 2017/06/26

リンク

機械学習でも定番のPythonライブラリ「NumPy」の初心者向け使い方チュートリアル - paiza times

秋山です。私は主にPythonを使って開発をしているので、以前Pythonの便利なライブラリやフレームワークを紹介する記事を書いたのですが（後でリンク貼りますね）、今回はその記事でも紹介したNumPy（なむぱいと読みます）という数値計算用ライブラリの使い方チュートリアルを書きたいと思います。 NumPyは機械学習やディープラーニングなどを学ぶ上でも前提知識とされることが多いため、これからその辺の分野の勉強をしてみたい人の参考になればと思います。チュートリアルの実行環境は、ブラウザだけでPythonもNumPyも使えるオンラインのプログラミング実行環境「paiza.IO (パイザ・アイオー)」を使っていきます。 ■NumPyにおける配列 NumPyにおける配列は"ndarray"という形式になっていて、このndarrayはいろいろな機能を持っています。まず、普通のリストをndarray

footnote 2017/01/26

リンク

初心者がPythonを覚える為の本の選び方を体系化してみた(2017版) - Lean Baseball

【2020/1/9更新】2020年版もあります, こちらもよろしくおねがいします！【2018/12/24追記】最新版を公開しました！「Python 本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで - Lean Baseball」 ※2017/12/24 最新版をこちらに上げました、この内容は古いのでこちらを見ていただけると幸いです🙇‍♂️ Pythonの学び方と,読むべき本を体系化しました2018〜初心者から上級者までこんにちは.野球(とグルメ)の人です. 会社と仕事はメッチャ楽しいのですが,今日はそれと関係なくPythonの話題を久々に.*1 昨年から,「AI（えーあい）」だの「でぃーぷらーにんぐ」だの「機械学習」といったワードとともにPythonを覚えようとしている方が多いらしく, 何から学ぶべきか何の本がオススメか簡単に覚えて僕もいっちょ前に「えーあい

footnote 2017/01/16

python

リンク

こんな私でもニューラルネットワークをスクラッチで実装できました(30歳男性） - seri::diary

この記事はトレタ Advent Calendar 2016の22日目です。 21日目はswdhの ActiveRecordオブジェクトを関連ごとシリアライズしてデシリアライズするでした。スナップショット的にその時点のモデルを関連モデル含めて保存したい、っていう要望はBtoBやってると結構遭遇しますね。テーブルをちゃんと正規化すればするほど難しくなるやつなのでgem化されてるとありがたいです。さて、この記事ではゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装を読んでpythonに入門するところから初めてニューラルネットワークを実際に実装して見た所感を記述します。平たく言えば読書感想文です。ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2

footnote 2016/12/22

リンク

Pythonで常に意識すべき非直感的な振る舞い

Pythonには独特の仕様がいくつかあります。その中には、他のLLを習得している方ほど気が付きにくく、認識を誤りやすいものがあります。そこで、Pythonで頻繁に用いる仕様の中から、意外と知る機会の少ない仕様を七つ取り上げます。 Pythonって愛嬌がありますよねはじめまして、寺坂です。ビザスクのエンジニアです。業務的にはビザスクのエンジニアの例に漏れず、主にPythonと{ECMA,Type}Scriptを喋ります。私はLinuxユーザーであることも相まって2006年頃に趣味としてPythonを触り始めたときから、なかなかに面倒くさいこの言語に日々愛嬌を感じずにはいられません。とはいえ業務で書くとなると愛嬌では済まされない部分もあります。ビザスクの開発チームでは、管理しているコードのうちプログラミング言語に限れば60%が、そこから{ECMA,Type}Scriptを除く

footnote 2016/11/25

python

リンク

最近、httpstat なるものが流行っているらしい - tellme.tokyo

github.com おそらく先行実装は python で書かれたこれです。 curl にはウェブサイトの応答時間を計測する機能が搭載されており、このツールではそれを利用して出力結果をグラフィカルに表示させています。単なる curl のラッパーのようなツールなのですが、見た目がリッチになるのに加えて、単一ファイルで実行でき python のバージョンに影響されないような工夫がされているのが、受けているポイントのような気がします。このツールを見たとき「Go で書いてみるの良さそう！（この手のツールで単一バイナリになるのは嬉しいですよね）」と思い、休憩時間やお昼休みなどにちまちま書いていたら、二日前に先を越されてしまいました（そりゃそうですよね。なんでもスピードが大事だと痛感）。 github.com また、ついこの間まで 800 Stars くらいだったのですが、ここ1週間で爆発的に伸びて

footnote 2016/09/26

python

リンク

Autogradで微分して、モデルを構築するとこまでの解説 - のんびりしているエンジニアの日記

皆さんこんにちはお元気ですか。 Twitter上で突然賑わった、Autogradについて書いてみることにします。 Autogradとは Autogradについての説明 github.com Autogradはnumpyらしく書くことができ、その記載した式を微分してくれるライブラリです。（in Python）現状、Pythonとtorch(lua)にて実装があるようです。 Theanoとの違いはシンボルを定義せず、数値計算した内容を直接渡すことができます。といったところでしょうか。正直自動微分は新しくないものです。（Theanoがありますので）悲しいことにPythonのAutogradは現状、GPU演算を行うことができません。 testの中にGPU関係の内容はあるようですが、一応featureにGPU operationsのサポートとして掲載されていますね。 Install sud

footnote 2015/11/09

リンク

Latent Dirichlet Allocations の Python 実装 - 木曜不足

LDA とは "Latent Dirichlet Allocation"。文書中の単語の「トピック」を確率的に求める言語モデル。「潜在的ディリクレ配分法」と訳されていることもあるが、その名前だと「それってなんだっけ？」という人のほうが多そうｗ。各単語が「隠れトピック」(話題、カテゴリー)から生成されている、と想定して、そのトピックを文書集合から教師無しで推定することができる。特徴は、果物の apple と音楽の apple とコンピュータ関連の apple を区別することが出来る(ことが期待される)という点。そのために、どのトピックを生成しやすいかという分布を各文章も持つ。細かい話は略。結果の見方としては、定量的にはパープレキシティを見るし(一般に小さいほどいい)、定性的には各トピックがどのような単語を生成するか、その確率上位のものを見てふむふむする。この「各トピックが生成する単語」

footnote 2015/10/14

リンク

はてなブックマーク

タグ

関連タグで絞り込む (23)

pythonに関するfootnoteのブックマーク (32)

お知らせ

月間はてなブックマーク数ランキング（2025年7月）

今週のはてなブックマーク数ランキング（2025年7月第4週）

今週のはてなブックマーク数ランキング（2025年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス