タグ

Pythonに関するrodoriのブックマーク (114)

  • 2024年最新版:Pythonデータ解析ライブラリ総まとめ - 実践的ガイド - Qiita

    はじめに Pythonのデータ解析エコシステムは日々進化を続けています。2024年現在、効率的なデータ処理、直感的な可視化、高度な機械学習の自動化など、様々な新しいツールが登場しています。記事では、最新のPythonデータ解析ライブラリを紹介し、それぞれの特徴や使用例、実際のユースケース、そして導入方法まで詳しく解説します。 1. データ操作ライブラリ 1.1 Polars: 高速データ処理の新標準 Polarsは、Rustで実装された高速なデータ操作ライブラリです。pandasに似たAPIを持ちながら、大規模データセットでより高速に動作します。 特徴: 高速な処理速度 メモリ効率が良い pandasに似たAPI 使用例: import pandas as pd # サンプルデータを作成 data = { "age": [25, 32, 28, 35, 40, 50], "categor

    2024年最新版:Pythonデータ解析ライブラリ総まとめ - 実践的ガイド - Qiita
  • 法律のデータ構造と検索

    デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

    法律のデータ構造と検索
  • Pythonの独学を支える教科書づくりの裏側、京都大学の喜多教授が授業に込めた思いとは?

    Pythonユーザのためのグローバルイベント「PyCon APAC 2023」が2023年10月27日と28日に、TOC有明コンベンションホールで開催された。1日目の基調講演に登壇したのは、京都大学国際高等教育院の喜多一教授。「Why University Teachers Wrote a Python Textbook?」と題し、大学の授業のために書き下ろされたPythonの教科書執筆の背景を紹介した。プログラミング初心者のつまずきポイントを理解しているからこそ、オリジナルの教科書を作ったという喜多教授。はじめてプログラミングに触れる学生向けの授業と教科書に込めた思いを語った。 Pythonを学び、学生は興味をひろげてゆく 喜多教授がPythonを教えるワケ 京都大学の国際高等教育院で教養教育、特に新入生向けの教育を担っている喜多教授。自身のプログラミングとの出会いは、学生時代の1978

    Pythonの独学を支える教科書づくりの裏側、京都大学の喜多教授が授業に込めた思いとは?
  • Pythonで長期積立投資シミュレーション - Qiita

    目的 Pythonを用いて特定のリターン・リスク(標準偏差)を持つ資産に毎月積立投資を行った場合の長期資産推移を、モンテカルロ法によるシミュレーションで算定する 計算の概要 Pandas、Numpyを用いて、対象期間における月次の対数収益率を、正規分布に従う乱数として生成する 得られた乱数を用いて、毎月積立投資を行った場合の資産推移をパーセンタイル値として出力する (2024/1/29追記) 実行例をWebアプリ化し、手軽に試せるようにしたものを投稿しました。 実行例 今回作成した解析用のクラスであるasset_modelの実行例を示します。 実装方法は後述します。 1. 資産のリターン・リスクを設定する # 期待対数収益率、標準偏差(%,年換算) mu = 8 s = 20 #リターンmu、リスクsのモデルを定義 model = asset_model(mu,s) 対象資産の年次の対数収

    Pythonで長期積立投資シミュレーション - Qiita
  • 「ChatGPT/LangChainによるチャットシステム構築 」という書籍が素晴らしかったのでNode.jsでも書いてみた - selmertsxの素振り日記

    はじめに 「ChatGPT/LangChainによるチャットシステム構築」 というが素晴らしかったので、ちゃんと身につけるために Python だけじゃなくて Node.js でも動かしてみました。同じことをやろうとした人のために、ここにそのときの記録を残します。特に callbacksやmemoryについて、詳細に記載しようと思います。 書籍の説明につながるようなことはできる限り書きません!めっちゃ良書なので、ご興味持っていただけた方は購入してもらえますと 🙏 5章まではPython固有のToolを利用しており、6章の中身は7章とかなり近いところがあるので、7章のプログラムだけここに記載します。LangChainの学習に注力したいので、Serverelss Frameworkに関連するコードは省略しました。また、Momentoや @slack/bolt に関する説明はしません。 プロ

    「ChatGPT/LangChainによるチャットシステム構築 」という書籍が素晴らしかったのでNode.jsでも書いてみた - selmertsxの素振り日記
  • Python Distilledは幅広い人にPythonの基礎を叩き込む本 | フューチャー技術ブログ

    秋のブログ週間2023、3週目・13目です。 Python Distilledというがオライリーから出版されました。作者のDave Beazleyはかなり昔からPythonを使い込んでいる人ですので、このには信頼しかない、と思い読んでみました。Daveは大学の教授をしていて、コンピュータサイエンスで表彰もされている筋金入りです。家PyConでも何度も発表されているようです。Python歴は27年でOSSとしてはC/C++をラップして他の言語で使えるようにコードを生成するSWIGはすでに20年以上の歴史がありますし、パーサージェネレータのPLYとSLY。curioというコルーチンのライブラリなどを作っています。僕は以前、SWIGのドキュメント翻訳をしてCマガジンに特集記事を書かせていただいたこともあり、僕の大学時代の顔写真がSWIGのウェブサイトに公開されていたりします。 そういう世

    Python Distilledは幅広い人にPythonの基礎を叩き込む本 | フューチャー技術ブログ
  • AIを語りたいなら最低限Pythonをやるべき。足し算より簡単なんだから|shi3z

    昨日は新潟県長岡市に行って、市役所の職員向けと、一般向けに二回の講演を行った。 市役所の職員からの質問事項をよく読むと、ChatGPTを闇雲に何にでも使おうとして苦戦している姿が見てとれた。 たとえばこんな感じだ。 ⚪︎時に東京駅につく新幹線を予約したいとChatGPTに言ったが、公式サイトをチェックしろと言われた 我々からすればその回答は当たり前なのだが、闇雲になんでもChatGPTでやろうとするとこうなってしまうという典型的な例だった。当たり前だが、その目的ならえきねっと一択だ。 ChatGPTには限界がある。しかも低い。 だから通常はPluginと組み合わせたり、プログラムから呼び出したりするという「工夫」が必要になる。 GPTを使うプログラムを書くのはものすごく簡単だ。 たぶんプログラムの世界でも最も簡単な部類だろう。 たとえば僕がプログラムでGPTを使おうかなと思った時、こんなふ

    AIを語りたいなら最低限Pythonをやるべき。足し算より簡単なんだから|shi3z
  • [NumPy超入門]平均/中央値/最頻値や分散/標準偏差を求めてみよう

    連載概要 連載はPythonについての知識を既にある程度は身に付けている方を対象として、Pythonでデータ処理を行う上で必須ともいえるNumPyやpandas、Matplotlibなどの各種ライブラリの基的な使い方を学んでいくものです。そして、それらの使い方をある程度覚えた上で、それらを活用してデータ処理を行うための第一歩を踏み出すことを目的としています。 前回はある行列の逆行列、行列式、固有値と固有ベクトルを求めるお話をしました。今回は多数のデータがどんな特徴を持っているのかを調べるのに役立つ基統計量をNumPyで取り扱う方法を見ていきます。 基統計量とは 基統計量とは、何らかのデータセットがあったとき、それらにはどのような特徴があるかを示す値のことです。というと分かりにくいのですが、平均値、最大値、最小値、標準偏差と分散などの値を用いることで、データがどのように分布している

    [NumPy超入門]平均/中央値/最頻値や分散/標準偏差を求めてみよう
  • Microsoft、ExcelでPythonを使える「Python in Excel」のプレビュー版を公開

    MicrosoftExcelPythonを使える「Python in Excel」のプレビュー版を公開:ExcelのセルにPythonコードを入力し、高度な分析が可能 Microsoftは、「Microsoft Excel」でプログラミング言語「Python」を利用できる「Python in Excel」のパブリックプレビュー版をリリースした。

    Microsoft、ExcelでPythonを使える「Python in Excel」のプレビュー版を公開
  • 機械学習エンジニアに爆速でなるための教材集 - Qiita

    0. はじめに 昨今のAIDXブームの影響で、機械学習、深層学習(ディープラーニング, Deep Learning) への注目は増すばかりですが、初学者の方にとって機械学習を学ぶハードルは依然高い状態かと思います。 機械学習、特にディープラーニングを習得するには学ぶべきことが多く、また分野によっては難易度が高いということもあり、学んでいる途中で挫折してしまうという人も多いという印象があります。 そこで記事では、これから機械学習を学びたい方が自学自習する際の助けになるようにと、有用な自習コンテンツをまとめました。 記事では、機械学習エンジニアとして実務に参画できるレベルを目指して、コンテンツを収集しました。よって機械学習の理論やライブラリに加え、社会実装する上で付随して必要となるソフトウェアエンジニアリングのスキルも含めています。 コンテンツについては、適宜追記していく予定です。 対象

    機械学習エンジニアに爆速でなるための教材集 - Qiita
  • ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp

    いまからわかる!ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って⁠⁠、請求書の構造化データを抽出する 先月、OpenAIからFunction calling(関数呼び出し)機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。 今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAI2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。 外部ツールを呼び出して質問に答えるチャットボットを作成する 自然言語を内部APIの呼び出しやSQLに変換する テキストから構造化データを抽出する たとえば天気予報と血液型

    ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp
  • なんかいけそうな気がしたので Code Interpreter でシュッと Web アプリつくってもろた|bbz

    ちゃっす(/・ω・)/ 今日も ChatGPT Code Interpreter さんと戯れていましたの。 で、タイトルの通りなのだけれど、仕様書書いて渡したら Web アプリシュッと作ってくれんじゃね?( ・ω・) という闇の遊戯をした。 という話。 目標実行や指示はすれどもワタクシは一切コードを書かぬ!! 普通にエラー修正とか自分でやった方が早いけどやらぬ!! 全てを ChatGPT への指示で完結する!! で、納品されたもの(/・ω・)/ 納品物 トップページ 登録画面 ログイン画面 Activity 一覧 Activity 修正 レポート画面 すごない?( ・ω・) やったこと~ChatGPT との対話を残すでござる( ・ω・) ※ ChatGPT Code Interpreter Plugin が使えないと同じ事はできないぞ☆ 仕様書を提供しますので、 仕様にそった Flask

    なんかいけそうな気がしたので Code Interpreter でシュッと Web アプリつくってもろた|bbz
  • ChatGPT、データ分析もできちゃうのか 新機能「Code interpreter」でデータ読み込み、Python実行が可能に アイデア続々

    OpenAIAIチャットサービス「ChatGPT」に「Code interpreter」という機能のβ版を追加した。これによりファイルをアップロードできるようになった他、ChatGPT上でのPythonプログラムの実行にも対応。Twitter上ではさまざまな利用方法が考え出されている。 Code interpreterは有料プラン「ChatGPT Plus」で提供している機能。アカウントの設定画面から有効化すると使える。これまではユーザーが文字で入力し、ChatGPTが結果を文字で出力していた。しかし同機能を使えばCSV形式のデータやPDFファイル、画像などをアップロードして分析させられる。結果は文章だけでなく画像でも出力できる。 利用例 Twitterの上手な運用方法を聞いてみる 例として、筆者の個人Twitterアカウントのリツイート数やフォロワー数などをまとめたデータをアップロー

    ChatGPT、データ分析もできちゃうのか 新機能「Code interpreter」でデータ読み込み、Python実行が可能に アイデア続々
  • WebブラウザでPythonが動作する!PyScriptの詳解 | gihyo.jp

    鈴木たかのり(@takanory)です。今月の「Python Monthly Topics」では、Webブラウザ上でPythonが動作するPyScriptについて、内部構造なども含めて詳しく解説したいと思います。 PyScript公式サイト(https://pyscript.net/) Warning:PyScriptは現在非常に活発に開発が進んでいるプロダクトのため、将来的にこの記事のサンプルコードが動かなくなる可能性があります。記事執筆時点では最新バージョンであるPyScript 2023.03.1で動作確認しています。うまく動かない場合はPyScriptの公式ドキュメントなどを参照してみてください。 PyScript - PyScript documentation PyScriptとは? PyScriptは公式サイトに「Run Python in Your HTML」と書いてあると

    WebブラウザでPythonが動作する!PyScriptの詳解 | gihyo.jp
  • Pythonistaの使い方まとめ

    iPhone及びiPad向けのPython開発アプリ「Pythonista」の使い方についてまとめている記事です。 基的な使い方やライブラリの使い方について紹介します。 ※リンク先がないものについては順次追記予定。 サイト中では単にPythonistaと記載しておりますが、Pythonista3+Python3で開発しております。 Pythonistaのダウンロード方法と始め方対応機種はiOSのみPythonistaが対応しているのはiOS(iPhone/iPad)のみです。 Androidには対応していません。 ただし、AndroidはPydroid/QPython(無料)で開発ができます。 また、Windows版やMac版もありません。 最もパソコンは普通にPythonをインストールできますし、PyCharmなどよりもっと便利なエディタがあるので問題ないですね。 ダウンロード方法Py

    Pythonistaの使い方まとめ
  • 8.1. datetime — 基本的な日付型および時間型 — Python 3.6.5 ドキュメント

    datetime — Basic date and time types¶ Source code: Lib/datetime.py The datetime module supplies classes for manipulating dates and times. While date and time arithmetic is supported, the focus of the implementation is on efficient attribute extraction for output formatting and manipulation. See also Module calendarGeneral calendar related functions. Module timeTime access and conversions. Module z

    8.1. datetime — 基本的な日付型および時間型 — Python 3.6.5 ドキュメント
  • Pandas ピボットテーブル(クロス集計)の作成(pivot_table) - ビジPy

    ピボットテーブルは、データの集計や分析において、大変重要なツールになります。ピボットテーブルでは、縦軸と横軸、集計値を選択し、クロステーブルで集計結果をすることにより、様々な角度からデータを確認することができます。 上のピボットテーブルでは、縦軸に顧客、横軸に商品、集計値として売上を表示しています。このようにクロステーブルで結果を表示することによって、どの顧客のどの商品が売れているか、売れていないかを視覚的に確認することができます。 この記事では、Pandasにおけるピボットテーブルの作成方法について、確認していきましょう。

    Pandas ピボットテーブル(クロス集計)の作成(pivot_table) - ビジPy
  • Python初心者向け:クロス集計の際の注意点を解説

    Python初心者の方向けに、ピボットテーブルの使い方の詳細を基から解説します。まずは基的な使い方をおさらいしてから、クロス集計時に適用する関数の変更や、項目ごとに変更する方法をお伝えします。これを読むことで、ピボットテーブルが使いこなせるようになります。 はじめに 今回はpandasのpivot_table()メソッドを使った集計を扱います。以前、このブログでもpivot_table()を扱ったことがありますが、今回は注意点や集計時のちょっとしたTipsをご紹介します。 やりたいこと サンプルデータ 今回は次のような2つのデータを扱うことにしましょう。1つは、会員データを記録した会員マスタで各会員がどの店舗のお客様であるかがわかるようになっています。もう一つは受注データです。受注データではどの会員が、どのような商品カテゴリで、いくら買ったか、が月ごとにわかるようになっています。ここで

    Python初心者向け:クロス集計の際の注意点を解説
  • Pythonista3|iPhoneやiPadでPythonを動かす

    iPhonePythonが出来たら…!」という願望を叶えてくれる、そんなアプリが「Puthonista3」。 記事では、Pythonista3で出来ることと、その使い方について紹介します。 Pythonista3とは? Pythonista3とは、App Storeで入手出来るアプリです。iPhoneiPadPythonを実行することができます。 iPhoneでプログラミング出来るアプリというのは数多く存在しますが、実用的な開発まで出来ないのが普通です。 しかしこの驚異的なアプリ「Pythonista3 」は「ちょっとプログラミングをしてみよう」の域を遥かに超えた、プロも使える優れもの。 有名なデベロッパーのジョン・グルーバーさんは次のように言っています。 “Pythonista is a really cool app, but how did it make it into

    Pythonista3|iPhoneやiPadでPythonを動かす
  • 新入社員のみんな、「ChatGPT×Python」で鬼にならないか?|ピーナッツ

    ChatGPT当にヤバい。 断言する。新卒がこれを使いこなせば、今職場で「優秀」とされている5-6年目くらいの先輩なら余裕で出し抜ける。鬼になれる。 筆者はメーカー社員なので、メーカーの新入社員がChatGPTを使って鬼になる方法を1つ提案したい。 「ChatGPT×Python」である。 Pythonとは、ご存知のとおり物理シュミレーションからデータサイエンス、機械学習までカバーする汎用性をそなえたプログラミング言語だ。何でもできるわりには書ける人がなぜか少なく、いまだにスキルとして重宝されている。 そんなPythonChatGPTを使おう。 ChatGPTを使えば、上司から求められるアウトプットを一瞬で出すことができる。それに対してフィードバックをもらい、それも一瞬で打ち返すことができる。 「あいつ"Python書ける"だけじゃないんだよな。こっちが言ったこと正確に理解するし、そ

    新入社員のみんな、「ChatGPT×Python」で鬼にならないか?|ピーナッツ