サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
デスク環境を整える
myafu-python.com
ExcelのPDF化はExcelの「ファイル」タブからワンクリックで完了しますが、ファイルが沢山あると単純作業でも時間がかかりますよね。大量のPDFをExcelに変換する方法としてはVBAやマクロを使うことが一般的です。でももしあなたのパソコンにPythonがインストールされているなら、たった15行のコードで自動PDF化が出来ちゃいます! 今回は、Pythonライブラリ“pywin32”を使い、指定したフォルダ内にあるExcelファイル全てをPDFファイルに変換するプログラムを作成する方法を紹介します。 pip install pywin32 今回使用するのはPywin32(win32com)というPythonのライブラリです。Pywin32はPythonからWin32 APIへアクセスするためのライブラリで、PythonからExcelの処理を実行することができます。 他にもWordなどO
テキストマイニングとは? テキストマイニングとは、テキストをプログラムに分析してもらい、文章の特徴を図や色などで表現することを指します。 SNSで注目されている単語やGoogle検索トレンドなども瞬時で分析でき、データサイエンティストやマーケターなども活用できます。 今回行うテキストマイニングで特に重要な処理が「形態素解析」と呼ばれるもので、繋がっている文章の中から単語を抜き出して意味を割り出す分析方法です。 例えば、私たち人間が「このサイトは非プログラマーが日常業務で使えるシンプルなPythonを紹介するメディアです。」 をという文章を読む時には 「この/サイト/は/非/プログラマー/が/日常/業務/で/使える/シンプル/な/Python/を/紹介/す/る/メディア/です。/」 と区切ることができます。しかし(英語は単語ごとにスペースを開けるのでプログラムで処理をしなくても問題はありませ
PythonのライブラリPyocrを使い、OCR処理が出来るプログラムを作成してみようと思います。OCRとは『光学的文字認識』の意で、画像中に表示されている文字情報を抽出し、テキストデータへ変換する技術のことです。最近はAI OCRが有名ですね。 もっとも今回はPythonだけではなく、Googleが公開しているOCRエンジン・Tesseractを組み合わせて作ります。 なおOSはWindowsです。 記事の前半でプログラムの作り方を、後半で実際にレシート画像の文字を抽出してみたので、最後までお読みいただけると嬉しいです! ライブラリとTesseractのインストール 全体のコードの解説に入る前に、まず今回使用するライブラリの紹介をします。以下のコードでライブラリ等をインストールしてください。 pip install pillow pip install pyocr tesseract-o
Pythonで作れる代表的なプログラムとしてWebスクレイピングが挙げられます。これは主にライブラリを活用して実行するので、Pythonを覚えたての初心者でも簡単に作ることが出来ます。 今回はPythonを使い、Googleの検索結果に表示された記事のタイトル・URLをExcelに書き出すプログラムの作り方を紹介します。 Webスクレイピングとは? Webスクレイピングとは、Web上のサイトから任意の情報を自動で取得する技術のこと。出したデータを加工してファイルとして出力したり、データベース上にデータを溜めることもできます。 一般的にはホームページから大量の情報を取得したい時に使われますが、今回のように検索エンジンの結果一覧にもスクレイピングを実行することが可能です。 ブログやホームページを運営するうえで欠かせない作業が、ターゲットキーワードによる検索結果の把握です。上位表示されている競合
プログラミングの解説(応用編) このサイトで紹介している基本プロダクト以外にも様々なプロダクトの作り方をnoteでご紹介しています。
このページを最初にブックマークしてみませんか?
『みゃふのPythonプログラミング解説』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く