並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 52件

新着順 人気順

"Work - Python"の検索結果1 - 40 件 / 52件

"Work - Python"に関するエントリは52件あります。 python学習プログラミング などが関連タグです。 人気エントリには 『はじめに — 機械学習帳』などがあります。
  • はじめに — 機械学習帳

    import torch x = torch.tensor([1., -1.]) w = torch.tensor([1.0, 0.5], requires_grad=True) loss = -torch.dot(x, w).sigmoid().log() loss.backward() print(loss.item()) print(w.grad)

      はじめに — 機械学習帳
    • ミクシィの21新卒技術研修の資料と動画を公開します!

      研修資料・動画一覧git研修(動画、スライド)データベース研修(動画、スライド、SQL演習環境)設計・テスト研修(動画、スライド)iOSアプリ開発研修(動画、スライド、リポジトリ)Androidアプリ開発研修(動画、スライド、リポジトリ)フロントエンド研修(動画、スライド、リポジトリ)ゲーム開発(Unity)研修(動画、スライド1、スライド2、スライド3、スライド4、スライド5、リポジトリ)git研修チーム開発でのGit(+GitHub)の使い方とGitの内部的な挙動についての講義と、Git Challengeから厳選した問題を解くハンズオン。 講義部分の動画とスライドを公開しています。

        ミクシィの21新卒技術研修の資料と動画を公開します!
      • 「Python」×「株価データ」で学ぶデータ分析のいろは

        日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。最終回はローソク足とともにこれまでに計算したオシレーターなど一式を1つのグラフで表示する方法や過去の株価データを基にした株価予測の方法を解説します。

          「Python」×「株価データ」で学ぶデータ分析のいろは
        • Pythonプログラミング入門 - 教材・講義動画

          G Suiteのドライブ上の課題にアクセスするにはECCSクラウドメール(G Suite)アカウントが必要です。以下のページからECCSクラウドメールアカウントでG Suiteにログイン後にアクセスしてください。 ECCSクラウドメールアカウントはUTokyo Accountの利用者メニューから申請・取得してください。 UTokyo Account ECCSクラウドメール利用方法 個人のGoogle (Gmail)アカウントでログインしている状態ではアクセスできません。必ずログアウトしてからECCSアカウントでログインしなおしてください。

            Pythonプログラミング入門 - 教材・講義動画
          • 「Python」と「Google Colaboratory」で株価データ分析に挑戦

            「Python」と「Google Colaboratory」で株価データ分析に挑戦:「Python」×「株価データ」で学ぶデータ分析のいろは(1) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。第1回はPythonを実行する環境とデータの前準備について。 はじめに 連載第1回は「Google Colaboratory」でサンプルプログラムを実行するための環境を用意する方法や利用するPythonのライブラリを説明します。「Google Chrome」と「Googleアカウント」を用意して読み進めてください。 なお、連載の趣旨がデータ分析であるため、Pythonの言語仕様や文法の詳細を割愛する場合があることをご了承ください。 Google Colaboratoryの準備 Google Colaboratoryとは、Googleが提供するブラウザ上でPy

              「Python」と「Google Colaboratory」で株価データ分析に挑戦
            • 自然言語を簡単に可視化・分析できるライブラリ「nlplot」を公開しました - ギークなエンジニアを目指す男

              こんにちは。たかぱい(@takapy0210)です。 本日は自然言語の可視化を手軽にできるようにしたパッケージnlplotをPyPIに公開したので、これのご紹介です。 nlplotとは? nlplotで何ができるか 使い方 使用データ 事前準備 ストップワードの計算 N-gram bar chart N-gram tree Map Histogram of the word count wordcloud co-occurrence networks sunburst chart まとめ nlplotとは? 自然言語の基本的な可視化を手軽にできるようにしたパッケージです。 現在は日本語と英語で動作確認済みです。 基本的な描画はplotlyを用いているため、notebook上からインタラクティブにグラフを操作することができます。 github.com (スター★お待ちしております🙇‍♂️)

                自然言語を簡単に可視化・分析できるライブラリ「nlplot」を公開しました - ギークなエンジニアを目指す男
              • プログラミング演習 Python 2021 - 京都大学

                • Pythonの「mplfinance」「pyti」ライブラリで株価データを可視化する

                  はじめに 連載第1回「『Python』と『Google Colaboratory』で株価データ分析に挑戦」では株価データを取得して簡単なグラフで確認しました。連載第2回では、ライブラリを用いて取得した株価データをさまざまな種類のチャートで表示して分析します。 連載の趣旨がデータ分析である以上、Python自体の言語仕様や文法に関しては詳しい説明を割愛する場合があることをご了承ください。また株価分析に関する用語に関しても、分析の手法が分かる程度の説明にとどめていることをご了承ください。 サンプルの実行方法 サンプルファイルを実行する場合は、サンプルファイルのリンクを開いた後に、メニューの「ファイル」から「ドライブにコピーを保存」を選択して保存したコピーを「Google Colaboratory」で実行してください。 Pythonライブラリのインストール Pythonでは外部ライブラリをインス

                    Pythonの「mplfinance」「pyti」ライブラリで株価データを可視化する
                  • 無料でPython/機械学習できるAmazon SageMaker Studio Labとは? Colabと比較

                    連載目次 Python/Rコードの実行や機械学習/データサイエンスの実装を無料でオンライン実行できる環境といえば、Google Colaboratory(略してColab)が特に有名である。2021年12月1日、そのColabに強力なライバルが現れた。「Amazon SageMaker Studio Lab」(アマゾン・セージメーカー・スタジオ・ラボ)だ*1。 *1 日本語では「ラボ」だが、英語では「ラブ(Lab)」と発音するのが普通。「スタジオ」は英語では「ステューディオ(Studio)」。「セージ(Sage)」とは、ハーブや花の名前ではなく「学び経験を積んだ賢者(Wise old man、例えばハリー・ポッターのダンブルドア校長は魔法の賢者)」のことで、賢者は「機械学習モデル」を暗喩すると思われるが、一説にはマーケティング目的で独自用語にするためにランダムな単語生成で命名されたという噂

                      無料でPython/機械学習できるAmazon SageMaker Studio Labとは? Colabと比較
                    • 初心者向けTellus学習コース

                      初心者向けTellus学習コース 本教材は2020年度に提供した教材のため、Tellusの画面やAPIが現在の仕様と異なっている部分がありますのでご注意ください。 2018年度にリリースした衛星データをクラウド上で分析できる日本発の衛星データプラットフォーム「Tellus」は、2019年度にTellusをより多くの方にご活用いただけるようeラーニング講座を応募者への抽選登録制で提供してまいりましたが、2020年3月から、プログラミングと機械学習の基礎が学習できる「Tellus Trainer」と「初心者向け Tellus 学習コース」の2つのeラーニング講座を公開制限なしで提供することとなりました。 本教材「Tellus初心者向け学習コース」では、Python初心者向け教材となる基礎編と、Pythonで学ぶ実践的な衛星データ解析となる地理空間情報解析編(応用編)に分かれます。 基礎編では、

                      • Pythonの「Prophet」ライブラリで株価予測をしてみよう

                        Pythonの「Prophet」ライブラリで株価予測をしてみよう:「Python」×「株価データ」で学ぶデータ分析のいろは(終)(1/3 ページ) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。最終回はローソク足とともにこれまでに計算したオシレーターなど一式を1つのグラフで表示する方法や過去の株価データを基にした株価予測の方法を解説します。

                          Pythonの「Prophet」ライブラリで株価予測をしてみよう
                        • [pdf]Pythonプログラミング入門 - IPP_textbook.pdf

                          • プログラミング演習 Python 2021( Version 2021/10/08 (コラム編) )

                            プログラミング演習 Python 2021 コラム編 京都大学 国際高等教育院 喜多 一 京都大学 情報環境機構 森村吉貴 京都大学 高等教育研究開発推進センター 岡本雅子 Version 2021/10/08 目次 Next Chapter Table of Contents 2 目次 目次 2 0. コラム 0 始まり ........................................................................................................4 0.1 Python は 0 ではじまる .................................................................................. 4 0.2 1 始まりではいけないのか .......

                            • Pythonの「TA-Lib」ライブラリでテクニカル指標の計算と可視化をしてみよう

                              Pythonの「TA-Lib」ライブラリでテクニカル指標の計算と可視化をしてみよう:「Python」×「株価データ」で学ぶデータ分析のいろは(3)(1/2 ページ) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。第3回は複数のテクニカル指標の計算と可視化を説明します。

                                Pythonの「TA-Lib」ライブラリでテクニカル指標の計算と可視化をしてみよう
                              • データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する

                                データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する:「AI」エンジニアになるための「基礎数学」再入門(15) AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は「回帰分析」「最小二乗法」について、図版とPythonコードを交えて解説します。

                                  データ分析やAI予測の基本中の基本「回帰分析」「最小二乗法」の基礎をPythonコードと図で理解する
                                • ExcaliburによるPDFテーブルデータ抽出を動かしてみる - OPTiM TECH BLOG

                                  R&D チームの徳田(@dakuton)です。 前回、2値化画像処理の論文(+実装)について紹介しましたが、今回はこういった2値化の応用例としてExcalibur(PDFからテーブルデータを抽出するためのWeb UIベースのツール)を紹介します。 本記事はOPTiM TECH BLOG Advent Calendar 2020 12/7 の記事としてお送りします。 前回記事はこちら。 tech-blog.optim.co.jp 動かしてみる インストール # https://camelot-py.readthedocs.io/en/master/user/install-deps.html#macos] brew install ghostscript tcl-tk pip install excalibur-py excalibur initdb 実行結果 今回もこちら(Rustの全マク

                                    ExcaliburによるPDFテーブルデータ抽出を動かしてみる - OPTiM TECH BLOG
                                  • Machine Learning  |  Google for Developers

                                    2018 年以来、世界中の何百万人ものユーザーが ML 集中講座を利用して、ML の仕組みと ML がどのように役立つかを学んでいます。このたび、AI の最近の進歩を盛り込んだ、インタラクティブな学習に重点を置いた MLCC の更新版をリリースすることになりました。改善された新しい MLCC について詳しくは、こちらの動画をご覧ください。

                                      Machine Learning  |  Google for Developers
                                    • PythonとOCRエンジンで画像から文字を認識する - Qiita

                                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                                        PythonとOCRエンジンで画像から文字を認識する - Qiita
                                      • TensorFlow, Kerasの基本的な使い方(モデル構築・訓練・評価・予測) | note.nkmk.me

                                        TensorFlow(主に2.0以降)とそれに統合されたKerasを使って、機械学習・ディープラーニングのモデル(ネットワーク)を構築し、訓練(学習)・評価・予測(推論)を行う基本的な流れを説明する。 公式ドキュメント(チュートリアルとAPIリファレンス) TensorFlow 2.0(TF2)でモデルを構築する3つの方法 データの読み込み(MNIST手書き数字データ) Sequential APIによるモデルの構築 訓練(学習)プロセスの設定: Model.compile() 訓練の実行: Model.fit() 学習済みモデルの評価: Model.evaluate() 学習済みモデルを使った予測(推論): Model.predict() 学習済みモデルの保存と復元: Model.save() Functional APIによるモデル構築 Subclassing API(Model Su

                                          TensorFlow, Kerasの基本的な使い方(モデル構築・訓練・評価・予測) | note.nkmk.me
                                        • Python+Tesseractによる画像処理でOCRを試してみた! - 株式会社ライトコード

                                          Tesseract とは? Tesseract は、オープンソースの OCR エンジンです。 「OCR」とは、画像ファイル中の文字を、テキストファイルとして読み込む技術のことです。 Tesseract は、コマンドラインのインターフェースを実装しているため、パソコンへインストールするだけで、OCR ができます。 Tesseract と Python で画像処理するメリットは? Tesseract を Python と組み合わせて利用すれば、画像を前処理してから Tesseract へ渡すことができます。 これにより、OCR の精度が向上し、Tesseract が読み取った文字列を任意の形に処理できます。 例えば、紙に印刷された文書も、Tesseract を利用すれば、テキストデータとして保管できるのです。 さて、今回は、Tesseractを使って、画像処理でOCRを試してみたいと思います!

                                            Python+Tesseractによる画像処理でOCRを試してみた! - 株式会社ライトコード
                                          • 機械学習でFX:Oanda APIを使ってPythonから自動売買する - Qiita

                                            機械学習やDeep Learningで日々腕を磨いている皆さん、一度は競馬やFXの予測で儲けてみたいと思った事はありませんか? 競馬やFXを機械学習やDeep Learningのモデルで予測してみることは非常にいい勉強・経験になるのでオススメです。 この投稿ではPyhonでFXの自動売買を動かすのに最適なOanda APIについて紹介したいと思います。 Oanda APIとは Oandaという会社が提供しているFXの自動売買のためのAPIです。 個人でも利用できるAPIを提供している会社は少ないのですが、OandaはpythonからAPIを利用するためのパッケージ(oandapyV20)も存在しており、pythonユーザにとっては非常に使い易いサービスとなっています。 APIを利用するには、Oanda社で口座を登録して、APIのためのトークンを発行してもらう必要があります。 デモ環境であれ

                                              機械学習でFX:Oanda APIを使ってPythonから自動売買する - Qiita
                                            • Pythonスキーマバリデーションライブラリ比較 (pydantic, marshmallow, attrs, cerberus)

                                              Pythonスキーマバリデーションライブラリ比較 (pydantic, marshmallow, attrs, cerberus) ウェブ API の作成など、外部からやってくるデータを安全に捌く上で、スキーマ定義とバリデーションは非常に重要です。 また、特に Python のような動的型付け言語において、内部でもレイヤをまたぐ場合はきちんと定義されたデータモデルを利用することで、知らない間にデータモデルが変わっていた、というようなケースを防ぐことができます。 Python には標準でスキーマバリデーションライブラリがないため 3rd パーティのものを使うことになりますが、様々なライブラリがあるので比較してみました。 比較対象のライブラリ概要※Python バージョンは 3.9.0 を利用します。 lib                    versionGithub Star (202

                                                Pythonスキーマバリデーションライブラリ比較 (pydantic, marshmallow, attrs, cerberus)
                                              • Pythonの「Plotly」ライブラリで「ゴールデンクロス」「デッドクロス」を可視化する

                                                Pythonの「Plotly」ライブラリで「ゴールデンクロス」「デッドクロス」を可視化する:「Python」×「株価データ」で学ぶデータ分析のいろは(4)(1/2 ページ) 日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。第4回は株価の上昇、下落を示すゴールデンクロスとデッドクロスを描画させる方法を紹介します。

                                                  Pythonの「Plotly」ライブラリで「ゴールデンクロス」「デッドクロス」を可視化する
                                                • 人事異動のデータ化の取り組み 〜 CamelotによるPDFの表データ抽出 - Sansan Tech Blog

                                                  DSOC サービス開発部 GEES/JES/COEグループの松本です。 最近はコロナの影響で巣ごもりをしており、家の庭で芝生を育てています。 色々と手抜きをしてしまったがために生え揃いがまばらで、かわいい反面、芝生の上を裸足で歩けるようになるにはまだまだ時間がかかりそうです。気長に待ってみようと思います。 今日はSansanの機能の一つである、人事異動ニュースを支えるデータ化の取り組みについてご紹介したいと思います。 JES とは Sansanの機能の中に、人事異動ニュースと呼ばれる機能があります。 sin.sansan.com これは、所有する名刺に紐づく人物の人事異動が公開されたときにそれをニュースとして配信し、交換前に所有名刺の情報を最新情報に更新できるという機能です。 ニュースとして提供するために人事異動情報のデータ化を行っていますが、そのシステムがJESと呼ばれるもので、DSOC

                                                    人事異動のデータ化の取り組み 〜 CamelotによるPDFの表データ抽出 - Sansan Tech Blog
                                                  • 【Python】nlplotで企業特徴を把握できたら最&高じゃないですか? - Qiita

                                                    import json import re import time import pandas as pd import requests from bs4 import BeautifulSoup as bs4 from selenium import webdriver base_url = 'https://www.wantedly.com' def scrape_path(url): """ ストーリー一覧ページからスペース詳細ページのURLを取得する Parameters -------------- url: str ストーリー一覧ページのURL Returns ---------- path_list: list of str スペース詳細ページのURLを格納したリスト """ path_list = [] response = requests.get(url) soup

                                                      【Python】nlplotで企業特徴を把握できたら最&高じゃないですか? - Qiita
                                                    • 【Colab】Vision APIでレシートOCR - Qiita

                                                      はじめに GoogleのVision APIを使用してレシートのOCRをしてみました。 言語はPython、環境はGoogle Colaboratoryを使用しています。 実装 入力画像 OCRする画像を表示してみます。 import cv2 import matplotlib.pyplot as plt %matplotlib inline import matplotlib img = cv2.imread(input_file) # input_fileは画像のパス plt.figure(figsize=[10,10]) plt.axis('off') plt.imshow(img[:,:,::-1])

                                                        【Colab】Vision APIでレシートOCR - Qiita
                                                      • pip を使用して TensorFlow をインストールする

                                                        pip を使用して TensorFlow をインストールする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 このガイドは、TensorFlow の最新の安定バージョンを対象としています。プレビュー ビルド(夜間)の場合は、 tf-nightlyという名前の pip パッケージを使用します。古い TensorFlow バージョンの要件については、これらの表を参照してください。 CPU のみのビルドの場合は、 tensorflow-cpuという名前の pip パッケージを使用します。 インストール コマンドのクイック バージョンを次に示します。下にスクロールすると、詳しい手順が表示されます。 Linux python3 -m pip install 'tensorflow[and-cuda]' # Verify the installation: pytho

                                                          pip を使用して TensorFlow をインストールする
                                                        • AIを使った株価予想をPythonのscikit-learnライブラリRandam Forestで試してみた - Qiita

                                                          import ConfigParser import urllib import sqlite3 import datetime import os.path import zipfile import csv from sklearn.ensemble import RandomForestClassifier lscode=[]; ltday=[]; def learn_db_init(): conn = sqlite3.connect("chart.db"); c = conn.cursor(); query = "select scode from chrt group by scode order by scode"; c.execute(query) for row in c: lscode.append(row[0]); query = "select tday from c

                                                            AIを使った株価予想をPythonのscikit-learnライブラリRandam Forestで試してみた - Qiita
                                                          • M1 Mac で Python環境 (Docker + VSCode編)

                                                            はじめに 以前、JupyterLab App で手軽にPython環境を構築する方法を記事にしました。 今回は、Docker と VSCode を使ったPython環境の構築を試します。 それぞれを用いる動機は次の通りです。 Docker: Macシステムと独立してPython環境を構築したい。複数の環境を使い分けたい。 VSCode: 優れたエディタや強力なデバッグ機能を使いたい。 インストール Docker 公式サイトから、Docker Desktop を入手します。M1 Mac の場合は、Mac with Apple chip からダウンロードします。 Rosetta2 (Intel用コードの変換ツール) をインストールします。[1] 下記コマンドをターミナルで実行すると、SLAに合意するか聞かれるので、Aを入力します。 Install of Rosetta 2 finished s

                                                              M1 Mac で Python環境 (Docker + VSCode編)
                                                            • Elements of Statistical Learning: data mining, inference, and prediction. 2nd Edition.

                                                              • pythonでPDFからテキストを抽出してみる(PyPDF2, pdfminer.six) | DevelopersIO

                                                                pdfのデータからepubを作成することを調べていて、pythonのライブラリで比較的簡単にpdfからテキストは抽出できる とアドバイスをもらったので実際にやってみようと思います。 PyPDF2 pdfminer.six この2つがメジャーなようです。 PyPDF2は日本語に対応しておらず、pdfminer.sixは日本語もOKなようですね。 PyPDF2 インストール pipを使ってインストールできます。 pip install PyPDF2 読み込んでみる 2019-11-Chaos_Engineering_Whitepaper のpdfを使用してみます。、 ローカルPCにダウンロードし、以下のコードを実行してみます。 from PyPDF2 import PdfFileReader with open("2019-11-Chaos_Engineering_Whitepaper.pdf

                                                                  pythonでPDFからテキストを抽出してみる(PyPDF2, pdfminer.six) | DevelopersIO
                                                                • PythonでPDFから画像を抽出するもっとも簡単な方法 - Qiita

                                                                  PDFに含まれるすべての画像を抽出する方法です。Python3.6+。Windowsで動かしましたがLinux等でも可能だと思います。 01. 環境 pyMuPDFというライブラリを以下のコマンドで入れます: pyMuPDF は import fitz でインポートできるライブラリです。PDFだけでなくEPUBなども読めます。公式ドキュメントはここ で PyPIの統計情報 を見ると2021/May が最新更新でGithubでは900を超えるスターが付いてます。Python3.6+で動作します。私はWindows上で動かしています。 02. 基本となる考え方 いくつか知っておくべき項目を列挙します。 PDFに入っている画像形式は不定です。どの形式の画像を入れるかはPDF作成者が決められます。jpgやpngが多いですが JPEG 2000(拡張子:jpx) が使われることもあります。 画像抽出

                                                                    PythonでPDFから画像を抽出するもっとも簡単な方法 - Qiita
                                                                  • Splatoon2で表示される文字をフォントから学習してTesseraactでOCRする - 粗大メモ置き場

                                                                    概要 背景 目指すところ 筆者の開発環境 OCR環境を整えてSplatoon2のフォントを学習する TesseractとPyOCR環境のインストール 学習用ツールjTessBoxEditorのインストール Splatoon2のフォントをDLしてくる Splatoon2のフォントを学習する 学習の実行 結果だけ欲しい人用 OpenCVとPILを用いてOCR結果を表示 PyOCRのimage_to_stringでOCRする PyOCRの検出結果を描画する OpenCV画像に日本語テキストを書き込む これらの機能のまとめ その他コツ 適用結果とその比較 スペシャル情報 試合時間・カウント ルール名・タイトル おわりに TODO 超余談:Gistにバイナリを上げる方法 概要 Splatoon2の録画の動画からカウントや時間,スペシャルなどの情報を抽出するためにOCRを行う コンテンツ Tesser

                                                                      Splatoon2で表示される文字をフォントから学習してTesseraactでOCRする - 粗大メモ置き場
                                                                    • Flask matplotlibを使ってグラフを表示する方法(JavaScriptのChart.jsを使ってグラフを描画) - ふたり暮らし

                                                                      はじめに 今回はちょっと寄り道してFlaskでグラフを表示してみます。本当はグラフのアニメーションを作りたかったのですが諦めました。あとで調べたところ、JavaScriptを使ったほうが簡単できれいに出来るみたいだったのでそちらも作成してみました。 動作環境 Windows10 Python 3.7.5 Flask 1.1.1 コード test.py from flask import Flask, render_template, make_response from io import BytesIO import urllib from matplotlib.backends.backend_agg import FigureCanvasAgg from matplotlib.figure import Figure import matplotlib.pyplot as plt i

                                                                        Flask matplotlibを使ってグラフを表示する方法(JavaScriptのChart.jsを使ってグラフを描画) - ふたり暮らし
                                                                      • 2021_summerschool_数理物理 - Google ドライブ

                                                                        メイン コンテンツにスキップキーボード ショートカットユーザー補助に関するフィードバックドライブNew! キーボード ショートカット … ドライブのキーボード ショートカットが更新され、頭文字検索が利用できるようになりましたショートカットを表示バナーを閉じる名前オーナー最終更新ファイルサイズ その他の並べ替えオプションフォルダnotebookオーナーは非公開です2021/08/29—ダウンロードファイルDay1.pdfオーナーは非公開です2021/08/298.8 MB詳細(Alt+→)Day2.pdfオーナーは非公開です2021/08/294.7 MB詳細(Alt+→)Day3.pdfオーナーは非公開です2021/08/296.2 MB詳細(Alt+→)予稿.pdfオーナーは非公開です2022/08/28504 KB詳細(Alt+→)このフォルダにはファイルがありません。このフォルダにフ

                                                                        • OpenCVを使って免許証を角度補正(射影変換)する-二値化の閾値も自動で決定- - Qiita

                                                                          動機 免許証の情報を写真から読み取りたい! 画像処理を楽しみたい! 概要 免許証と同じサイズのカード(nanacoカード)の輪郭を OpenCV で検出し、射影変換することでカードの内容が読みやすいようにしました OCRで内容を読み取る準備ができました(内容の読み取りは次の記事で紹介予定) OCRまでやらないので、サイズが同じnanacoカードで今回は代用 斜め上から撮ったカードを... → こんな感じで角度を補正してカードを表示できるようになりました → 他の類似記事との差別化ポイント カード検出のための**二値化の閾値を動的に決定する**ロジックを入れています (精度がほんの少し良いように見えます) ここはちゃんと検証していないのでお気持ちレベルです。 想定読者 OpenCV で輪郭検出(エッジ検出)してみたい人 写真からカードの情報を読み取りたい人 作業手順 環境構築 二値化 1 輪

                                                                            OpenCVを使って免許証を角度補正(射影変換)する-二値化の閾値も自動で決定- - Qiita
                                                                          • 【自動化】PDFの表をExcelへ(Python)

                                                                            はじめに 今回は、最近、AI等(ディープラーニング)で注目を集めているプログラミング言語である「Python」の面白いライブラリを見つけたので、シェアしたいと思います。 Googleアカウントを持っている方であれば、無料で「Colaboratory」というツールが使用できますので、こちらを使って実装までやってみたいと思います。 ゴール PDFにある表をExcel、もしくはCSVにして抽出する 準備 早速ですが、PDFファイルに以下の左図のような表があった場合、その表をコピーしてExcelにそのまま貼り付けると、以下の右図のようにおかしなことになった経験はありますか? 今回は、こちらの表を解消すべく、「Python」の「tabula」というライブラリを使っていきます。 さて、その前に、Pythonを使うために、エディタを用意しなくてはなりませんが、そこで今回はGoogleのColaborat

                                                                              【自動化】PDFの表をExcelへ(Python)
                                                                            • 自然言語を可視化・分析できるライブラリ「nlplot」はすごいよ - Qiita

                                                                              2021/11/13:本文抽出+ノイズ除去済の「学問ノススメ」 ← 必要な方はこちらをクリック はじめに 前回の記事では「TF-IDF」によるワードクラウド描画にチャレンジしましたが、思い通りにならなかった点(以下)がありましたので、再度チャレンジしました。 scikit-learnの「TfidfVectorizer」というライブラリがうまく使えなかった… nlplot(自然言語可視化・分析ライブラリ)もフルで試せなかった 実力不足のため、苦労しましたが、なんとか任意のテキストデータで「Word Cloud」、「nlplotによる各種可視化」、「(TfidfVectorizer)によるTF-IDF計算」、「TF-IDFによるWord Cloud」が実行できるようになったたので、備忘も兼ね、記事にしたものです。 実行条件など ・Google colabで実行 ・青空文庫の「学問ノススメ」で実

                                                                                自然言語を可視化・分析できるライブラリ「nlplot」はすごいよ - Qiita
                                                                              • pdfplumberでPDFからCSVに変換 - Qiita

                                                                                Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                                                                                  pdfplumberでPDFからCSVに変換 - Qiita
                                                                                • Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)

                                                                                  大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。

                                                                                    Vision API OCR事始め(2):検出されたテキストの階層構造(fullTextAnnotation)

                                                                                  新着記事