サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
TGS2024
aiacademy.jp
Gradioとは Gradio(グラディオ)とは、機械学習モデルのデモを行うWebアプリケーションを簡単に作ることができるPythonのライブラリーです。Gradioで作成したWebアプリケーションは、HuggingFaceのSpacesでアプリを公開することができます。 (現時点では、Gradio以外にも、Streamlitをサポートしています。) Gradioの公式ページより、デモアプリケーションを確認できますので、一度確認してみてください。 Gradioをインストールする Gradioをインストールは以下のコマンドをpipコマンドでインストールするだけです。 Macですとターミナル、Windowsですとコマンドプロンプトを起動し、次のコマンドを入力し実行(Enter)してください) pip install gradio Gradioの使い方 基本的な使い方は、Gradioを読み込み、
Whisperとは Whisperとは、OpenAIが開発している汎用的な音声認識モデルです。 Web上から収集した68万時間におよぶ音声データで学習され、音声翻訳や言語識別だけでなく、多言語音声認識を行うことができるマルチタスクモデルでもあるモデルになります。 Whisperを用いることで、音声からの文字起こしと音声からの翻訳処理を行えます。 この記事では2つの方法をPythonで解説します。 https://openai.com/blog/whisper/ https://github.com/openai/whisper 日本語の単語誤り率(WER/Word Error Rate)は6.4%とグラフに記載があります。 この数値は、Whisperが対応している他の言語と比較しても、上位に位置しており、高い精度で文字起こしが可能だと解釈できそうです。 また、5つのモデルサイズが提供されて
ChatGPT とは ChatGPT とは、OpenAIが開発したGPT-3という大規模な言語モデルを組み込んだチャットアプリケーション、サービスです。ChatGPTのモデルは、日本語や英語などの文章を入力として受け取り、人間が生成するような自然な文章が生成されるようにトレーニングされています。 2022年12月3日現在は、無料でChatGPTを利用できます。 ※OpenAIとは、人工知能の研究開発を行う非営利団体。OpenAIは本記事で紹介している「ChatGPT」以外にも「GPT-3」や「DALL-E 2」などのAIモデルも開発しています。 参考記事:【初心者向け】GPT-3(Generative Pre-trained Transformer 3)とは ChatGPT で何ができるのか ChatGPTでは、人間が入力した自然言語を理解し、それに応じた回答ができます。 例えば、「AIと
はじめに 本記事は「Google Colab入門(Google Colaboratory)」に移行いたしました。移行先のテキストには、本記事で解説していない内容もわかりやすく詳細していますので、「Google Colaboratory」についてしっかり学びたい方はぜひ一読いただけますと幸いです。 Google Colaboratoryとは Google Colaboratory(グーグル・コラボレイトリーもしくはコラボラトリー)とは、Googleが機械学習の教育及び研究用に提供しているインストール不要かつ、すぐにPythonや機械学習・深層学習の環境を整えることが出来る無料のサービスです。Colab(コラボ)とも呼ばれます。無料で利用する事が出来ますが、Googleアカウントが必要になります。またCPU及びGPU(1回12時間)の環境が利用可能です。 Google Colabを使ってみよう
この記事ではPythonでデータ分析を入門してみたい方向けの記事になります。 本記事の流れとして、データ分析とは何か、データ分析の手順を学び、Pythonのデータ分析ライブラリであるPandasを用いてデータ分析を体験してみます。 データ分析の内容としましては、Pandasを用いて様々な基本統計量を算出します。 さらに、データの欠損値処理をしたり、相関分析なども学びます。 なお、本記事は文章量が多いため、気になった項目のみ読んでいただくか、読者の方のペースで少しずつ読み進めてみてください。またPythonのサンプルプログラムを多く載せていますので、なるべく手を動かして学んで頂けるとより力が付くかと思います。 データ分析とは データ分析とは「データ」を用いて「問題」を解決することです。 ビジネス現場においては、意思決定のためにデータ分析を行います。本来データ分析という言葉の意味合いは広い意味
FastAPIとは FastAPI(読み方:ファストえーぴーあい)とは、Python3.6以降でAPIを構築するためのWebフレームワークです。PythonでWebアプリ開発やAPI開発をする際に利用することになります。Pythonの人気なWebフレームワークにはFlaskやDjangoなどが挙げられますが、近年ではFastAPIが非常に使いやすい事からも注目されています。日本語のドキュメントが充実しているため、公式の日本語ドキュメントを一通り読み込むことである程度使えてしまいます。 https://fastapi.tiangolo.com/ja/ FastAPIの特徴 FastAPIの特徴はいくつか挙げられますが、直感的に理解しやすく、3つに絞るとしたら以下3つを挙げる事が出来ます。 ①公式ドキュメンテーション(日本語)が充実している ②ドキュメントを自動で生成する機能が備わっている ③
1. 特徴量のスケーリングとして、「標準化」と「正規化」に関して学ぶ
1. 検索エンジンから犬と猫の画像を収集し、犬と猫を分類するプログラムを作成する
Pandasとは Pandas(パンダス)とは、データ解析を容易にする機能を提供するPythonのデータ解析ライブラリです。 Pandasの特徴には、データフレーム(DataFrame)などの独自のデータ構造が提供されており、様々な処理が可能です。 特に、表形式のデータをSQLまたはRのように操作することが可能で、かつ高速で処理出来ます。 最新情報に関しては 公式ドキュメントを参考してください。 Pandasを使うことで、下記のようなことが出来ます。 CSVやExcel、RDBなどにデータを入出力できる データ前処理(NaN / Not a Number、欠損値) データの結合や部分的な取り出しやピボッド(pivot)処理 データの集約及びグループ演算 データに対しての統計処理及び回帰処理 なぜPandasを学ぶのか なぜPandasを学ぶのかについて説明します。 機械学習においてデータの
SeleniumとChromeDriver SeleniumはWebブラウザで行うクリック操作やキーボード入力などをプログラム上から自動で操作できるようにしたライブラリで ChromeDriverはChromeブラウザをプログラムで動かす為のドライバーです。 この2つを使うことで、SeleniumでChromeブラウザを操作してログインすることが可能です。 またこの2つを組み合わせて使うことで、次のことが可能になります。 ・スクレイピング ・ブラウザの自動操作(次へボタンや購入ボタンなどを自動で押すなど) ・システムの自動テスト ・非同期サイトのスクレイピング Seleniumのインストールは次のようにターミナルおよびコマンドプロントで打ち込み実行することで、インストール出来ます。 pip install selenium Chrome Driverのインストールは下記リンクから飛べます。
Flaskとは Flask(フラスコ/フラスク)とは、PythonのWebアプリケーションフレームワークで、小規模向けの簡単なWebアプリケーションを作るのに適しています。 Webフレームワークとは、ウェブサイトやウェブアプリケーションを作るための機能を提供し、ウェブフレームワークを使わない時よりもより容易にWebアプリケーションを作ることができるものです。 ちなみに、PythonにはいくつものWebアプリケーションフレームワークがあり、例えば、Djnago(ジャンゴ)やpyramid、bottleなど他にもありますが、この章では、学習コストの低いFlaskを扱って行きます。また近年では、Gradio(グラディオ)と呼ばれる機械学習モデルのデモを行うWebアプリケーションを簡単に作ることができるライブラリも人気です。Flaskの基本を学んだ後に、Gradioも利用してみてください。 Fla
icrawlerとは icrawlerとはウェブクローラのミニフレームワークです。 It supports media data like images and videos very well, and can also be applied to texts and other type of files. と公式に記載があるように、画像や動画などのメディアデータをサポートしており、 テキストやその他の種類のファイルにも適用可能です。 公式マニュアル インストール Macならターミナル、Windowsならコマンドプロンプトを開き、次のコマンドを実行してください。 pip install icrawler Jpyter Notebookのセルや、Colabのセルの中では次のように実行します。 !pip install icrawler 犬と猫の画像をダウンロードする 今回はGoogle検
主成分分析(PCA)とは データセットの次元が多いと、データ分析においても、機械学習においても計算コストが増え、データの様子が分かりにくくなります。 その解決策として、統計や機械学習の分野でよく使われる手法が、主成分分析(Principal Component Analysis:PCA)です。 主成分分析では、特徴量を抽出することによって、データセット内の特徴量を削減することが出来ます。 それによって、3次元以下に次元を削減することが出来れば、データを可視化することもできます。 主成分分析では、特徴量を「選択」するものではなく、新しい特徴量を「抽出」します。 ただし、ここでいう「抽出」とは非可逆的な(一度抽出したら、元のデータセットの特長量には戻らない)ものなので、いくらか失われる情報が出てきます。 主成分分析を理解する 主成分分析とは、データセットの次元を削減するために用いる手法ですが、
分類と回帰に使える評価方法 最後に、分類でも回帰でも使える評価方法の交差検証とグリッドサーチについて説明します。 2つの手法の意味は以下の通りです。 ・交差検証(Cross-validation):個々のモデルの汎化性能を評価する手法 ・グリッドサーチ(grid search):機械学習のハイパーパラメータ探索の方法 それでは、一つずつ詳細を見ていきましょう。 ホールドアウト法 ホールドアウト法は、モデルを作る学習データと、モデルを評価するテストデータに分割して評価します。 データを分けることで、汎化性能(未知のデータに対する性能)を向上させることができます。 もし、未知のデータを予測するにあたり全てのデータを学習データにしてしまうと、過学習(学習データにだけ適合していて未学習のデータに対して正しく答えを出力できない状態)してしまいます。 scikit-learnのtrain_test_s
はじめに この記事を読み進める前に、先にこちらを読み終えてから再度この記事を読んでみてください。 SeleniumとChromeDriver SeleniumはWebブラウザで行うクリック操作やキーボード入力をプログラム上からできるようにしたもので、 ChromeDriverはChromeブラウザをプログラムで動かす為のドライバーです。 この2つを使うことで、SeleniumでChromeブラウザを操作してログインすることが可能です。 またこの2つを組み合わせて使うことで、 ブラウザ画面のスクリーンショット 非同期サイトのスクレイピング 同期サイトのスクレイピング などが可能になります。 Chrome Driverのインストールは下記リンクから飛べます。 Chrome Driver インストールリンク その後、『Latest Release: ChromeDriver 2.42』と書かれた
AI Academy [エーアイアカデミー]はあなたに最適化されたカリキュラムで、Python・機械学習・AIを実践的に学べるプログラミング学習サービスです。Python入門、SQL、機械学習に必要な数学、統計、scikit-learnによる機械学習、Keras+TensorFlowによる深層学習(ディープラーニング)、画像認識、自然言語処理など、人工知能や機械学習に関連するコンテンツが200種類以上のテキストコンテンツから学べます。
このページを最初にブックマークしてみませんか?
『AI Academy | あなたに最適化されたカリキュラムで、Python・機械学習を実践的に学...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く