You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Beautiful Soup とは HTML や XML から狙ったデータを抽出するためのライブラリです。 公式ドキュメントの冒頭の説明を見るとこれは HTML や XML のパーサーそのものではなく、パーサーをラップして扱いやすくするライブラリのようです。 Beautiful Soup is a Python library for pulling data out of HTML and XML files. It works with your favorite parser to provide idiomatic ways of navigating, searching, and modifying the parse tree. It commonly saves programmers hours or days of work. この記事では Beautiful Soup
はじめに browser-use を使う上で詳しいドキュメントがなかったので、自分で使ってみたことをまとめてみました。 browser-use の基礎的なところは以下にまとめてあります。 ブラウザを起動させず、ヘッドレスモードで実行したい BrowserConfigのheadlessをTrueにすることで、ブラウザを起動させず、ヘッドレスモードで実行することができます。 from browser_use.browser.browser import Browser, BrowserConfig browser = Browser( config=BrowserConfig( headless=True, ) ) async def main(): model = ChatOpenAI(model='gpt-4o') agent = Agent( task='東京の天気をGoogleで調べて
ChatGPTなどの大規模言語モデル (Large Language Model; LLM) にプログラミングやリファクタリングをさせる場合、目的に合ったものが作られているかを何らかの方法で検証する必要がある。 プログラムの正しさを完全に保証する方法はないが、ある程度の正しさを継続して担保するための方法を探ってみたので以下にまとめた。 ポイントは、ChatGPTの生成したプログラムの検証にもやはりChatGPTの力を借りることである。 実行可能性と入出力のチェック プログラムを生成するタスクである場合、いつでも「実行できるか?」というチェックが可能である。これは自然言語の生成と大きく異なる点だろう。実行可能性を確かめることは最低限のチェック項目になる。 エラーが出力された場合、自力で修正するか、もしくは、エラーの内容をChatGPTに提示して修正を依頼し、再度実行可能かを確かめる。 入力・
需要あるかなと思って書いたら結構反響あったのでメモ。 まずこれを動かす環境作り。 誰のPCでも動くようにCPU版にします python -m venv venv venv\Scripts\activate pip install opencv-python-headless numpy pillow onnxruntime huggingface-hub以下のスクリプトを作成 ContentSafetyAnalyzer.py import csv import os from pathlib import Path import cv2 import numpy as np from PIL import Image import onnxruntime as ort from huggingface_hub import hf_hub_download # 画像のサイズ設定 IMAGE_
この記事は日本語特化版JP-Extraが出る前のもので、JP-Extra版についての記述はありません。最新の情報は別記事を参照してください。 宣伝 Style-Bert-VITS2という、Bert-VITS2の日本人向け改良版を作っているので、そちらを使うと早いです Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 概要 (この記事は随時いろいろ更新しています、2023-12-21にver 2.3での方法を加筆) 中華コミュニティの最新のTTS手法である、Bert-VITS2 の学習方法ガイドです。日本語・中国語・英語で学習できクロスリンガルで感情リファレンス指定とかも出来るすごいやつです。個人的にはVITSよりも圧倒的に速いスピードで(1時間くらい学習を回すだけで)すぐに質がVITS超えで、文章によって
Python環境でInstagram Graph APIを活用し、インスタ運用を効率化したい Instagram Graph APIで「インスタに写真や動画をアップロードする方法」が知りたい Instagramの運用自動化とは|何ができるの? Instagramの運用自動化とは、これまで手作業で行なってきたインスタ操作をシステムで自動化することを指します。 Instagramの運用自動化は、Meta(旧Facebook)が提供するInstagram Graph APIを活用すると実現でき、具体的に上記の操作が自動化できるようになります。 インスタアプリ上での操作は全て自動化できることが分かりますね。Instagram APIの機能を組み合わせると、インスタデータの自動収集、グラフ作成や結果考察という一連作業もまとめて効率化できるようになります。 Instagram運用の自動化|APIの利用
「gradio」の使い方をまとめました。 1. gradio「Gradio」は、Web UIを簡単に構築できるPythonライブラリです。 2. はじめてのWeb UIの作成Web UIの作成手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール pip install gradio(2) シンプルなWeb UIを作成して起動。 名前を入力して、名前へのあいさつを出力するWeb UIになります。 import gradio as gr # あいさつの関数 def greet(name): return "Hello " + name + "!" # Interfaceの作成 demo = gr.Interface( fn=greet, inputs="text", outputs="text" ) # 起動 demo.launch()3. Interfa
Pythonで仮想環境と言えば、複数の選択肢があります。 選択肢が多すぎて、何を使えばいいのか迷いませんか? そのような場合は、簡単でわかりやすいモノを使いましょう。 venvによる仮想環境は、まさにその条件を満たしています。 本記事の内容 venvとは?venvによる仮想環境の作成venvによる仮想環境の有効化venvによる仮想環境の終了 それでは、上記に沿って解説していきます。 venvとは? venvとは、Pythonに組み込まれている標準モジュールのことです。 標準モジュールであるため、追加で何かをインストールする必要がありません。 これは、簡単でわかりやすいです。 だって、何もしなくてもいいのですから。 では、実際に仮想環境を作成するのはどうなのでしょうか? 「簡単に仮想環境を作成・運用できるのか?」という質問ですね。 はい、これも簡単です。 日常的に利用するコマンドは以下だけ。
「Hugging Faceで公開されているデモ環境のソースが欲しい」 「Hugging FaceへPythonからアクセスしたい」 このような場合には、huggingface_hubがオススメです。 この記事では、huggingface_hubについて解説しています。 本記事の内容 huggingface_hubとは?huggingface_hubのシステム要件huggingface_hubのインストールhuggingface_hubの動作確認 それでは、上記に沿って解説していきます。 huggingface_hubとは? huggingface_hubとは、Hugging Face Hub用クライアントです。 Pythonライブラリであり、PythonからHugging Face Hubにアクセス可能となります。 もちろん、Hugging Faceの運営元が開発しています。 GitHub
PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan
Stable Diffusionに独自データセットで追加学習できるようになるために、まずは既存のデータセットを使用した学習方法を試した。 追加学習の方法には、画像3~5枚を用いてスタイルを学習させるTextual Inversionという方法があるが、ここでは追加学習にデータセットを用いて画像をテキスト条件付きで追加学習する方法を試す。 GitHubのStable Diffusionには追加学習の方法についてドキュメントが用意されていないため、Waifu Diffusionの方法を参考にした。 Waifu Diffusionは、Stable Diffusionをdanbooruデータセットでファイチューニングしたものである。 Waifu Diffusionがどのように追加学習を行ったか手順は書かれていないが、ファインチューニング用のconfigファイルが用意されているため、それを使って、ト
(2022/09/22 17:52更新)画像生成AI「Stable Diffusion」を簡単に利用するための実行環境の1つである「Stable Diffusion web UI」のコントリビューター(開発貢献者)の1人であるAUTOMATIC1111氏が、フォークではないものの同名で「機能全部盛り」なStable Diffusion web UI(AUTOMATIC1111版)の開発を進めています。 GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI https://github.com/AUTOMATIC1111/stable-diffusion-webui ◆目次 1:AUTOMATIC1111版Stable Diffusion web UIでできること・対応していること 2:Google Co
テキストマイニングとは? テキストマイニングとは、テキストをプログラムに分析してもらい、文章の特徴を図や色などで表現することを指します。 SNSで注目されている単語やGoogle検索トレンドなども瞬時で分析でき、データサイエンティストやマーケターなども活用できます。 今回行うテキストマイニングで特に重要な処理が「形態素解析」と呼ばれるもので、繋がっている文章の中から単語を抜き出して意味を割り出す分析方法です。 例えば、私たち人間が「このサイトは非プログラマーが日常業務で使えるシンプルなPythonを紹介するメディアです。」 をという文章を読む時には 「この/サイト/は/非/プログラマー/が/日常/業務/で/使える/シンプル/な/Python/を/紹介/す/る/メディア/です。/」 と区切ることができます。しかし(英語は単語ごとにスペースを開けるのでプログラムで処理をしなくても問題はありませ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く