本文「argparse」を検索 - はてなブックマーク

1 - 23 件 / 23件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

argparseの検索結果1 - 23 件 / 23件

dbtで見やすいER図を生成する - yasuhisa's blog
- 196 users
- www.yasuhisay.info
- テクノロジー
- 2024/02/03
背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するかどうやってER図を見やすくするかまとめ背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに
- dbt
- あとで読む
- 設計
- DB
- markdown
- UML
- database
2024年のPythonプログラミング - Uzabase for Engineers
- 171 users
- tech.uzabase.com
- テクノロジー
- 2024/02/02
ソーシャル経済メディア「NewsPicks」で推薦や検索などのアルゴリズム開発をしている北内です。Pythonは頻繁に新機能や便利なライブラリが登場し、ベストプラクティスの変化が激しい言語です。そこで、2024年2月時点で利用頻度の高そうな新機能、ライブラリ、ツールなどを紹介したいと思います。この記事では広く浅く紹介することに重点を置き、各トピックについては概要のみを紹介します。詳細な使用方法に関しては各公式サイト等での確認をおすすめします。なお、本記事ではOSとしてmacOSを前提としています。環境構築 Pythonの環境構築はpyenvとPoetryの組み合わせがもっとも標準的でしょう。以下の手順でpyenvとPythonをインストールできます。 brew install pyenv # Bashの場合 echo 'eval "$(pyenv init -)"' >> ~/.ba
ChatGPTプログラミングのすすめ
- 81 users
- zenn.dev/nobucshirai
- テクノロジー
- 2024/06/10
ChatGPTなどの大規模言語モデル (Large Language Model; LLM) にプログラミングやリファクタリングをさせる場合、目的に合ったものが作られているかを何らかの方法で検証する必要がある。プログラムの正しさを完全に保証する方法はないが、ある程度の正しさを継続して担保するための方法を探ってみたので以下にまとめた。ポイントは、ChatGPTの生成したプログラムの検証にもやはりChatGPTの力を借りることである。実行可能性と入出力のチェックプログラムを生成するタスクである場合、いつでも「実行できるか？」というチェックが可能である。これは自然言語の生成と大きく異なる点だろう。実行可能性を確かめることは最低限のチェック項目になる。エラーが出力された場合、自力で修正するか、もしくは、エラーの内容をChatGPTに提示して修正を依頼し、再度実行可能かを確かめる。入力・
Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
- 65 users
- tech.mirrativ.stream
- テクノロジー
- 2024/03/04
こんにちはハタです。最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります構築していく上で色々試行錯誤したのでそれが紹介できればなと思っていますどんなものを作ったか前提知識: 配信基盤前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージまとめ We are hiring! どんなものを作ったか今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行うシス
A search engine in 80 lines of Python
- 43 users
- www.alexmolas.com
- テクノロジー
- 2024/02/08
February 05, 2024 · 26 mins · 4727 words Discussion on HackerNews. Last September I hopped on board with Wallapop as a Search Data Scientist and since then part of my work has been working with Solr, an open-source search engine based on Lucene. I’ve got the basics of how a search engine works, but I had this itch to understand it even better. So, I rolled up my sleeves and decided to build one fr
Flutterアプリの定期リリースを支える自動化 - Fast DOCTOR Technologies TECH BLOG
- 42 users
- tech.fastdoctor.jp
- テクノロジー
- 2023/10/06
本稿では、ファストドクターのモバイルアプリのリリースフローを整備した取り組みについてご紹介します。モチベーションファストドクターのモバイルアプリは、2022年夏にFlutterでのフルリプレースを実施し、それ以降は機能の開発が完了次第随時リリースをするという戦略を取っていました。この戦略はシンプルであり、開発に関わっているステークホルダーが少ない状況下でうまく機能していました。しかし、組織の拡大に伴い以下のような問題が発生するようになりました。複数機能の開発スケジュールの調整をしたり、バックエンドのリリース・QAとの整合性を取ったりという必要性が増し、調整コストが肥大化リリースが不定期なため、いつPull Requestをマージすれば良いか分からずopenされたままのPull Requestが多数この状況を改善するために、以下の要件を念頭に定期的なリリースとそれを支える仕組みを
WSL2でSakana AIを試してみる｜noguchi-shoji
- 38 users
- note.com/ngc_shj
- テクノロジー
- 2024/03/21
「進化的モデルマージにより日本語数学LLMとして構築したEvoLLM-JPは、数学のみならず、日本語の全般的な能力に長けている」らしいEvoLLM-JPを試してみます。追記（2024/3/22） 10Bのモデルですが、torch_dtypeを"auto"からtorch.bfloat16に変更すると、推論のスピードが改善しました。モデルEvoLLM-JPは、3種提供されています。今回は３つとも試します。 - 大規模言語モデル SakanaAI/EvoLLM-JP-v1-10B : MICROSOFT RESEARCH LICENSE TERMS SakanaAI/EvoLLM-JP-v1-7B : MICROSOFT RESEARCH LICENSE TERMS SakanaAI/EvoLLM-JP-A-v1-7B : Apache License, Version 2.0 ※画像言語
- ai
- あとで読む
生成AI と Wikipedia記事で子供向けお仕事提案bot を作ってみよう(Azure OpenAI + RAG) - ENGINEERING BLOG ドコモ開発者ブログ
- 28 users
- nttdocomo-developers.jp
- テクノロジー
- 2023/12/21
NTT コノキューに出向中の澤山です。今年の7月にドコモから、コノキューにやってきました。この記事は、NTTドコモアドベントカレンダー2023 21日目の記事です。この記事では、Wikipedia記事と Azure OpenAI API、既存のモデルの3つを用い、RAG(Retrieval-Augmented Generation)のためのデータ作成と、RAGを活用した子ども向けお仕事提案botを作ります。 (記事の情報は2023/11月のものです。) 生成AI / ChatGPT の大流行子供のための、生成AI活用方法、ってある？子供向けお仕事提案チャットボットを作ってみる全体像ステップ1 Wikipedia + Azure OpenAI service でお仕事情報をまとめよう Wikipedia 記事からのお仕事情報・概要の抽出お仕事情報・概要に基づく、情報の整理
- Azure
- あとで読む
- AI
dbtのモデルとTableau上で使われているWorkbookの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog
- 18 users
- www.yasuhisay.info
- テクノロジー
- 2023/10/08
3行まとめ dbtのジョブが失敗した際やテーブルの廃止検討の際に、BI上のどのダッシュボードで利用されている(データリネージ)か知るのは重要です TableauのGraphQLのAPIからWorkbookとBigQuery上のモデルの埋め込みの関係を知ることができます dbtのモデルとTableau上で使われているWorkbookの依存関係をexposureとして出力するスクリプトにより、dbtのジョブの失敗やテーブルの廃止がTableauのダッシュボードに与える影響などを調べやすくなりました 3行まとめ背景課題: dbtのexposureとしてダッシュボードを手動で記入し続けるのは難しい解決方法: TableauのGraphQLのAPIを使い、 dbtのexposureを自動生成する発展的話題背景業務において、DWHやデータマートの生成にdbtを、BIツールとしてTablea
- dbt
- tableau
- BigQuery
- あとで読む
- データ
- API
ローカルマルチモーダルを簡単に使えるAPIを公開。LLaVA-Next(旧1.6)でAPIサーバを構築｜めぐチャンネル
- 16 users
- note.com/ai_meg
- テクノロジー
- 2024/04/15
簡単に使えるAPIサーバがほしい前述のように、時間も無いということで、画像アップロードとチャット機能だけに縛った簡単なAPIサーバを実装しています。LLaVAのオリジナルコードにはChatの過去ログ機能もあるので有効に活用します。 LLaVA-NEXTの導入GiyHubからクローンします。 git clone https://github.com/haotian-liu/LLaVA.git cd LLaVA環境に合わせて構築Install Packageに従えば簡単に環境は構築できるはずです。トレーニングはしないのでadditional packagesは不要です。 conda create -n llava python=3.10 -y conda activate llava pip install --upgrade pip # enable PEP 660 support pip
Terraformで構築する機械学習ワークロード（Batch on Fargate編） | DevelopersIO
- 14 users
- dev.classmethod.jp
- テクノロジー
- 2023/09/18
こんちには。データアナリティクス事業本部インテグレーション部機械学習チームの中村です。今回も「Terraformで構築する機械学習ワークロード」ということで、前回の記事ではLambdaを使いましたが、今回はその処理をBatch on Fargateに載せてみたいと思います。前回記事は以下です。構成イメージ構成としては以下のようなものを作成していきます。前回との違いとしては、まずLambdaの代わりにBatch on Fargateを使う点です。 Fargateのタスク(ジョブ)上のコンテナイメージで物体検出モデルの一つであるYOLOXを動かしていきます。また、それ以外にもBatchを使用する場合は、S3イベントとBatchの間にEventBridgeが必要となります。動作環境 Docker、Terraformはインストール済みとします。 Terraformを実行する際の
Pythonクイックリファレンス第4版
- 7 users
- www.oreilly.co.jp
- テクノロジー
- 2024/06/05
本書はPythonの機能を十分に活用するためのリファレンスです。チュートリアルとしての「Pythonを使ってみる」、型アノテーションや文字列といった「Python言語と組み込み機能」、ファイルやテキスト、時間の操作、数値処理などをまとめた「Pythonの標準ライブラリと拡張モジュール」、HTTPの処理や構造化テキストを学ぶ「ネットワークとWebプログラミング」、バージョン移行などに関する「拡張、配布、バージョンのアップグレードと移行」という5部構成となっています。Pythonを本格的に学びたい人から、さらなるスキルアップを目指したい人まで、Pythonを最大限に活用するための有益な情報がぎっちり詰まった1冊です。Python 3.11対応。正誤表ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷
- O'Reilly
- Python
Dataflow with Python practical setup guide - LegalOn Technologies Engineering Blog
- 6 users
- tech.legalforce.co.jp
- テクノロジー
- 2024/07/31
こんにちは、LegalOn Technologies検索・推薦チームの志水です。私たちのチームでは Elasticsearch へのデータのインデキシングをCloud PubSub を queue として挟んで非同期にしており、その処理にDataflowを活用しています。Dataflow(=Google managed Apache Beam) はサーバーレスでスケーラブルなデータ処理を得意としています。 Python を用いたDataflowの活用については、例えばこちらの記事が網羅的です。この記事では似たような観点に加え、Docker上で動かす工夫やintegration testの工夫も合わせて書いていければと思います。全体像パッケージ構成 pyproject.toml (Poetry) Pipeline Integration test DoFnのテスト DirectRun
- docker
- python
BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 - yasuhisa's blog
- 6 users
- www.yasuhisay.info
- テクノロジー
- 2024/06/19
背景 & Disclaimer DuckDB 概念や代表的なユースケース使ってみる 1週間〜一ヶ月などある程度の期間、分析で使いたい場合便利なCLIツールとして使う所感参考 Dataflow 代表的なユースケース具体例参考背景 & Disclaimer BigQueryは非常に便利で、BigQueryにさえ上がってしまえばSQLで巨大なデータを簡単に相手にできますとはいえ、BigQueryに行きつくまでが大変な場合もありえます例: 個人情報を含むsensitiveなデータで、BigQueryに気軽に上げられないケース一時的であっても、相談なしにその手のデータを気軽にアップロードするのはやめてください... 数万件程度であれば手元のエクセルで開いて、問題ない行/列だけに絞る、ということもできるが、もっと量が多いデータだとそういうわけにもいかない。そもそも分析はSQLでやり
[LangGraph] 自律的にプログラムを実行するLLM Agentを作るための60行スクリプト
- 5 users
- zenn.dev/sqer
- テクノロジー
- 2024/04/29
60行スクリプトシリーズ第二弾。前回はこちらこの記事はMultiAgent作成フレームワーク「LangGraph」に興味がある人が手っ取り早く動かしてみることを目標にした記事です。この記事を見てできること指定のお題に対して、関数で定義したツール実行（Web検索など）をする。実行結果を元に答えを返す。答えがわかるまでツール実行を繰り返す。このワークフローの拡張性も意識して、組み込みのワークフローは利用しない方針で作成しています。まずはセットアップ # 必要なライブラリをインポート import argparse from langchain_community.tools.tavily_search import TavilySearchResults from langchain_openai import ChatOpenAI from langgraph.checkpoin
- Python
HuggingFaceとDeepSpeedで実践継続事前学習
- 5 users
- zenn.dev/elith
- テクノロジー
- 2024/03/26
はじめに株式会社Elithの大森一祥です。AIテックカンパニーの一員として、お客様の課題をAIを駆使して解決しています。大規模言語モデル(LLM)が人間と匹敵する性能を発揮することもあり、弊社には多岐にわたるプロジェクトの依頼が寄せられています。最近は、情報漏洩のリスクを回避するため、独自のLLMの開発を希望されることが多いです。このような案件では、一般に公開されたモデル(ローカルLLM)を利用します。ローカルLLMを活用して課題を解決する方法として、以下の4つが挙げられます。プロンプトエンジニアリング：LLMに特定の出力を生成させるための入力文の工夫する手法 RAG：外部の文章データベースから、質問に類似した文章を取り出しLLMの入力として用いる手法インストラクションチューニング：ユーザの指示に沿った出力を生成することを目的としたチューニング手法継続事前学習：LLMモデルに対
dbt x snowflakeで使っていないテーブルとビューを安全に一括で削除する - CARTA TECH BLOG
- 5 users
- techblog.cartaholdings.co.jp
- テクノロジー
- 2024/01/15
概要こんにちは、4月に新卒で株式会社CARTA HOLDINGSに入社し、現在はCARTA MARKETING FIRMのデータエンジニアをやっているharukiです。私たちのチームでは、dbtとsnowflakeを使ってデータ基盤を構築しています。データ基盤を使うエンジニアが増え、dbtのモデル数が増えてきたのですが、その中には使わなくなり削除したdbtモデルもありました。 dbtモデルを削除しても、Snowflake上の対応するテーブルやビューは自動的には消えないため、使われないsnowflake上のテーブルやビューが増えて目立つようになってきました。そこで、dbtモデルとしては削除されているが、snowflake上に残ってしまっているテーブルやビューを一括削除できる処理を考えました。想定読者 dbtとsnowflakeを使ってデータ基盤を開発している方この記事を読んでわか
- あとで読む
Command-R (35B)をMac(MLX)でローカルで動かしてAPIサーバにする
- 4 users
- zenn.dev/romot
- テクノロジー
- 2024/04/08
Command-R Cohere Command-RというLLMが話題です。 35Bモデルと104Bモデル(Command-R+)があるようです。 128kのコンテキストウインドウで、ツールやRAGでの使用を想定したモードもあるようです。実験用であればローカルで使えそうです。これをmacOS(AppleSilicon)でローカルで使ってみます。 MLXで使う MLXというAppleSilicon用のMLフレームワークで使えるモデルがあります。今回は4bit量子化モデルを使ってみます。 Command-R 4bit Command-R 2bit Command-R+ 4bit 使い方はシンプルです。 import argparse from mlx_lm import load, generate def main(): parser = argparse.ArgumentParser
OptunaHubに登録された自然勾配法ベースの最適化アルゴリズム「INGO」の紹介 - Preferred Networks Research & Development
- 4 users
- tech.preferred.jp
- テクノロジー
- 2024/08/29
はじめに 7月からOptunaHubという新しいOptuna向け機能共有プラットフォームのベータ版を提供中です。今回は新たに導入されたImplicit Natural Gradient Optimization (INGO) [1]という自然勾配法ベースの最適化アルゴリズムについて紹介します。INGOは進化計算における強力な手法である CMA-ES (共分散行列適応進化戦略) に近いアルゴリズムで、本記事の実験ではCMA-ESよりも良い性能を示しました。 OptunaHubに登録されたINGOアルゴリズムこの節ではOptunaHubに登録したINGOのSamplerを実際に実行してみます。今回の実装はYuhei Otomoさんに協力して頂きました。実装はこちらで見ることができます。このSamplerの実装にあたり、簡単な単体テストでの動作確認やベンチマーキング結果が論文の主張と整合して
- あとで読む
StreamlitでEDINETから有価証券報告書をダウンロードして分析するWEBアプリをサクっとつくろう
- 4 users
- zenn.dev/akb428
- テクノロジー
- 2024/08/20
参考文献 ※1 EDINET API機能追加に係る利用者向け説明会資料 ※2 EDINET API仕様書 Version2 ①会社名の選択まず会社一覧及び、会社のEDINETコードが必要になってきます。これについてはAPIで取得する方法はなく公式サイトからZIPを落としてくるかここからプログラム的に自動でダウンロードする必要があります。今回は手動であらかじめダウンロードしたものを使います。公式サイトからダウンロードすると毎回リンクが変わる、上記の直接リンクだと固定という謎仕様のようです（ドキュメントにもそうかいてある） ZIPを展開するとShift-JISのCSVが手に入ります。文字コードに注意しましょう。EDINETからダウンロードするCSVはUTF16なのにこっちはShiftJISなのです。中身は上記のようなもになっています。末尾に0がついているものの証券コードも入ってい
- あとで読む
一枚絵があれば動く。Talking-Head-Anime-3のインストールして、ポーズデータでスムーズに動かすーAPI編｜めぐチャンネル
- 3 users
- note.com/ai_meg
- テクノロジー
- 2024/02/22
夜宣伝 1枚の立ち絵イラスト用意があればモデリングやパーツ分け不要ですぐにVTuberになったりできます！ Talking Head Anime 3 SWhttps://t.co/hKO1VfCDmz Talking Head Anime 3 SW Plus (NDI, Spout出力対応＆個人商用利用可ver.) https://t.co/7Gy2oAoIG3 https://t.co/y0amBEd2V2 — あわいろ (@pale_color) January 30, 2024 Talking Head Anime 3に需要はあるのか手軽に動かしたい、2Dや3Dの制御は大変、キャプチャして変換をするにはちょっと作業が重い、など、とにかくかんたんに動くキャラが欲しいという方々向けです。手や足は動きませんし、物理演算をするわけでもないので髪の毛は揺れませんが、上半身は十分にスムースに動い
Whisperを使ってYouTube字幕ファイルの作成がこれほど簡単だったなんて！ - uepon日々の備忘録
- 3 users
- uepon.hatenadiary.com
- テクノロジー
- 2023/10/19
少し前のエントリでYouTubeから音声データをダウンロードするといった内容のことをやっていたのですが、それならその音声データをWhisperに入力し、生成された音声解析のテキストデータをYouTubeの字幕ファイルに変えてみたらどうなるかなと思っていました。Whisperのログ出力はほぼそのままでも字幕ファイルフォーマットであるSRTファイルに近い出力フォーマットになっているからです。 uepon.hatenadiary.com ただ、そのまま取り出した文字データはタイムコードのないモノになるので、後で処理を行うと面倒なことになります。今回はWhisperを使用し、ログファイルとして出力されたデータをファイル化してYouTubeでも使用可能な字幕データにしてやろうという試みです。 Whisperとは？ Whisperは```OpenAI社のは音声認識と機械翻訳のサービスになります。詳細は
GPT4-V API 使い方 / OpenAI GPT-4V API / GPT-4V API - Qiita
- 3 users
- qiita.com/takumikan
- テクノロジー
- 2023/11/08
OpenAI GPT-4VのAPIが利用可能になったとのことなので早速使ってみた。 2023/11/10 : Google colabを利用した動作方法を追記しました 2023/11/10 : requestsのinstallをしていない場合のエラー対応について追記しました 2023/11/07 : 最初の記事を投稿しました入力画像の準備今回は、ChatGPTのDALLE-3で作成した以下のねこの画像を使用した。ファイル名: cat.png ソースコードソースコード等は、GitHubにあげました。フォルダ構成等はこれを参考にしてください!! コード全容 import argparse import base64 import requests from settings.setting import API_KEY def parse_args(): parser = argpa