本文「python check if key not in dict」を検索

1 - 40 件 / 50件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

python check if key not in dictの検索結果1 - 40 件 / 50件

OpenAI API のファインチューニングガイド｜npaka
- 347 users
- note.com/npaka
- テクノロジー
- 2023/08/23
1. ファインチューニングの利点ファインチューニングの利点は、次のとおりです。 (1) プロンプトよりも高品質な応答 (2) プロンプトに収まりきらないより多くの例の適用 (3) プロンプトの短縮によるトークン数 (コスト) の節約 (4) プロンプトの短縮による処理時間の短縮モデルは膨大な量のテキストで事前学習されており、このモデルを効果的に利用するため、プロンプトに手順や応答の例を指定する手法が使われます。この例を使用してタスクの実行方法を示すことを「Few-Shot」と呼びます。ファインチューニングで、プロンプトに収まりきらないより多くの例で学習することにより、さまざまなタスクでより良い結果を達成できるようになります。プロンプトに多くの例を指定する必要はなくなります。これによりトークン (コスト) が節約され、処理時間も短縮されます。 2. ファインチューニングの使用料金ファイン
- ChatGPT
- あとで読む
- AI
- OpenAI
- 学習
- api
- 自然言語処理
- GPT
- 機械学習
- LLM
GPT in 60 Lines of NumPy | Jay Mody
- 53 users
- jaykmody.com
- テクノロジー
- 2023/02/10
January 30, 2023 In this post, we'll implement a GPT from scratch in just 60 lines of numpy. We'll then load the trained GPT-2 model weights released by OpenAI into our implementation and generate some text. Note: This post assumes familiarity with Python, NumPy, and some basic experience with neural networks. This implementation is for educational purposes, so it's missing lots of features/improv
- Python
- あとで読む
- ML
- NLP
- 自然言語処理
- 機械学習
型安全かつシンプルなAgentフレームワーク「PydanticAI」の実装を解剖する - ABEJA Tech Blog
- 40 users
- tech-blog.abeja.asia
- テクノロジー
- 2024/12/12
はじめにこちらはABEJAアドベントカレンダー2024 12日目の記事です。こんにちは、ABEJAでデータサイエンティストをしている坂元です。最近はLLMでアプローチしようとしていたことがよくよく検証してみるとLLMでは難しいことが分かり急遽CVのあらゆるモデルとレガシーな画像処理をこれでもかというくらい詰め込んだパイプラインを実装することになった案件を経験して、LLMでは難しそうなことをLLM以外のアプローチでこなせるだけの引き出しとスキルはDSとしてやはり身に付けておくべきだなと思うなどしています（LLMにやらせようとしていることは大抵難しいことなので切り替えはそこそこ大変）。とはいうものの、Agentの普及によってより複雑かつ高度な推論も出来るようになってきています。弊社の社内外のプロジェクト状況を見ていても最近では単純なRAG案件は減りつつあり、計画からアクションの実行、結果
- Pydantic
- あとで読む
- ai
- python
- 人工知能
- ツール
Security best practices when using ALB authentication | Amazon Web Services
- 38 users
- aws.amazon.com
- テクノロジー
- 2024/08/16
Networking & Content Delivery Security best practices when using ALB authentication At AWS, security is the top priority, and we are committed to providing you with the necessary guidance to fortify the security posture of your environment. In 2018, we introduced built-in authentication support for Application Load Balancers (ALBs), enabling secure user authentication as they access applications.
- alb
- あとで読む
- AWS
- security
ChatGPT Retrieval Pluginに任意のベクトル検索エンジンProviderを実装する - エムスリーテックブログ
- 37 users
- www.m3tech.blog
- テクノロジー
- 2023/03/27
Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。検索とGoが好きです。エムスリーではChatGPTの可能性にいち早く注目して活用を検討している段階ですが、本格的なデータ投入にはまだ懸念もあり、セキュリティチームと検討を進めている段階です。そんな中で個人または組織のドキュメントのセマンティック検索と取得を可能にするChatGPTプラグイン「ChatGPT Retrieval Plugin」が登場しました。 github.com 情報検索好きとしては黙っていられず、外部公開用のエムスリーAI・機械学習チームのメンバー紹介ドキュメントを使ってローカルで試してみました。 # 用意したドキュメント中村弘武は東京都在住で、エムスリーという企業で働いでいます。エムスリーの検索基盤を主に担当しています。また、書
- ChatGPT
- AI
- plugin
- あとで読む
第752回　RISC-VのシングルボードコンピューターであるVisionFive 2を使ってみる | gihyo.jp
- 31 users
- gihyo.jp
- テクノロジー
- 2023/03/01
今回はStarFive Technology製のRISC-Vシングルボードコンピューター（SBC）であるVisionFive 2にDebianをインストールして、その性能を計測してみましょう。 RISC-VとVisionFive 2 RISC-V（りすく・ふぁいぶ）は今もっとも熱い命令セットアーキテクチャーです。2010年頃に生まれたRISC-Vは、オープンな規格という強みを活かしてどんどんエコシステムを構築し、今では様々な企業がRISC-Vに本格的に手を出す状況になっています。AMD64/Intel 64やARMには性能も普及度合いもまだまだ及びませんが、今の勢いを維持できれば近い将来その状況は変わってくるでしょう。本連載でも2018年ぐらいから、RISC-Vの記事を何度か取り上げていました。第505回：「オープン規格の新しい命令セットアーキテクチャRISC-V入門　ツールチェインを
- RISC-V
- あとで読む
- linux
- hardware
- review
- article
- gadget
複数の AWS アカウントの AWS Security Hub 検出結果を Google BigQuery と Google DataPortal(DataStudio) により可視化した話 - Adwaysエンジニアブログ
- 30 users
- blog.engineer.adways.net
- テクノロジー
- 2022/03/25
こんにちは、インフラの天津です。今日は複数アカウントの AWS Security Hub 検出結果の可視化についてお話したいと思います。前提モチベーション AWS Security Hub とは構想ツール・サービスの選定検出結果データのエクスポートについて可視化用データベース（またはクエリサービス）と可視化ツールについて構築全体像検出結果データエクスポート検出結果データの S3 -> GCS への転送と BigQuery へのインポート Security Hub からエクスポートしたデータには BigQuery のカラム名に使用できない文字(以下禁則文字)が使用されている件自動判別で生成されたスキーマでインポートした際に INTEGER 型のカラムに STRING 型のデータが入ってくることがありインポートエラーが発生する件 AWS アカウントデータの S3 ->
Cloud Composerにデータマート集計基盤を移行しました - ZOZO TECH BLOG
- 28 users
- techblog.zozo.com
- テクノロジー
- 2023/02/13
こんにちは、MLデータ部データ基盤ブロックの奥山（@pokoyakazan）です。趣味の範疇ですが、「ぽこやかざん」という名前でラジオ投稿や大喜利の大会に出たり、「下町モルモット」というコンビで週末に漫才をしたりしています。私は普段、全社データ基盤の開発・運用を担当しており、このデータ基盤はGCPのBigQuery上に構築されています。そして、データ基盤内の各テーブルは、大きく分けて以下の2種類に分類されます。システムDBのデータやログデータなどが、特に加工されることなく連携されている一次テーブル一次テーブルから必要なデータを使いやすい形に集計したデータマート本記事では、後者のデータマートを集計するジョブを制御するワークフローエンジンを、DigdagからCloud Composerに移行した事例について紹介します。Cloud Composerとは、GCPにてApache Airflo
- あとで読む
Data Contractに向けたProtocol Buffersの調査 - yasuhisa's blog
- 28 users
- www.yasuhisay.info
- テクノロジー
- 2024/08/13
背景: データ品質を担保するにはデータソースの品質が重要データソースの品質を担保する手段としてのData Contract Data Contractの表現方法の一つとしてのProtocol Buffers Data ContractとしてProtocol Buffersを使うデータの入出力を一箇所に集約、Protocol Buffersで抑えるパターンストレージのスキーマをProtocol Buffersで抑えるパターン発展的な話題 & 読書会の案内参考文献背景: データ品質を担保するにはデータソースの品質が重要私はデータエンジニアをしており、DWHやデータマートのデータ品質について考えることが多い。BigQueryなどにデータが取り込まれた後のレイヤリングやテスト、改善に向けたデータ品質の可視化について、以前発表した。データが取り込まれた後の整理は進んでいるものの、やは
- データ
- data
- あとで読む
- 統計
Azure OpenAI Service の Assistants API でデータ分析 - Taste of Tech Topics
- 19 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/04/24
こんにちは、igaです。最近は気温の上下が大きいので、服装選びが大変ですね。今回は、Azure OpenAI Servce Assistants APIを使ってみました。 Azure OpenAI Servce Assistants APIに横浜市の人口データを投入して、人口の増減がどう推移しているのか自動で分析させてみました。 Azure OpenAI Servce Assistants API Azure OpenAI Servce Assistants APIとは Azure OpenAI Servce Assistants APIは、2024年4月現在パブリックプレビューとして利用できる機能です。 learn.microsoft.com Azure OpenAI Servce Assistants API（以降、Assistantsと表記します）により、Azure OpenAI
- OpenAI
- Azure
- 人工知能
- api
- AI
- あとで読む
はじめての自然言語処理 Fusion-In-Decoder でクイズに答えるモデルを作る | オブジェクトの広場
- 13 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/09/07
今回は Fusion-In-Decoder を使ってクイズに答えるモデルを作ります。以前から Wikipedia 等の外部情報を参照できるテキスト生成モデルを試してみたいと思っていました。Fusion-In-Decoder の発表は 2020 年なので少し前のモデルですが、T5 ベースで手軽に試せるサイズ感ですので、日本語で試してみましょう。 1. はじめに今回紹介する Fusion-In-Decoder（以下、FiD ）1 は Meta AI (当時は Facebook AI Research) が発表した Open Domain question Answering タスクを解くテキスト生成モデルです。じつは、以前から外部情報を参照できるテキスト生成モデルを試してみたくて2、 Google の RETRO3 の論文を読んでたんです。なのですが、外部情報のサイズ感が 1000 B
- NLP
- 自然言語処理
- 機械学習
- 勉強
- language
- 言語
- 学習
SRE2.0: LLMサービスの信頼性を測る新しい評価指標の紹介 | メルカリエンジニアリング
- 12 users
- engineering.mercari.com
- テクノロジー
- 2025/06/16
こんにちは。Fintech SREの佐藤隆広(@T)です。この記事は、Merpay & Mercoin Tech Openness Month 2025 の11日目の記事です。 Google社が提唱し、Site Reliability Engineering Bookによって広く知られるようになったSREの信頼性マネジメントは、開発と運用の関係性を再定義し、SLI/SLOとエラーバジェットに始まり、Availability・Latency・エラーレート・トラフィック・リソース飽和度・耐久性といったような指標で補強されてきました。ところが近年、大規模言語モデル（LLM）の進歩が著しく、サービスにLLMを利用する機会が増えることによって、プロンプトを数行変えただけで回答品質が変動する Latencyやエラーレートが良好でも幻覚（ハルシネーション）が急増するモデルの軽微なアップデートで回
- LLM
- SRE
- AI
- あとで読む
はじめての自然言語処理 spaCy 3.0 で Transformer を利用する | オブジェクトの広場
- 10 users
- www.ogis-ri.co.jp
- テクノロジー
- 2021/06/29
今更ですが今年の2月に spaCy 3.0 が公開されました。 3.0 で導入された新機能の中で目玉と言えるのは、やはり Hugging Face Transformers (以下、単にTransformers) のサポートや PyTorch, Tensorflow との連携になるでしょう。今回はその辺りを実際に学習を動かしながら紹介したいと思います。 1. はじめに今回は今年の2月に公開された spaCy 3.0 の話です。 spaCy は第4回でも紹介しましたが、研究者向けというよりは自然言語処理アプリ開発者向けのオープンソース自然言語処理ライブラリになります。日本語を含めた様々な言語の学習済みモデルが存在しており、 spaCy をインストールして、学習済みモデルをダウンロードするだけで、分かち書き、品詞や依存関係の推定、単語や文の類似度の判定など様々な機能を使用することができます。
- *あとで読む
- あとで読む
Solving Quantitative Reasoning Problems With Language Models
- 9 users
- storage.googleapis.com
- テクノロジー
- 2022/07/01
Solving Quantitative Reasoning Problems with Language Models Aitor Lewkowycz∗, Anders Andreassen†, David Dohan†, Ethan Dyer†, Henryk Michalewski†, Vinay Ramasesh†, Ambrose Slone, Cem Anil, Imanol Schlag, Theo Gutman-Solo, Yuhuai Wu, Behnam Neyshabur∗, Guy Gur-Ari∗, and Vedant Misra∗ Google Research Abstract Language models have achieved remarkable performance on a wide range of tasks that require
- 論文
- AI
データカタログにConnected SheetsやLooker Studioの情報を取り込んでレポートのデータソースを追跡する - LayerX エンジニアブログ
- 9 users
- tech.layerx.co.jp
- テクノロジー
- 2024/06/24
はじめにこんにちは！バクラク事業部機械学習・データ部データチームの@TrsNiumです。弊社では、データの意味やデータの質、データの利活用を一元的に管理することを目的として、データカタログソリューションの一種であるOpenMetadataを導入しました。OpenMetadataを利用することで、様々な種類のデータベースやBI、CRMと連携し、データの管理と可視化を効率化しています。弊社では主にBIツールとしてLooker Studioを使用しています。また、Google SheetsはConnected Sheetsの機能を使い、BigQuery上に構築されたデータ基盤のデータを用いて簡易的にデータ分析や可視化を行うツールとして利用しています。しかし、これらのツールはOpenMetadataのビルトイン機能ではサポートされていませんでした。そのため、データ変更時の影響範囲の把握や
TypedDicts are better than you think
- 9 users
- blog.changs.co.uk
- テクノロジー
- 2024/10/11
TypedDict was introduced in PEP-589 which landed in Python 3.8. The primary use case was to create type annotations for dictionaries. For example, class Movie(TypedDict): title: str movie: Movie = {"title": "Avatar"} I remember thinking at the time that this was pretty neat, but I tend to use dataclass or pydantic to represent 'record' type data. Instead I use dictionaries more as a collection, so
- Python
- 開発
FastAPI SQLModel 入門 - Qiita
- 9 users
- qiita.com/sand
- テクノロジー
- 2022/08/30
SQLModel はPythonコードから SQL databases と会話するためのライブラリです。ここでは FastAPI での使われ方を見ていきますが、FastAPIとは独立したものとして設計されています。 SQLModelはFastAPI の作者が自ら作成しており、SQLAlchemy と Pydantic の両方との互換性を保っています。Pydantic はデータ検証のためのPythonライブラリです。Pythonのtype hintが使われます。ですからPydanticクラスはAPIの入り口であるパスオペレーション関数で使われることが一般的です。過去記事「FastAPI と SQL Databases(SQLAlchemy)」でFastAPIで SQLAlchemy を使ってSQL Databaseを扱う方法を述べましたが、SQLAlchemy と Pydantic の2重
- python
Velja
- 8 users
- sindresorhus.com
- テクノロジー
- 2022/04/25
Open links in a specific browser or a matching native app. Easily switch between browsers. In-depth review of Velja. Trusted by almost 130K users. You may also like my Default Browser app. Example use-cases Use Safari as your primary browser but open Google Meet links in Chrome Open links to figma.com directly in the Figma desktop app Open links to the internal company website in Firefox Open Zoom
- browser
- software
- mac
Welcome GPT OSS, the new open-source model family from OpenAI!
- 8 users
- huggingface.co
- テクノロジー
- 2025/08/06
GPT OSS is a hugely anticipated open-weights release by OpenAI, designed for powerful reasoning, agentic tasks, and versatile developer use cases. It comprises two models: a big one with 117B parameters (gpt-oss-120b), and a smaller one with 21B parameters (gpt-oss-20b). Both are mixture-of-experts (MoEs) and use a 4-bit quantization scheme (MXFP4), enabling fast inference (thanks to fewer active
- 人工知能
Bucket full of secrets – Terraform exfiltration | Mercari Engineering
- 8 users
- engineering.mercari.com
- テクノロジー
- 2024/03/16
Background At Mercari, we utilize many microservices developed across multiple different teams. Each team has ownership over not only their code, but also the infrastructure necessary to run their services. To allow developers to take ownership of their infrastructure we use HashiCorp Terraform to define the infrastructure as code. Developers can use Terraform native resources or custom modules pr
- Terraform
- あとで読む
BigQueryでSendGrid Activityをセキュアに管理する仕組みを構築した - エムスリーテックブログ
- 7 users
- www.m3tech.blog
- テクノロジー
- 2023/07/24
エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。検索とGoが好きです。今回はBigQueryでSendGrid Activityをセキュアに管理する仕組みを構築したのでその紹介をします。SendGridを使い始めた方や、今後メール送信データを活用していきたい開発者の方は必見です。 SendGridのActivityを管理したい SendGridでActivityを保管するアーキテクチャ SendGridのEvent Webhookの基本 SendGridのEvent Webhookをセキュアに受け取る仕組み Signed Event Webhook Requests カテゴリの付与メール送信後にすぐにイベントをチェックするまとめ We are hiring !! SendGridのActivityを管理したい弊社
Ordering Movie Credits With Graph Theory
- 6 users
- endcrawl.com
- テクノロジー
- 2021/12/22
At Endcrawl we're always thinking about the hard work that goes into making film and TV, and how that work translates to on-screen credits. A feature film may involve thousands of people, hundreds of distinct job titles or "roles," and dozens of departments. So there's plenty for a producer to worry about, like: Did we forget or misspell a name? Is this the correct way to credit that role? Do all
はじめての自然言語処理 DeepSpeed-Chat による RLHF の紹介 | オブジェクトの広場
- 6 users
- www.ogis-ri.co.jp
- テクノロジー
- 2023/07/14
今回は DeepSpeed-Chat による RLHF のご紹介です。正直、データセットや計算資源の都合もあり、とりあえず動かしてみました！的な話にはなりますが、RLHF の効果が実際に確認できるか見てみたいと思います。 1. はじめに今回は DeepSpeed-Chat1 を使って RLHF を試してみたいと思います。RLHF は Reinforcement Learning from Human Feedback の略で文字通り「人からのフィードバックを用いた強化学習」ということですね。OpenAI が InstructGPT(ChatGPT の元になったモデル)2 で使ったことで注目された手法になります。 LLM がらみで何か記事にしたいと思いつつ、日々新たな LLM が発表されている昨今に、隔月＆内容が実時間から月単位で遅れ気味wの本連載です。「どうしたもんかな。。。」と悩みに
- 機械学習
- 言語
【GROMACS】Umbrella samplingによるMD simulation 【In silico創薬】【SMD】 - LabCode
- 6 users
- labo-code.com
- テクノロジー
- 2025/07/08
Windows 11 Home, 13th Gen Intel(R) Core(TM) i7-13700, 64 ビットオペレーティングシステム、x64 ベースプロセッサ, メモリ：32GB Umbrella Samplingの概要と目的Umbrella Samplingは、分子がめったに起こさないような状態変化（たとえば、タンパク質同士が離れるなど）を詳しく調べるための計算手法です。通常の分子動力学（MD）では、エネルギー的に安定な状態にとどまりやすく、重要な変化が起こる確率が低いため、十分な情報が得られません。たとえば、タンパク質AとBがくっついている状態から、少しずつ離れていく様子を観察したいとき、まずAとBを少しずつ引き離すSteered Molecular Dynamics（SMD）などのシミュレーションで、さまざまな距離の構造を取得します。その中から、0.5nm、0.7
AWS公式のECSハンズオンがとても良かった!! - Qiita
- 5 users
- qiita.com/yuki_ink
- テクノロジー
- 2025/06/02
はじめにお疲れ様です。矢儀 @yuki_ink です。こちらのAWS公式ハンズオンをやってみました。 ECSとFargate/EC2を利用した環境構築から、CI/CDパイプラインを利用したデプロイまで、一通り体験できる素晴らしいハンズオンでした。次のようなみなさんにおすすめです。 ECSを知識として知ってはいるが、実際に触ったことがないコンテナの何が優れているのか、実感を持っては理解できない CI/CDパイプラインでコンテナをデプロイしてみたいハンズオンで構築する環境の構成イメージはこちら。 1. VS Code Serverの構築このハンズオンでは、開発環境として Visual Studio Code Server (VS Code Server) を利用するとのことで、まず、CloudFormationでVS Code Serverを構築していきます。ハンズオンページの
- あとで読む
[Ansible] そのtag設定、想定通りに動いてますか？ (継承機能とその実装を確認する) - zaki work log
- 5 users
- zaki-hmkc.hatenablog.com
- テクノロジー
- 2021/03/24
playbook内のtask定義にtagを設定しておくことで、指定tagのtaskのみ実行したり、逆に指定tagのtaskを除外してansible-playbookを実行することができます。開発中のtaskのみピンポイントで実行したい場合や、逆に、共有のDBのデータを更新したりするtaskはほかのユーザーやチームと調整してからでないと実行が難しかったり、Blue-Greenデプロイメントの実装で環境Aの機能をオフにしてもう片方の環境Bをオンにするような処理だけど開発中は環境Bだけ確認したかったり、大量データのダウンロードや冪等の確認を伴い処理に時間がかかるため開発中は実行したくないなど特定のtaskは実行したくない場合に利用できます。また、特殊tagとして、常に実行するalwaysと実行しないneverというtagが予約語として用意されています。 neverは特に「通常は実行したくない
EC2インスタンスのユーザーデータ内のdnfコマンドやyumコマンドが失敗する場合の緩和策を考えてみた | DevelopersIO
- 5 users
- dev.classmethod.jp
- テクノロジー
- 2024/04/28
ユーザーデータでパッケージのインストールをしようとすると失敗するんだがこんにちは、のんピ(@non____97)です。皆さんはEC2インスタンスのユーザーデータでdnfコマンドやyumコマンドが失敗したことはありますか? 私はあります。具体的にはユーザーデータでdnf upgradeやdnf install パッケージ名を実行すると、以下のようにRPM: error: can't create transaction lock on /var/lib/rpm/.rpm.lock (Resource temporarily unavailable)とログが出力されます。 $ dnf upgrade -y --releasever=latest Amazon Linux 2023 repository 30 MB/s | 23 MB 00:00 Amazon Linux 2023 Ker
Mastering Customer Segmentation with LLM | Towards Data Science
- 5 users
- towardsdatascience.com
- テクノロジー
- 2023/10/01
Unlock advanced customer segmentation techniques using LLMs, and improve your clustering models with advanced techniques Content Table · Intro · Data · Method 1: Kmeans · Method 2: K-Prototype · Method 3: LLM + Kmeans · Conclusion Intro A customer segmentation project can be approached in multiple ways. In this article I will teach you advanced techniques, not only to define the clusters, but to a
- t-SNE
- SHAP
- 主成分分析
- LLM
- 自然言語処理
- 機械学習
- data
- 統計
What's New in Emacs 28.1?
- 5 users
- www.masteringemacs.org
- テクノロジー
- 2022/04/06
Try Mastering Emacs for free! Are you struggling with the basics? Have you mastered movement and editing yet? When you have read Mastering Emacs you will understand Emacs. It’s that time again: there’s a new major version of Emacs and, with it, a treasure trove of new features and changes. Notable features include the formal inclusion of native compilation, a technique that will greatly speed up y
- emacs
Vim9 script for Python Developers · GitHub
- 5 users
- gist.github.com/kato-k
- テクノロジー
- 2021/03/12
vim9script4pythondevelopers.md Vim9 script for Python Developers Vim9 scriptã�¯Vim scriptã�¨ã�®äº�æ��ã��ã�ªã��ã��å¤�æ�°ã�®å��ç¸�ã��ã��å°�å�¥ã��ã��ã��ã��ã�³ã�³ã��ã�¤ã�«ã��ã��ã��ã��ã�¨ã�ªã�©ã�«ã��ã��ã��é«�é��å��ã��å®�ç�¾ã��ã��æ�°ã��ã��å�¦ç��ç³»ã�§ã��ã�� defã�³ã��ã�³ã��ã�§å®�ç¾©ã��ã��ã��é�¢æ�°å��ã��ã�¾ã��ã�¯Vim scriptå��ã�§vim9scriptã�³ã��ã�³ã��ã��ä½¿ã��ã��ã�¨ã�§å�©ç�¨ã�§ã��ã�¾ã��(vim9scriptã�³ã��ã�³
- あとで読む
ChatGPT時代に必要かも!? Pythonで実行するファイルパース（PowerPoint編） | DevelopersIO
- 5 users
- dev.classmethod.jp
- テクノロジー
- 2023/04/15
こんちには。データアナリティクス事業本部インテグレーション部機械学習チームの中村です。今回は話題のChatGPTにコンテキストを与える際に必要となるファイルパース処理について見ていきたいと思います。 PowerPointに焦点を絞ってみていきます。既存のライブラリ内の実装も確認していきます。先行事例の実装先行事例の実装として、よく話題となる以下のライブラリを見ていきます。（LlamaIndexとLlamaHubはほぼ同じですが、parserとしては片方にしかないものもあるため） LlamaIndex https://github.com/jerryjliu/llama_index https://gpt-index.readthedocs.io/en/latest/index.html LlamaHub https://github.com/emptycrown/llama-
- python
- 開発
- 資料
- あとで読む
Apache Airflow 2.0 is here!
- 4 users
- airflow.apache.org
- テクノロジー
- 2020/12/18
We're proud to announce that Apache Airflow 2.0.0 has been released. I am proud to announce that Apache Airflow 2.0.0 has been released. The full changelog is about 3,000 lines long (already excluding everything backported to 1.10), so for now I’ll simply share some of the major features in 2.0.0 compared to 1.10.14: A new way of writing dags: the TaskFlow API (AIP-31) (Known in 2.0.0alphas as Fun
- airflow
Renato Athaydes
- 4 users
- renato.athaydes.com
- テクノロジー
- 2021/10/02
Revenge of Lisp (Part 1⁄2) Background vector created by upklyak - www.freepik.com This may surprise you if you know me, but I’ve been learning Common Lisp for a few weeks now. It all started when I was reading, funnily enough, a blog post about another, much more hyped, language called Julia. The post was titled Julia and the reincarnation of Lisp, and in it the author lamented that despite his lo
Titanicで学ぶ、実務で使えるgokartの書き方 - エムスリーテックブログ
- 4 users
- www.m3tech.blog
- テクノロジー
- 2023/06/14
こんにちは。エムスリーエンジニアリンググループ AI・機械学習チームで機械学習エンジニアをしている農見(@rookzeno) です。最近はgokartを使ったパイプライン開発に勤しんでます。皆さんはgokartというものをご存知でしょうか。この記事を開く人は知ってそうですが、gokartとはエムスリーがメンテナンスしている機械学習パイプラインOSSです。もしgokartのことを知らなかった人が居たらこのgokartの記事を読んでください。エムスリー内ではこれを全面的に利用して開発を行なっていますが、その知見は社内に閉じてるものも多いです。そこでエムスリー内でどんな感じでgokartを使ってるかというのをTitanicデータセットを利用して説明していこうと思います。今回使用したコードはこちら github.com はじめに全体pipelineの作成 1. データのダウンロード 2.
- python
- programming
Python behind the scenes #11: how the Python import system works
- 4 users
- tenthousandmeters.com
- テクノロジー
- 2021/07/25
If you ask me to name the most misunderstood aspect of Python, I will answer without a second thought: the Python import system. Just remember how many times you used relative imports and got something like ImportError: attempted relative import with no known parent package; or tried to figure out how to structure a project so that all the imports work correctly; or hacked sys.path when you couldn
- Python
Plan 9 Desktop Guide
- 4 users
- pspodcasting.net
- テクノロジー
- 2021/04/23
PLAN 9 DESKTOP GUIDE INDEX What is Plan 9? Limitations and Workarounds Connecting to Other Systems VNC RDP SSH 9P Other methods Porting Applications Emulating other Operating Systems Virtualizing other Operating Systems Basics Window Management Copy Pasting Essential Programs Manipulating Text in the Terminal Acme - The Do It All Application Multiple Workspaces Tiling Windows Plumbing System Admin
- Plan9
プログラムの言語変換 & ローカル依存ファイルの集約を行うワークフロー（LangGraph・並列処理）
- 4 users
- zenn.dev/yumefuku
- テクノロジー
- 2025/02/13
上記のとおり、「parallel_document_massege」～「parallel_create_code」までが並列で処理されるノードです。ある程度ノードをまとめてしまってもよいですが、処理ごとに分けておくとノードの付け替えなどでカスタマイズがしやすいかと思います。コーディング使用したライブラリコード内で使用した外部ライブラリとインストールコマンドは以下です。 $ pip install chardet==5.2.0 $ pip install aiofiles==23.2.1 $ pip install ipython==8.27.0 $ pip install langchain-core==0.3.28 $ pip install langchain-anthropic==0.3.0 $ pip install langgraph==0.2.60 import os
OpenSearchで実現する画像検索とテスト追加で目指す安定運用【イベントレポート】 - CADDi Tech Blog
- 4 users
- caddi.tech
- テクノロジー
- 2022/09/08
OpenSearchで実現する画像検索とテスト追加で目指す安定運用こんにちは、CADDi AI Lab MLEの志水です。 8/19に10X,M3の両社と検索運用の勉強会#Search_C10Xm3 を開催いたしました。おかげさまで当日までの登録者が254名、当日の参加者は最大137名までお越しいただき大盛況でした。勉強会中何度か紹介されたペンギン本がAmazonで売り切れるような反響もあったようです。その中から、キャディ発表分を抜粋したイベントレポートをいたします！ - 10Xさんの発表資料はこちらから - M3さんの発表資料はこちらから AI Labでは図面管理SaaS CADDi DRAWER の検索サービスを開発／運用してきており、その経験からOpenSearchで実現する画像検索とテスト追加で目指す安定運用についてお話ししました。目次 opensearch で k
- test
Effectively building AI agents on AWS Serverless | Amazon Web Services
- 3 users
- aws.amazon.com
- テクノロジー
- 2025/08/15
AWS Compute Blog Effectively building AI agents on AWS Serverless Imagine an AI assistant that doesn’t just respond to prompts – it reasons through goals, acts, and integrates with real-time systems. This is the promise of agentic AI. According to Gartner, by 2028 over 33% of enterprise applications will embed agentic capabilities – up from less than 1% today. While early generative AI efforts foc
pandas: An Ultimate Python Library for Data Science
- 3 users
- www.ejable.com
- テクノロジー
- 2023/11/02
In this article, I will introduce the pandas library of Python programming language for data science. We will also see practical examples of code to create data frames, logical operations, and looping, apart from examples of code for the advanced concepts of pandas. Introduction to pandaspandas is a great library of Python for data science for most industry applications with massive amounts of dif