本文「for index in enumerate python」を検索

1 - 40 件 / 137件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

for index in enumerate pythonの検索結果1 - 40 件 / 137件

リーダブルなコードを書く習慣の身に付け方・実践の仕方 - 2021-09-22 - ククログ
- 656 users
- www.clear-code.com
- テクノロジー
- 2021/09/23
結城です。 2021年9月13日から14日にかけて、東京都立大学の大学院生向け特別講義として「リーダブルコード演習」を実施しました。演習の内容は、当社でこれまでにも行ってきているリーダブルコードワークショップを、プログラミング経験が比較的浅い・プログラミングの量がまだそれほど多くない方向けに調整した内容としました。この記事では、実施した演習の概要と、今回意識した点を紹介します。本文が長いため、目次を用意してみました。発端演習の構成座学パートリーダブルなコードを書く意義についてリーダブルコードを実践するためにまず取り組むべきこと実際の現場での「コードがリーダブルでなくなってしまった」「リーダブルになるよう改めた」実践例最初の実装リーダブルでなくなった実装リーダブルさを取り戻すための改修コードがリーダブルでなくなっていってしまう要因壊すのが怖くて、見て見ぬフリ恐怖
退屈なことはPythonにやらせよう第2版
- 499 users
- www.oreilly.co.jp
- テクノロジー
- 2023/03/07
一歩先行くハイパフォーマンスなビジネスパーソンからの圧倒的な支持を獲得し、自作RPA本の草分けとして大ヒットしたベストセラー書の改訂版。劇的な「業務効率化」「コスト削減」「生産性向上」を達成するには、単純な繰り返し作業の自動化は必須です。本書ではWordやExcel、PDF文書の一括処理、Webサイトからのダウンロード、メールやSMSの送受信、画像処理、GUI操作といった日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化します。今回の改訂では、GmailやGoogleスプレッドシートの操作、Pythonと各種モジュールの最新版への対応、演習等を増補しています。日本語版では、PyInstallerによるEXEファイルの作成方法を巻末付録として収録しました。関連ファイルサンプルコード正誤表書籍発行後に気づいた誤植や更新された情報を掲載しています。お手
- python
- あとで読む
- プログラミング
- 書籍
- RPA
- programming
- 本
- book
- 技術
- プログラム
日本株3700社以上を分析。yfinance x「わが投資術」株式スクリーニングアプリを作った話（バイブコーディング）
- 489 users
- zenn.dev/testkun08080
- テクノロジー
- 2025/10/30
いきなりですが。海外旅行したり働き始めたりすると、日本の良さが身に染みたと感じた人は多いんじゃないでしょうか？なんかとりあえず外で働いてみたいと思っていましたが、今はいつ戻るかと考える日々です。（とにかく温泉に入りたい）また色々と各国を回る中で、日本企業ってアジア圏や他の国にもかなり進出してるんだなぁと実感しました。（そりゃそう）そんなこんなで日本株に興味を持ち昨年にわが投資術を購入して実践し始めました。（まだ初めて一年目なので成績はわかりません。。。が、マイナスは無し）自分でバフェットコードや Claude mcp-yfinance などを利用しながらスクリーニングしてみましたが、毎回決算が出るたびに手動とチャット相手にあるのも何かなぁ。と思いまして。じゃあ自動収集とスクリーニング用のアプリ作ってみよう(vibe coding) そんなノリから、日本株全銘柄を自動収集・簡易
- 投資
- あとで読む
- AI
- 株
- プログラミング
- 分析
- 株式
- 開発
- finance
- data
(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
- 450 users
- euske.github.io
- テクノロジー
- 2023/02/26
(数式を使わない) Transformer の直感的な説明 RNN の欠点 Transformer はこれをどう解決したか Transformer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transformer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transformer を参照のこと。日本語ではこの解説がわかり
pythonは_(アンダースコア)の使い方を理解するだけでプロフェッショナルになれる - Qiita
- 387 users
- qiita.com/_Kohei_
- テクノロジー
- 2023/11/01
1. 第3次AIブームの到来米Google DeepMindが開発した人工知能（AI）の囲碁プログラム「AlphaGo」が世界トップレベルの実力を持つ韓国のプロ棋士、李世ドル（イ・セドル）九段に4勝1敗と大きく勝ち越したことが着火剤となり、2015年より第3次AIブームへと突入した。(ちなみにAIが誕生したのは1950～1960年代で第1次AIブームの到来) 1.1 余談になるがAlphaGo(4億円の知能)はなぜすごいのか？ AlphaGoがそれ以前のチェスや将棋のAIと異なるのは、畳み込みニューラルネットワーク（CNN）を応用している点だ。このCNNはさらに強化学習を行い、自分自身と対局を数千万回も繰り返した。間違っていたらすみません、、、、 1.2 ChatGPTによる生成AIのブーム ChatGPTに代表されるLLMは以前から開発競争が繰り広げられていた。 GPT1は201
Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ
- 241 users
- tech.mntsq.co.jp
- テクノロジー
- 2021/05/21
たくさんの文字列（や離散的な符号列）をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか？（まぁあんまりなさそうですね）たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう富豪的に解決できるならいつでもそれが最高ですしかし、世の中それでなんとかならんこともたくさんあります用途があうのであれば専用のデータ構造を採用する例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削
「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
- 211 users
- tech.connehito.com
- テクノロジー
- 2023/12/09
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar 2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
- aws
- あとで読む
- 検索
- 開発
- AI
- Generative AI
- rag
- amazon
- LLM
「だんご屋のひまつぶし」完全解析 - すぎゃーんメモ
- 170 users
- memo.sugyan.com
- テクノロジー
- 2024/11/03
「だんご屋のひまつぶし」とは最長手順の問題は…？組み合わせ、グラフ問題プログラムで解く状態の列挙グラフの構築最短経路問題を解く WASM化して、ブラウザ上で解くもしもすべて異なる団子だったらさらに一般化していくと到達可能性頂点数本数を固定し、高さを変える高さを固定し、本数を変えるまとめ Repository 「だんご屋のひまつぶし」とは「ハノイの塔」の派生型のようなパズル。高さ3の串が3本あり、3色の団子2個ずつ計6個が刺さっている。これらを1個ずつ移し替えて、ある状態からある状態へと遷移させる、というゲーム。移動できるのは各串で一番上にある団子だけ。団子の大きさのような概念はなく、高さ3以内であればどこにでも動かせる。単純なルールだがなかなかに奥が深く、じっくり考えて動かさないと最適な手順で達成するのは意外に難しい。パズルオーディションというもので最
防衛省サイバーコンテスト 2025 writeup - st98 の日記帳 - コピー
- 161 users
- nanimokangaeteinai.hateblo.jp
- テクノロジー
- 2025/02/02
2/2に12時間というちょうどよい競技時間で開催された。21時終了だったけれども、11時45分ぐらいに最速で全完して1位🎉 第1回以来4年ぶりの優勝だ。昨年大会の第4回ではヒントの閲覧数で優勝を逃してしまって悔しい思いをしたので、雪辱を果たすことができ嬉しい。開始直後からずっと1位を独走できており、450名以上のプレイヤーがいる中で圧勝だったのも嬉しい。昨年度や一昨年度はバルクが作問を担当していたが、今回はAGESTが担当していた。これまでの問題と比較すると全体的に易化したように思うが、解くにあたって発想の大きな飛躍を必要とするいわゆる「エスパー要素」のある問題はごく一部を除いて存在しておらず*1、よかったと思う。また、昨年度・一昨年度に引き続きwriteupは公開可能というのもよかった。戦略というほどの戦略は立てていなかったけれども、とりあえずWebを見た後は全カテゴリを上から見て
遅くないpandasの書き方 - ML_BearのKaggleな日常
- 92 users
- naotaka1128.hatenadiary.jp
- テクノロジー
- 2021/12/07
これは何？この記事は Kaggle Advent Calendar 2021 の7日目の記事です。 pandasはデータ分析ライブラリとして非常に便利ですが、書き方を間違えると簡単に処理が遅くなってしまうという欠点があります。そこで、この記事では遅くならない書き方をするために気をつけたいポイントをいくつかご紹介したいと思います。この Colab Notebookの実行結果をエクスポートした上で、不要な部分を一部削って記事にしています。colab notebook をコピーして実行してもらえれば再現することが可能なはずです。(colabにコメント等をいただいても返すことはできないと思います、すみません。) 前提条件この記事ではあくまで「遅くない(なりづらい)書き方を紹介する」ことに努めます。よって、以下のような改善点はあるが一旦考慮の外におくものとして話を進めます。並列化ライブラリ
- pandas
- python
- あとで読む
- プログラミング
- numpy
- Kaggle
- 高速化
WebAssemblyを用いてBERTモデルをフロントエンドで動かす - OPTiM TECH BLOG
- 91 users
- tech-blog.optim.co.jp
- テクノロジー
- 2021/08/13
はじめまして。R&Dチーム所属、20.5卒の伊藤です。普段の業務では自然言語処理と格闘していることが多いです。今回は自然言語処理モデルとして有名なBERTをWebAssemblyを使用してフロントエンドで動かしてみた話になります。最近、自然言語処理ライブラリとして普段お世話になっているHugging Face社のTransformersのTokenizerがRustで実装されていることを知り、それならばWebAssemblyにコンパイルして動かせるのではないかと試したみたのがきっかけです。 Tokenizerのみ動かしても実用性に乏しいため、Tokenizerから得られた結果からBERTを用いた推論をブラウザで動作させるまでを行い、備忘録がでら手順をまとめました。どなたかの参考になれば幸いです。 8/26追記本記事内のコードを含むリポジトリを公開しました！Dockerを使用してブ
- BERT
- WebAssembly
- NLP
- 自然言語処理
- wasm
- 機械学習
- あとで読む
- Rust
競馬必勝本は本当に当たるのかを検証！〜Pythonで実装する馬券自動選択ツール〜 - エニグモ開発者ブログ
- 57 users
- tech.enigmo.co.jp
- テクノロジー
- 2020/12/03
こんにちは、サーバーサイドエンジニアの竹本です。この記事は Enigmo Advent Calendar 2020 の3日目の記事です。みなさまは2020年に買った中でよかったものはなんでしょう？私はiPadです。最新 Apple iPad Pro (12.9インチ, Wi-Fi, 128GB) - シルバー (第4世代) 発売日: 2020/03/25メディア: Personal Computers 主にkindleを見開きで読むことに活用しています。エニグモの福利厚生の一つ「エンジニアサポート」で5万円の補助を受けました。わーい。 https://enigmo.co.jp/recruit/culture/ そしてみなさまは馬券、買っていますか？馬券は競馬に賭ける際に購入する投票券です。 1口100円から、ネットでも気軽に購入することができます。(競馬は20歳から) 弊社にも
- python
- あとで読む
- 開発
- 分析
- 投資
- ツール
- プログラミング
- ブログ
時系列分析をお手軽に！機械学習ライブラリDartsの実演 - DATAFLUCT Tech Blog
- 51 users
- tech.datafluct.com
- テクノロジー
- 2022/05/02
こんにちは！以前にDartsという時系列分析に特化したpythonライブラリを紹介しました。前編はこちら今回は実際にDartsを動かしていきましょう。 Darts内にもデータセットがありますが、公式でも触れられているのであえて、外部のデータを参照してみましょう。導入編でも触れたアイスクリームの生産量の変化を推測したいと思います。アイスクリームのデータセットはこちら上記リンクの上部右側Downloadからcsvをダウンロードしてください。 Dartsのインストールは以下の1コマンドです。Windowsではデフォルトのコマンドプロンプトでうまくインストールが終了しなかったので、WSL環境などを推奨します。 $ pip install darts ARIMAで学習してみるバックテストでモデルの選定を行う RNNで共変量を扱ってみるまとめ ARIMAで学習してみるまずは、導入編で最
Raspberry PiとAWSを利用して子どもたちのゲーム時間を可視化してみた | DevelopersIO
- 48 users
- dev.classmethod.jp
- テクノロジー
- 2021/10/15
DynamoDBの作成さっそくテーブルをCDKで構築してみます。 from aws_cdk import ( Stack, RemovalPolicy, aws_dynamodb as dynamodb, # DynamoDBのライブラリをimport ) from constructs import Construct class GameCounterStack(Stack): def __init__(self, scope: Construct, construct_id: str, **kwargs) -> None: super().__init__(scope, construct_id, **kwargs) # The code that defines your stack goes here # ここから下に追記していきます。 # DynamoDB ログデータ格納用
【機械学習】機械学習を用いたin silico screening【AI創薬】~第2/5章スクレイピングによる公共データベース（PDB)からの機械学習データを収集~ - LabCode
- 47 users
- labo-code.com
- テクノロジー
- 2024/02/01
AI創薬とは？ AI創薬は、人工知能（AI）技術を利用して新しい薬物を発見、開発するプロセスです。AIは大量のデータを高速に処理し、薬物の候補を予測したり、薬物相互作用を評価したりします。また、AIは薬物の効果や安全性をシミュレートすることも可能で、臨床試験の前の段階でリスクを評価することができます。これにより、薬物開発のコストと時間を大幅に削減することが期待されています。AI創薬は、薬物開発の新しいパラダイムとして注目を集め、製薬企業や研究機関で積極的に研究、導入が進められています。また、バイオインフォマティクス、ケモインフォマティクス、機械学習、ディープラーニングなどの技術が組み合わされ、薬物開発のプロセスを革新しています。さらに、AI創薬は個人化医療の推進にも寄与し、患者にとって最適な治療法を提供する可能性を秘めています。今回はAI創薬の中でも、in silico screeeni
ソースコード & ドキュメントに対応したGraph RAGの実装（Tree-sitter + LightRAG）
- 46 users
- zenn.dev/yumefuku
- テクノロジー
- 2025/06/02
(module (function_definition (identifier) # ← ここに関数名「sample_func」が含まれます (parameters) (block (expression_statement (call (identifier) (argument_list (string)))))) (expression_statement (call (identifier) (argument_list)))) ノードが色々取れましたが、「function_definition」が関数、その子である「identifier」が関数名を表すため、 function_definition == 子ノード ==> identifier となっている箇所を探索すれば抽出できます（関数ではあっても「lambda」など異なる場合もあります）。今回は上記のようにTree-si
Pure Rustな近似最近傍探索ライブラリhoraを用いた画像検索を実装する - Stimulator
- 43 users
- vaaaaaanquish.hatenablog.com
- テクノロジー
- 2021/08/10
- はじめに - 本記事は、近似最近傍探索（ANN: Approximate Nearest Neighbor）による画像検索をRustを用いて実装した際のメモである。画像からの特徴量抽出にTensorFlow Rust bindings、ANNのインデックス管理にRustライブラリであるhoraを利用した。 RustとANNの現状および、実装について触れる。 - はじめに - - RustとANN - - pretrainモデルによる特徴量化 - - 画像特徴のインデックスと検索 - - 検索結果 - - おわりに - - RustとANN - Rustの機械学習関連クレート、事例をまとめたリポジトリがある。 github.com この中でも、ANN関連のクレートは充実している。利用する場合は以下のようなクレートが候補になる。 * Enet4/faiss-rs * lerouxrgd/
- Rust
- ライブラリ
- 画像
- あとで読む
- js
- search
大規模言語モデルの「脳波」をとって言葉を生成しているときにどこが活動しているのか見てみる - きしだのHatena
- 43 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/27
ChatGPTなんかの大規模言語モデルが言葉を生成しているときに、どういう反応が起きているのか気になりますよね。きっと気になる。ということで、手元で動かせる言語モデルのニューラルネット各層での出力を表示してみました。 GPTにはGPTブロックが複数あって、それぞれのブロックが２層のニューラルネットレイヤを持っています。モデルを読み込んだあとでこういうコードを動かしてニューラルネットの出力の二乗を足していきます。 for idx, elm in enumerate(model.transformer.h): elm.ln_1.index = idx * 2 elm.ln_2.index = idx * 2 + 1 elm.ln_1.old_forward = elm.ln_1.forward elm.ln_2.old_forward = elm.ln_2.forward def new_
- AI
- 脳
- あとで読む
- 言語
- article
Claude Code SDKでClaude Code Webを作ってみる - エムスリーテックブログ
- 37 users
- www.m3tech.blog
- テクノロジー
- 2025/07/18
エンジニアリンググループゼネラルマネージャーの横本(@yokomotod)です。このブログはSREチームブログリレー4日目の記事です。昨日は山本さんによるSRE作業もGemini CLIで効率化する記事でした。 www.m3tech.blog 続けて今日もAIコーディング関連、Claude CodeのSDKが気になって触ってみた知見を紹介します。言わずもがなClaude Codeは強力なツールで、最近はHooksなども登場し、拡張性もどんどん強化されています。しかし、まだまだもっと自由に機能強化して「オレの最強のClaude Code」を作ってみたいですよね。というわけで、Claude Code SDKを使えばそういうことも出来るのかな？と思って遊んでみました。ソースコードはこちらでも公開しています。 github.com Claude Code SDK コマンドライン T
- ClaudeCode
- prompt
- sre
- AI
- あとで読む
ChatGPT時代に必要かも!? Pythonで実行するファイルパース（PDF編） | DevelopersIO
- 37 users
- dev.classmethod.jp
- テクノロジー
- 2023/05/02
こんちには。データアナリティクス事業本部インテグレーション部機械学習チームの中村です。今回は話題のChatGPTにコンテキストを与える際に必要となるファイルパース処理について見ていきたいと思います。本記事ではPDFに焦点を絞ってみていきます。既存のライブラリ内の実装も確認していきます。先行事例の実装先行事例の実装として、よく話題となる以下のライブラリを見ていきます。（LlamaIndexとLlamaHubはほぼ同じですが、parserとしては片方にしかないものもあるため） LlamaIndex https://github.com/jerryjliu/llama_index https://gpt-index.readthedocs.io/en/latest/index.html LlamaHub https://github.com/emptycrown/llama-hu
- python
- pdf
- ChatGPT
ChatGPT と Whisper で発音練習アプリを作ってみた - NTT docomo Business Engineers' Blog
- 34 users
- engineers.ntt.com
- テクノロジー
- 2023/12/15
この記事は NTTコミュニケーションズ Advent Calendar 2023 の15日目の記事です。この記事では、ChatGPT と音声認識モデルの Whisper を用いた発音練習アプリケーションをご紹介します。 ChatGPT に読み上げる文章を考えてもらい、その文章の読み上げた音声を Whisper で文字起こしします。正確に発音できていれば、正確に文字起こしできる、という考えから、原稿と文字起こし結果を比較すれば発音練習に使えるのではないかと考えました。実際に使ってみた結果、発音のどこが悪かったのかといったフィードバックはもらえませんが、自分の発話した音声に対して評価がつくだけでも、結構楽しく練習できると感じました。音声認識を活用したアプリケーションは、一般に音声認識精度がネックになると思いますが、このアプリケーションは音声認識精度が100%ではないことを逆手に
- ai
- ChatGPT
- あとで読む
- 人工知能
- アプリ
「500年後に日本人が佐藤だけになる」という試算の問題と改善 - ill-identified diary
- 32 users
- ill-identified.hatenablog.com
- テクノロジー
- 2024/04/21
この記事の要約はじめに問題点の要約 (追記) 先行研究について GARCH(っぽい)モデルによるシミュレーションシミュレーション前の理論分析選択的夫婦別姓との比較 (追記) ゴルトン゠ワトソン分枝過程について使用するデータシミュレーションの技術的な補足乱数生成について GARCHモデルの結果シミュレーションの追試より複雑なシミュレーションについて男女別世代重複創作苗字三親等の婚姻禁止ルールより高度な人口学的モデル結論 2024/4/22: 先行研究とゴルトン゠ワトソン分枝過程の解説の追記 2024/4/23: 多数の言い回しのおかしい箇所の校正 2024/4/24: グラフ上の記載ミスとグラフ描画コードを修正この記事の要約先日報道された「500年後に日本人が佐藤だけになる」という試算の内容に違和感を覚えた. 資料を確認してみると, 大きな問題のある方法で試
Pythonで始めるリランカー実装：mixedbread-ai、Alibaba-NLP、OpenAI GPTを比べてみた - RAKUS Developers Blog | ラクスエンジニアブログ
- 31 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2025/07/18
mixedbread-ai/ Alibaba-NLP / OpenAI GPTによるリランキング【実装サンプル付き】はじめに RAGをはじめとする現代の情報検索システムでは、「リランカー（Reranker）」と呼ばれる仕組みが使われることがあります。検索候補を単にキーワードマッチやベクトル検索でピックアップするだけでなく、さらに高精度なモデル(＝リランカー)で再スコアリング（再ランキング）することで、ユーザーが本当に求めている情報を上位に表示できます。本記事では、筆者が実際に業務中の検証作業で利用した次の3つのモデル: mixedbread-ai/mxbai-rerank-v2 Alibaba-NLP/gte-multilingual OpenAIのGPT（Chatモデルをリランカーとして活用）を題材に、特徴や実装例を紹介します。 mixedbread-ai/ Alibaba-NL
投資家IPランドスケープ・スタートアップ支援IPランドスケープ・大学支援用に改良中　更新中）tfidf etc embeddings cluster reconstructing vis:　特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成（類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加） - Qiita
- 30 users
- qiita.com/kzuzuo
- テクノロジー
- 2023/05/15
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 投資家IPランドスケープ・スタートアップ支援IPランドスケープ・大学支援用に改良中　更新中）tfidf etc embeddings cluster reconstructing vis:　特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成（類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加）自然言語処理NLP可視化Visualization特許これは何複数の特許等の文章を「特定の母集団における互いの類似度」を元
- 検索
- 特許
- ChatGPT
- あとで読む
- 文章
- qiita
- 機械学習
mocopiの通信内容を解析してみた Vol.01
- 29 users
- zenn.dev/toyoshimorioka
- テクノロジー
- 2023/01/23
1月20日（金）に慣性式のモーションキャプチャデバイス（とアプリ）mocopiが発売されました。 SONYという大手メーカが販売しており、流通もしっかりしていそうなこと、デバイスが全部で6つと装着の手間が少ないこと、価格が5万円とモーションキャプチャデバイスとしては低価格であること、単体で完結せずVRChatやUnityなどとの連携も想定していることなどからある程度のマーケットを構築しそうです。開発関連ドキュメントやSDK・プラグインの状況 mocopiは低価格のモーションキャプチャであり、色んなソフトで使えそうですが、1月23日現在連携可能な環境は限られています。 VRChat Unity Motion Builder また、SDKは近日提供予定とのことですが、こちらはMobile App用のSDKということで恐らくmocopiデバイスの値を直接受けて動作するスマホアプリの開発のための
TransformersのPipelinesで日本語固有表現抽出 - Retrieva TECH BLOG
- 27 users
- tech.retrieva.jp
- テクノロジー
- 2021/08/30
こんにちは。TSUNADE事業部研究チームリサーチャーの坂田です。本記事では、Hugging Face 社が開発しているTransformersのPipelinesという仕組みを使って日本語の固有表現抽出を行う方法をご紹介します。 Transformersとは？日本語学習済み言語モデル Pipelines Trainer 固有表現抽出とは？実際に日本語NERTを試してみる必要な各種依存ライブラリのインストール使用するデータ日本語固有表現抽出データセットでのFine-tuning Pipelinesを使った固有表現抽出実行例おわりに参考 Transformersとは？ TransformersはHuggingFace社が公開しているPython用ライブラリで、BERTを始めとするTransformer系の言語モデルを使用する際のデファクトスタンダードになっています。また、最
Pineconeでハイブリッド検索／リランクは検索精度にどのように寄与するか？ - Taste of Tech Topics
- 26 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/11/20
はじめにこんにちは、データ分析エンジニアの木介です。秋も深まり、肌寒さを感じる季節となりましたが、皆様いかがお過ごしでしょうか。今回はPineconeを使ったハイブリッド検索とリランクについて紹介していきます。はじめに概要 1. Pineconeとは 2. ベクトル検索とは 3. リランクとは 4. ハイブリッド検索とは Pineconeでのベクトル検索＋リランクを用いた検索/ハイブリッド検索の検証 1. 検証環境 2. 検索用のインデックス作成 3. ベクトル検索＋リランクを用いた検索の利用方法 4. ハイブリッド検索の利用方法検証結果まとめ概要今回は以下の形でPineconeをベクトルデータベースとして、ベクトル検索にリランクを合わせた検索とハイブリッド検索を行い、検索精度について検証を行っていきます。 1. Pineconeとは Pineconeとは、RAGなどで活
- AI
- あとで読む
- database
- 検索
H200 GPU x 8基で Qwen2.5-VL-72B-Instruct を使った OCR を試してみる - ABEJA Tech Blog
- 26 users
- tech-blog.abeja.asia
- テクノロジー
- 2025/08/01
ABEJAでデータサイエンティストをしている藤原です。今回は、株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」で H200 GPU × 8基構成のシングルノードサーバを用いて、大規模モデルを使用した検証を実施しました。本記事では、その検証でのGPUサーバの使用方法や、検証内容の一つである Qwen2.5-VL-72B-Instruct を用いたOCRの結果についてご紹介します。 highreso.jp はじめに GPUクラウドサービス「GPUSOROBAN」について GPUサーバの使い方の方針と事前準備 Qwen2.5-VL-72B-Instruct を使った OCR を試してみる条件実装実行時のGPU使用状況と処理速度検証1. 通常の文書のOCR 検証2. チャート・グラフのようなテキストで表現されていない情報のテキスト化検証3. 複雑なレイアウトのドキュメ
- あとで読む
ChatGPT Assistants API の使い方｜ChatGPT研究所
- 25 users
- chatgpt-lab.com
- テクノロジー
- 2024/04/19
本記事では、2024年4月18日からVersion 2 になったAssistants APIの使い方を1から解説します。この記事は、OpenAI公式サイトの内容と、実際に手元で実践した結果を混合したものになっています。まだ探りきれていないので、この記事をアップデートしていく予定です。まず、以下が新機能の概要です： Assistants API v2（ベータ版）の新機能 -- 2024年4月 -- Assistants APIに様々な新機能と改良を発表し、ベータ版を新しいAPIバージョン`OpenAI-Beta: assistants=v2`に移行します。新機能は以下の通りです。 * 改良された検索ツール`file_search`を導入しました。アシスタントあたり最大10,000ファイルを取り込むことができ、以前の500倍となります。高速化され、マルチスレッド検索による並列クエリをサ
- OpenAI
- AI
- ChatGPT
- あとで読む
- api
- ツール
- プログラミング
wav2vec 2.0 を使って手軽に音声認識モデルを触れるようになろう - NTT docomo Business Engineers' Blog
- 23 users
- engineers.ntt.com
- 世の中
- 2021/12/20
この記事は NTTコミュニケーションズ Advent Calendar 2021 の20日目の記事です。はじめにこんにちは。プラットフォームサービス本部アプリケーションサービス部の是松です。 NTTコミュニケーションズでは自然言語処理、機械翻訳、音声認識・合成、要約、映像解析などのAI関連技術を活用した法人向けサービスを提供しています。（COTOHA シリーズ） NTTコミュニケーションズがこのようなAI関連技術を活用したサービスを展開する強みとして、 NTT研究所の研究成果が利用可能であること自社の他サービスを利用しているお客様に対してシナジーのあるサービスを提案できることこの2点が挙げられると思います。実際に、私が担当している COTOHA Voice Insight は通話音声テキスト化によってコンタクトセンターの業務効率化・高度化を実現するサービスなのですが、 NTT研
Pytorch-lightning+Hydra+wandbで作るNN実験レポジトリ - Higu`s diary
- 20 users
- zerebom.hatenablog.com
- テクノロジー
- 2020/12/11
Kaggle Advent Calender2020の 11日目の記事です。昨日はhmdhmdさんのこちらの記事です! 2020年、最もお世話になった解法を紹介します - Qiita 明日はarutema47さんの記事です! (後ほどリンクはります) 本記事では、深層学習プロジェクトで使用すると便利なライブラリ、 Pytorch-lightningとHydraとwandb(Weights&Biases)について紹介したいと思います。対象読者 Pytorchのボイラープレートコードを減らせないか考えている下記ライブラリについては聞いたことあるけど、試すのは億劫でやってない書いてあること各ライブラリの役割と簡単な使い方各ライブラリを組み合わせて使う方法各ライブラリのリファレンスのどこを読めばよいか、更に勉強するにはどうすればよいかまた、上記3つのライブラリを使用したレポジトリを
Agentic GraphRAG for Commercial Contracts | Towards Data Science
- 16 users
- towardsdatascience.com
- テクノロジー
- 2025/06/20
In every business, legal contracts are foundational documents that define the relationships, obligations, and responsibilities between parties. Whether it’s a partnership agreement, an NDA, or a supplier contract, these documents often contain critical information that drives decision-making, risk management, and compliance. However, navigating and extracting insights from these contracts can be a
- AI
- あとで読む
【機械学習】機械学習を用いたin silico screening【AI創薬】~第5/5 章候補化合物のin silico screening~ - LabCode
- 16 users
- labo-code.com
- テクノロジー
- 2024/02/15
AI創薬とは？AI創薬は、人工知能（AI）技術を利用して新しい薬物を発見、開発するプロセスです。AIは大量のデータを高速に処理し、薬物の候補を予測したり、薬物相互作用を評価したりします。また、AIは薬物の効果や安全性をシミュレートすることも可能で、臨床試験の前の段階でリスクを評価することができます。これにより、薬物開発のコストと時間を大幅に削減することが期待されています。AI創薬は、薬物開発の新しいパラダイムとして注目を集め、製薬企業や研究機関で積極的に研究、導入が進められています。また、バイオインフォマティクス、ケモインフォマティクス、機械学習、ディープラーニングなどの技術が組み合わされ、薬物開発のプロセスを革新しています。さらに、AI創薬は個人化医療の推進にも寄与し、患者にとって最適な治療法を提供する可能性を秘めています。今回はAI創薬の中でも、in silico screeenin
- 機械学習
- あとで読む
CLIP+Faiss+Streamlitで画像検索アプリを作成してみる - OPTiM TECH BLOG
- 15 users
- tech-blog.optim.co.jp
- テクノロジー
- 2022/07/04
R&Dチーム所属の伊藤です。気がついたら半年ぶりくらいの投稿になってしまいました。今回はrinna株式会社より公開された言語画像モデルである日本語対応CLIPを使ってみた話になります。元々はCLIPとFaissを組み合わせて画像検索のためのツールを作れないかを試していたのですが、どうせだったら可視化までしようと考えてStreamlitを使用したアプリ化も行いました。今回作成したコードはGithubのリポジトリにありますので、興味がある方は覗いてみてください。 CLIPとは？ Faissとは？ CLIPとFaissで画像検索事前準備画像ベクトルのインデックス作成インデックスを読み込んで画像検索 Streamlitで画像検索アプリを作成する最後に CLIPとは？ CLIPはOpenAIより提案された、テキストと画像を使用して画像分類モデルです。 CLIPはContrastive
- clip
- あとで読む
はじめての自然言語処理 Fusion-In-Decoder でクイズに答えるモデルを作る | オブジェクトの広場
- 13 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/09/07
今回は Fusion-In-Decoder を使ってクイズに答えるモデルを作ります。以前から Wikipedia 等の外部情報を参照できるテキスト生成モデルを試してみたいと思っていました。Fusion-In-Decoder の発表は 2020 年なので少し前のモデルですが、T5 ベースで手軽に試せるサイズ感ですので、日本語で試してみましょう。 1. はじめに今回紹介する Fusion-In-Decoder（以下、FiD ）1 は Meta AI (当時は Facebook AI Research) が発表した Open Domain question Answering タスクを解くテキスト生成モデルです。じつは、以前から外部情報を参照できるテキスト生成モデルを試してみたくて2、 Google の RETRO3 の論文を読んでたんです。なのですが、外部情報のサイズ感が 1000 B
- NLP
- 自然言語処理
- 機械学習
- 勉強
- language
- 言語
- 学習
ゼロからはじめるPython(71) Excelで読めないSQLiteデータをPythonで読んでExcelに差し込みたい
- 13 users
- news.mynavi.jp
- テクノロジー
- 2020/12/22
時々、Excelで読み込めない形式のデータや、独自形式のデータをExcelのシートに貼り付けたい場合がある。Pythonの豊富なライブラリを使えば様々なデータ形式を手軽に読み込める。今回は、SQLite形式のデータをPythonで読み込んでExcelに貼り付けてみよう。 SQLiteのデータをPythonで読み込んでExcelに挿入したところ Excelに貼り付けたいけどExcelだけでは読めないデータもある Excelのデータインポート機能は非常に高機能だ。CSV/TSVなど汎用テキストデータだけでなく、Webでよく使われるXMLデータからJSONデータのインポートにまで対応している。しかし、時々、Excelで読み込めない形式のデータや、独自形式のデータをExcelのシートに貼り付けたい場合がある。Excelで直接読めなくても別のアプリを使ってクリップボード経由でExcelに貼り付ける
- あとで読む
llmを用いて将棋の棋譜解説その１ - GMOインターネットグループグループ研究開発本部
- 12 users
- recruit.gmo.jp
- テクノロジー
- 2025/01/15
まとめ大規模言語モデルを用いて将棋の棋譜解説を行うソースコード（デモ版）をgithubに公開しています「①指し手と将棋エンジンの読み筋の差異を解説」「②これから最適手がどういうものかを述べる」という２つの観点で解説を行うことができます今後の開発でより性能や汎用性を向上させていく見込みです。はじめに AI研究開発室のM.S.です。今回は私の趣味である将棋（アマ二段程度の実力です。）とllmを組み合わせて棋譜の解説を試みます。近年の機械学習や自然言語処理の飛躍的な進歩の中でも、チャット型の大規模言語モデル（LLM）は特に注目を浴びています。文章生成能力が格段に向上したことで、テキストベースのタスク——たとえば対話システムや文書要約などが大きく発展しました。ここでは、そのLLMの技術発展を「将棋」の領域にも活かせないかを模索する取り組みについて紹介します。本編棋譜から解説を生成する
The Quest for Netflix on Asahi Linux | Blog
- 12 users
- www.da.vidbuchanan.co.uk
- テクノロジー
- 2023/03/10
Welcome to my ::'########::'##::::::::'#######:::'######::: :: ##.... ##: ##:::::::'##.... ##:'##... ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##:::..::: :: ########:: ##::::::: ##:::: ##: ##::'####: :: ##.... ##: ##::::::: ##:::: ##: ##::: ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##::: ##:: :: ########:: ########:. #######::. ######::: ::........:::........:::.......::::......:::: CTF writeups, prog
- linux
- あとで読む
GPT-4oとStreamlitでOpenAI Assistants APIのCode Interpreterを検証した現状と課題
- 12 users
- zenn.dev/seiya303
- テクノロジー
- 2024/05/19
はじめに OpenAIのAssistants APIをそのまま使用することで、自前でLangChainのエージェントなどを使用して同様の処理を実装する手間を省け、非常に便利です。ただ、現状（2024/05/18）ではまだβ版ということもあり、APIのインタフェースの改変も多く見られます。 Assitants APIを用いたcode-interpreterのUIをstreamlitで実装においても、実装例が紹介されていますが、そのままでは動作しないこともあり、最新版での動作検証も兼ねてStreamlitでの実装例を紹介します。また、本記事ではStreaming対応済みの実装を取り入れており、よりリアルタイムな対話が可能となっています。扱っているモデルは2024/05/14に発表されたGPT-4oを用いています。目次はじめに実装例 app.py openai_handler.py
- LLM
- API
- あとで読む
OpenAIのEmbeddings APIのベクトルを使って検索を行う | DevelopersIO
- 11 users
- dev.classmethod.jp
- テクノロジー
- 2023/05/02
今回はOpenAIのEmbeddings APIを利用して文章検索を行ってみます。このAPIを利用することで文章をベクトルに変換することが可能です。この変換されたベクトル間の距離を計算することで、関連する文章が計算できるようになります。 OpenAIのEmbeddingについて OpenAIのAPIの一つにEmbeddings APIというものがあります。これを利用すると文章をベクトルに変換することが可能です。この変換されたベクトルは以下のような用途で利用できます。検索（クエリとの関連性に基づくランキングの作成）クラスタリング（文章の類似性によるグループ化）レコメンデーション（関連する文章を持つ物のレコメンデーション）異常検出（関連性が低い外れ値の特定）多様性測定（類似性の分布の分析）分類（最も類似したラベルでの分類）ここで言うベクトル形式への変換は以下のようなイメー
- Python