本文「for i in range python enumerate」を検索

1 - 40 件 / 113件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

for i in range python enumerateの検索結果1 - 40 件 / 113件

リーダブルなコードを書く習慣の身に付け方・実践の仕方 - 2021-09-22 - ククログ
- 656 users
- www.clear-code.com
- テクノロジー
- 2021/09/23
結城です。 2021年9月13日から14日にかけて、東京都立大学の大学院生向け特別講義として「リーダブルコード演習」を実施しました。演習の内容は、当社でこれまでにも行ってきているリーダブルコードワークショップを、プログラミング経験が比較的浅い・プログラミングの量がまだそれほど多くない方向けに調整した内容としました。この記事では、実施した演習の概要と、今回意識した点を紹介します。本文が長いため、目次を用意してみました。発端演習の構成座学パートリーダブルなコードを書く意義についてリーダブルコードを実践するためにまず取り組むべきこと実際の現場での「コードがリーダブルでなくなってしまった」「リーダブルになるよう改めた」実践例最初の実装リーダブルでなくなった実装リーダブルさを取り戻すための改修コードがリーダブルでなくなっていってしまう要因壊すのが怖くて、見て見ぬフリ恐怖
新入社員のみんな、「ChatGPT×Python」で鬼にならないか？｜ピーナッツ
- 520 users
- note.com/1za5ij
- テクノロジー
- 2023/03/20
ChatGPTが本当にヤバい。断言する。新卒がこれを使いこなせば、今職場で「優秀」とされている5-6年目くらいの先輩なら余裕で出し抜ける。鬼になれる。筆者はメーカー社員なので、メーカーの新入社員がChatGPTを使って鬼になる方法を1つ提案したい。「ChatGPT×Python」である。 Pythonとは、ご存知のとおり物理シュミレーションからデータサイエンス、機械学習までカバーする汎用性をそなえたプログラミング言語だ。何でもできるわりには書ける人がなぜか少なく、いまだにスキルとして重宝されている。そんなPythonにChatGPTを使おう。 ChatGPTを使えば、上司から求められるアウトプットを一瞬で出すことができる。それに対してフィードバックをもらい、それも一瞬で打ち返すことができる。「あいつ"Python書ける"だけじゃないんだよな。こっちが言ったこと正確に理解するし、そ
- ChatGPT
- あとで読む
- python
- AI
- プログラミング
- 開発
- 人工知能
- 仕事
- ライフハック
- DX
退屈なことはPythonにやらせよう第2版
- 499 users
- www.oreilly.co.jp
- テクノロジー
- 2023/03/07
一歩先行くハイパフォーマンスなビジネスパーソンからの圧倒的な支持を獲得し、自作RPA本の草分けとして大ヒットしたベストセラー書の改訂版。劇的な「業務効率化」「コスト削減」「生産性向上」を達成するには、単純な繰り返し作業の自動化は必須です。本書ではWordやExcel、PDF文書の一括処理、Webサイトからのダウンロード、メールやSMSの送受信、画像処理、GUI操作といった日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化します。今回の改訂では、GmailやGoogleスプレッドシートの操作、Pythonと各種モジュールの最新版への対応、演習等を増補しています。日本語版では、PyInstallerによるEXEファイルの作成方法を巻末付録として収録しました。関連ファイルサンプルコード正誤表書籍発行後に気づいた誤植や更新された情報を掲載しています。お手
- python
- あとで読む
- プログラミング
- 書籍
- RPA
- programming
- 本
- book
- 技術
- プログラム
日本株3700社以上を分析。yfinance x「わが投資術」株式スクリーニングアプリを作った話（バイブコーディング）
- 486 users
- zenn.dev/testkun08080
- テクノロジー
- 2025/10/30
いきなりですが。海外旅行したり働き始めたりすると、日本の良さが身に染みたと感じた人は多いんじゃないでしょうか？なんかとりあえず外で働いてみたいと思っていましたが、今はいつ戻るかと考える日々です。（とにかく温泉に入りたい）また色々と各国を回る中で、日本企業ってアジア圏や他の国にもかなり進出してるんだなぁと実感しました。（そりゃそう）そんなこんなで日本株に興味を持ち昨年にわが投資術を購入して実践し始めました。（まだ初めて一年目なので成績はわかりません。。。が、マイナスは無し）自分でバフェットコードや Claude mcp-yfinance などを利用しながらスクリーニングしてみましたが、毎回決算が出るたびに手動とチャット相手にあるのも何かなぁ。と思いまして。じゃあ自動収集とスクリーニング用のアプリ作ってみよう(vibe coding) そんなノリから、日本株全銘柄を自動収集・簡易
- 投資
- あとで読む
- 株
- AI
- プログラミング
- 分析
- 株式
- 開発
- finance
- data
ChatGPT(GPT-4) で一撃でスクレイピングするコードを生成出来たので感想とコツ - Qiita
- 387 users
- qiita.com/naohikowatanabe
- テクノロジー
- 2023/05/08
今回やりたかったこと目標：ChatGPT(GPT-4) で一撃でスクレイピングするコードを生成するにはどうしたらいいのか、ChatGPT のハードルとかコツとかを知りたい。 ※最終的なプロンプトの入力と出力の全文は本ページ下部に貼り付けてます。作ったもの概要保険組合のウォーキングイベントの会社内の3チームの歩数進捗の slack への自動投稿 bot を作成しました。処理は大きく2つに分かれています。ウォーキングイベントサイトから歩数をスクレイピング＆スプシへアップロードスプシの GAS で投稿文字列作成＆ slack へ自動投稿今回 ChatGPT でやったのは1の方です。 2は前回半年前開催分のコードをほぼそのまま流用しました。運良く（？）今回のタイミングでウォーキングイベントのサービスサイトが変わり、 HTML がまるっと変わり1のスクレイピングコードは作り直しが必
N番目の素数を求める - すぎゃーんメモ
- 185 users
- memo.sugyan.com
- テクノロジー
- 2021/02/06
SNSなどで話題になっていたので調べてみたら勉強になったのでメモ。環境 Pythonでの実装例例1 例2 例3 エラトステネスの篩 Rustでの実装例試し割り法エラトステネスの篩アトキンの篩おまけ: GMP Benchmark 高速化のテクニック上限個数を見積もる Wheel factorization オチ Repository References 環境手元のMacBook Pro 13-inchの開発機で実験した。 2.8 GHz Intel Core i7 16 GB 2133 MHz LPDDR3 Pythonでの実装例例1 最も単純に「2以上p未満のすべての数で割ってみて余りが0にならなかったら素数」とする、brute force 的なアプローチ。 import cProfile import io import pstats import sys def m
- アルゴリズム
- algorithm
- python
- 数学
- 素数
- あとで読む
- プログラミング
- math
- Rust
- programming
「だんご屋のひまつぶし」完全解析 - すぎゃーんメモ
- 170 users
- memo.sugyan.com
- テクノロジー
- 2024/11/03
「だんご屋のひまつぶし」とは最長手順の問題は…？組み合わせ、グラフ問題プログラムで解く状態の列挙グラフの構築最短経路問題を解く WASM化して、ブラウザ上で解くもしもすべて異なる団子だったらさらに一般化していくと到達可能性頂点数本数を固定し、高さを変える高さを固定し、本数を変えるまとめ Repository 「だんご屋のひまつぶし」とは「ハノイの塔」の派生型のようなパズル。高さ3の串が3本あり、3色の団子2個ずつ計6個が刺さっている。これらを1個ずつ移し替えて、ある状態からある状態へと遷移させる、というゲーム。移動できるのは各串で一番上にある団子だけ。団子の大きさのような概念はなく、高さ3以内であればどこにでも動かせる。単純なルールだがなかなかに奥が深く、じっくり考えて動かさないと最適な手順で達成するのは意外に難しい。パズルオーディションというもので最
防衛省サイバーコンテスト 2025 writeup - st98 の日記帳 - コピー
- 161 users
- nanimokangaeteinai.hateblo.jp
- テクノロジー
- 2025/02/02
2/2に12時間というちょうどよい競技時間で開催された。21時終了だったけれども、11時45分ぐらいに最速で全完して1位🎉 第1回以来4年ぶりの優勝だ。昨年大会の第4回ではヒントの閲覧数で優勝を逃してしまって悔しい思いをしたので、雪辱を果たすことができ嬉しい。開始直後からずっと1位を独走できており、450名以上のプレイヤーがいる中で圧勝だったのも嬉しい。昨年度や一昨年度はバルクが作問を担当していたが、今回はAGESTが担当していた。これまでの問題と比較すると全体的に易化したように思うが、解くにあたって発想の大きな飛躍を必要とするいわゆる「エスパー要素」のある問題はごく一部を除いて存在しておらず*1、よかったと思う。また、昨年度・一昨年度に引き続きwriteupは公開可能というのもよかった。戦略というほどの戦略は立てていなかったけれども、とりあえずWebを見た後は全カテゴリを上から見て
10時間かかっていた遺伝的アルゴリズムをAWS Lambdaで高速化 - Insight Edge Tech Blog
- 111 users
- techblog.insightedge.jp
- テクノロジー
- 2025/06/30
こんにちは、Insight EdgeのLead Engineerの日下です。今回は、DEAPライブラリを利用した遺伝的アルゴリズムをAWS Lambdaで分散並列実行した話を紹介しようと思います。目次目次背景と課題並列化の方法の検討どこを並列化するか？どのように並列化するか？実装の方針呼び出し側コード Lambda側コードその他 Lambdaを呼び出すためのDEAPへのmap実装呼び出し側コード Lambda側コード今回の実装の工夫ポイント改善の評価まとめ前提クラウド基盤: AWS 言語: Python ライブラリ: DEAP 背景と課題ある案件で、遺伝的アルゴリズム (以下、GA)を用いた最適化処理により業務改善の実証実験をしていたところ、性能に課題があるということでデータサイエンティストチームから相談を受けました。当該処理は、EC2 (r7g.4xl
遅くないpandasの書き方 - ML_BearのKaggleな日常
- 92 users
- naotaka1128.hatenadiary.jp
- テクノロジー
- 2021/12/07
これは何？この記事は Kaggle Advent Calendar 2021 の7日目の記事です。 pandasはデータ分析ライブラリとして非常に便利ですが、書き方を間違えると簡単に処理が遅くなってしまうという欠点があります。そこで、この記事では遅くならない書き方をするために気をつけたいポイントをいくつかご紹介したいと思います。この Colab Notebookの実行結果をエクスポートした上で、不要な部分を一部削って記事にしています。colab notebook をコピーして実行してもらえれば再現することが可能なはずです。(colabにコメント等をいただいても返すことはできないと思います、すみません。) 前提条件この記事ではあくまで「遅くない(なりづらい)書き方を紹介する」ことに努めます。よって、以下のような改善点はあるが一旦考慮の外におくものとして話を進めます。並列化ライブラリ
- pandas
- python
- あとで読む
- プログラミング
- numpy
- Kaggle
- 高速化
ソースコード & ドキュメントに対応したGraph RAGの実装（Tree-sitter + LightRAG）
- 46 users
- zenn.dev/yumefuku
- テクノロジー
- 2025/06/02
(module (function_definition (identifier) # ← ここに関数名「sample_func」が含まれます (parameters) (block (expression_statement (call (identifier) (argument_list (string)))))) (expression_statement (call (identifier) (argument_list)))) ノードが色々取れましたが、「function_definition」が関数、その子である「identifier」が関数名を表すため、 function_definition == 子ノード ==> identifier となっている箇所を探索すれば抽出できます（関数ではあっても「lambda」など異なる場合もあります）。今回は上記のようにTree-si
大規模言語モデルの「脳波」をとって言葉を生成しているときにどこが活動しているのか見てみる - きしだのHatena
- 43 users
- nowokay.hatenablog.com
- テクノロジー
- 2023/04/27
ChatGPTなんかの大規模言語モデルが言葉を生成しているときに、どういう反応が起きているのか気になりますよね。きっと気になる。ということで、手元で動かせる言語モデルのニューラルネット各層での出力を表示してみました。 GPTにはGPTブロックが複数あって、それぞれのブロックが２層のニューラルネットレイヤを持っています。モデルを読み込んだあとでこういうコードを動かしてニューラルネットの出力の二乗を足していきます。 for idx, elm in enumerate(model.transformer.h): elm.ln_1.index = idx * 2 elm.ln_2.index = idx * 2 + 1 elm.ln_1.old_forward = elm.ln_1.forward elm.ln_2.old_forward = elm.ln_2.forward def new_
- AI
- 脳
- あとで読む
- 言語
- article
Sakana.aiが公開した「Evolutionary Model Merge」手法を「mergekit」で実施してみる - Taste of Tech Topics
- 41 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/05/07
皆さんこんにちは機械学習チームYAMALEXの@tereka114です。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。（詳細はリンク先をご覧ください。）日々、LLMが進化していて、画像が本職（のはず）の私ですら、ここ数年LLMの勉強をはじめています。学習してモデル公開しましたといった記事はよく見ますが、今回は今、非常に注目されている日本に拠点があるAIスタートアップである「Sakana.ai」が公開した「Evolutionary Model Merge」を使う話をします。 Evolutionary Model Merge 「Evolutionary Model Merge」は「Sakana.ai」から発表された進化的モデルマージと呼ばれる技術です。端的に言ってしまえば、複数のモデルを利用して新し
- LLM
- あとで読む
- 生成AI
- 人工知能
- 機械学習
- techfeed
- AI
ChatGPT時代に必要かも!? Pythonで実行するファイルパース（PDF編） | DevelopersIO
- 37 users
- dev.classmethod.jp
- テクノロジー
- 2023/05/02
こんちには。データアナリティクス事業本部インテグレーション部機械学習チームの中村です。今回は話題のChatGPTにコンテキストを与える際に必要となるファイルパース処理について見ていきたいと思います。本記事ではPDFに焦点を絞ってみていきます。既存のライブラリ内の実装も確認していきます。先行事例の実装先行事例の実装として、よく話題となる以下のライブラリを見ていきます。（LlamaIndexとLlamaHubはほぼ同じですが、parserとしては片方にしかないものもあるため） LlamaIndex https://github.com/jerryjliu/llama_index https://gpt-index.readthedocs.io/en/latest/index.html LlamaHub https://github.com/emptycrown/llama-hu
- python
- pdf
- ChatGPT
「500年後に日本人が佐藤だけになる」という試算の問題と改善 - ill-identified diary
- 32 users
- ill-identified.hatenablog.com
- テクノロジー
- 2024/04/21
この記事の要約はじめに問題点の要約 (追記) 先行研究について GARCH(っぽい)モデルによるシミュレーションシミュレーション前の理論分析選択的夫婦別姓との比較 (追記) ゴルトン゠ワトソン分枝過程について使用するデータシミュレーションの技術的な補足乱数生成について GARCHモデルの結果シミュレーションの追試より複雑なシミュレーションについて男女別世代重複創作苗字三親等の婚姻禁止ルールより高度な人口学的モデル結論 2024/4/22: 先行研究とゴルトン゠ワトソン分枝過程の解説の追記 2024/4/23: 多数の言い回しのおかしい箇所の校正 2024/4/24: グラフ上の記載ミスとグラフ描画コードを修正この記事の要約先日報道された「500年後に日本人が佐藤だけになる」という試算の内容に違和感を覚えた. 資料を確認してみると, 大きな問題のある方法で試
Embedding Model を用いたキーフレーズ抽出の検証といろんな Embedding Model の比較 - ABEJA Tech Blog
- 31 users
- tech-blog.abeja.asia
- テクノロジー
- 2024/12/11
こんにちは！ABEJAでデータサイエンティストをしている藤原です。ABEJAアドベントカレンダー2024 の11日目のブログになります！キーフレーズ抽出を簡単に試すという機会がよくあるのですが、簡単に検証する範囲だといつも同じツール・モデルを使っているため、他の方法でも上手くキーフレーズ抽出ができないか？ということで今回いくつか検証してみました。やることとしては、まず Embedding Model を使って日本語の長めの文章からキーフレーズを上手く抽出できるか？というのを検証します。その上で、色々な Embedding Model 間で抽出されるフレーズがどのように違うか？も比較してみます。目次目次はじめにキーワード抽出・キーフレーズ抽出とは？キーフレーズ抽出の手法 1. グラフベース・統計ベース 2. LLM ベースのアプローチ 3. Embedding ベースのアプローチ
- 自然言語処理
- あとで読む
分散密ベクトル探索エンジンValdとSentence-BERTを使った類似文書検索を試す - エムスリーテックブログ
- 31 users
- www.m3tech.blog
- テクノロジー
- 2021/06/07
エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(@po3rin) です。好きな言語はGo。仕事では主に検索周りを担当しています。 Overview 最近、社内で情報検索論文輪読会を立ち上げました。情報検索論文読み会のスケジュールそこでNGT-ONNGについての論文*1を紹介したところ1時間の予定のところを盛り上がりすぎて2時間超えてしまいました。大盛り上がりのついでに、今回は情報検索論文輪読会で紹介した近似最近傍探索ライブラリNGTを内部で利用するValdを使って、類似文書検索がどのように出来るのか、現状の問題を解決できるのかを試したのでその結果を報告します。 Overview 弊社が抱える類似文書検索の課題 Sentence-BERT Valdを使った近似最近傍探索 NGT Vald Vald×Sententce-BERTで類似文書
- BERT
- nlp
- 機械学習
- search
- 自然言語処理
NumPyroによる項目反応理論と垂直尺度化の実装方法を解説。学年をまたいだ学力調査など、異なるテスト結果を正しく比較したい人、必見！ - ドワンゴ教育サービス開発者ブログ
- 30 users
- blog.nnn.dev
- テクノロジー
- 2025/10/16
目次目次 ZEN Studyにおける学力定量化の試みと狙い項目反応理論とベイズ推定のおさらい NumPyroの概要 NumPyroによるIRTモデルの実装環境構築モデル定義と計算実行人工データの生成サンプラーの指定とサンプリングの実行サンプリング結果の確認事後サンプリングの可視化 ArviZの利用トレースプロット自己相関フォレストプロット事後予測モデルチェックベイズ的 $p$ 値垂直尺度化のためのモデル拡張多群IRTモデルの実装固定項目パラメタ法の実装落ち穂拾い【MCMCの実用上の注意点】おわりに We are hiring! ZEN Studyにおける学力定量化の試みと狙いこんにちは。ドワンゴ教育事業本部のデータサイエンティストの板宮です。主に学力測定基盤の開発を担当しています。ドワンゴの教育事業本部では、ZEN Studyと呼ばれる、N高グループ
投資家IPランドスケープ・スタートアップ支援IPランドスケープ・大学支援用に改良中　更新中）tfidf etc embeddings cluster reconstructing vis:　特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成（類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加） - Qiita
- 30 users
- qiita.com/kzuzuo
- テクノロジー
- 2023/05/15
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 投資家IPランドスケープ・スタートアップ支援IPランドスケープ・大学支援用に改良中　更新中）tfidf etc embeddings cluster reconstructing vis:　特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成（類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加）自然言語処理NLP可視化Visualization特許これは何複数の特許等の文章を「特定の母集団における互いの類似度」を元
- 検索
- 特許
- ChatGPT
- あとで読む
- 文章
- qiita
- 機械学習
TransformersのPipelinesで日本語固有表現抽出 - Retrieva TECH BLOG
- 27 users
- tech.retrieva.jp
- テクノロジー
- 2021/08/30
こんにちは。TSUNADE事業部研究チームリサーチャーの坂田です。本記事では、Hugging Face 社が開発しているTransformersのPipelinesという仕組みを使って日本語の固有表現抽出を行う方法をご紹介します。 Transformersとは？日本語学習済み言語モデル Pipelines Trainer 固有表現抽出とは？実際に日本語NERTを試してみる必要な各種依存ライブラリのインストール使用するデータ日本語固有表現抽出データセットでのFine-tuning Pipelinesを使った固有表現抽出実行例おわりに参考 Transformersとは？ TransformersはHuggingFace社が公開しているPython用ライブラリで、BERTを始めとするTransformer系の言語モデルを使用する際のデファクトスタンダードになっています。また、最
Python アプリケーションのパフォーマンス調査に便利な Cloud Profiler の結果を見るコツ - GO Tech Blog
- 27 users
- techblog.goinc.jp
- テクノロジー
- 2024/12/15
この記事はGO Inc. Advent Calendar 2024 14日目の記事です。こんにちは。AI技術開発部の牧瀬です。 Python アプリケーションのパフォーマンスチューニングに使えるプロファイラはいくつかありますが、本番環境でも使えるものとして Google Cloud Profiler があります。本記事では様々なサンプルコードで Cloud Profiler の挙動を確認し、結果の読み方について注意点やコツをお伝えします。概要 Google Cloud では Cloud Profiler というものが提供されており、 Go, Python, Java, Node.js などのプログラムのプロファイリングを簡単に行うことができます。対象のプログラムは Google Cloud 上で動作しているものに限らず、他のクラウド上で動作しているプログラムや、ローカルマシン上で実
H200 GPU x 8基で Qwen2.5-VL-72B-Instruct を使った OCR を試してみる - ABEJA Tech Blog
- 26 users
- tech-blog.abeja.asia
- テクノロジー
- 2025/08/01
ABEJAでデータサイエンティストをしている藤原です。今回は、株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」で H200 GPU × 8基構成のシングルノードサーバを用いて、大規模モデルを使用した検証を実施しました。本記事では、その検証でのGPUサーバの使用方法や、検証内容の一つである Qwen2.5-VL-72B-Instruct を用いたOCRの結果についてご紹介します。 highreso.jp はじめに GPUクラウドサービス「GPUSOROBAN」について GPUサーバの使い方の方針と事前準備 Qwen2.5-VL-72B-Instruct を使った OCR を試してみる条件実装実行時のGPU使用状況と処理速度検証1. 通常の文書のOCR 検証2. チャート・グラフのようなテキストで表現されていない情報のテキスト化検証3. 複雑なレイアウトのドキュメ
- あとで読む
optunaの理論 - tomtom58’s blog
- 24 users
- tomtom58.hatenablog.com
- テクノロジー
- 2024/12/15
はじめに従来のフレームワークにおける課題 Optunaの設計思想 optunaの理論 Define-by-run APIの理論と実装サンプリングアルゴリズムの理論効率的な枝刈り（Pruning）メカニズム分散最適化の理論とアーキテクチャストレージバックエンドトライアルの同期と非同期実行実際のユースケースと性能評価ベンチマーク評価の理論的枠組み TPEとCMA-ESの組み合わせによる性能向上実世界での応用例システムの拡張性と実装の詳細カスタムサンプラーの実装カスタム枝刈り手法の実装実装上の最適化とパフォーマンスチューニングデータベースアクセスの最適化メモリ使用量の最適化並列処理の効率化ハイパーパラメータ探索の最適化実践的な使用方法とベストプラクティス探索空間の設計目的関数の設計計算リソースの最適配分実装例高度な機能とカスタマイズマルチ目的最適化
wav2vec 2.0 を使って手軽に音声認識モデルを触れるようになろう - NTT docomo Business Engineers' Blog
- 23 users
- engineers.ntt.com
- 世の中
- 2021/12/20
この記事は NTTコミュニケーションズ Advent Calendar 2021 の20日目の記事です。はじめにこんにちは。プラットフォームサービス本部アプリケーションサービス部の是松です。 NTTコミュニケーションズでは自然言語処理、機械翻訳、音声認識・合成、要約、映像解析などのAI関連技術を活用した法人向けサービスを提供しています。（COTOHA シリーズ） NTTコミュニケーションズがこのようなAI関連技術を活用したサービスを展開する強みとして、 NTT研究所の研究成果が利用可能であること自社の他サービスを利用しているお客様に対してシナジーのあるサービスを提案できることこの2点が挙げられると思います。実際に、私が担当している COTOHA Voice Insight は通話音声テキスト化によってコンタクトセンターの業務効率化・高度化を実現するサービスなのですが、 NTT研
BitNetでMNISTを学習させて見えてきた性質｜shi3z
- 22 users
- note.com/shi3zblog
- テクノロジー
- 2024/03/24
かれこれ一ヶ月弱くらいBitNetと格闘している。BitNetは、Microsoftが発明したと主張している1-Bit(1.58ビットとも言われる)量子化ニューラルネットワークのことだ。僕はその辺に落ちてるコードを使って最初の最初はlossが2くらいまで下がったのだが、そもそもLLMはlossが1を切らないと実用性がない。それ以降は6とか良くて5とかなのでたまたま最初に試したのがうまく行ったようだ。しかしいつまで経っても良くならないのでBitNetの性質を根本的に見直す必要があるのでは?と思い、初心に帰って論理回路を学習させようとした。 BitNetのコードベースははちさんのコードと、Microsoftの公式な論文の実装を併用した。まず試したのはこのようなコード from bitnet import * import torch from torch import optim im
- LLM
- 学習
- 勉強
- あとで読む
Agentic GraphRAG for Commercial Contracts | Towards Data Science
- 16 users
- towardsdatascience.com
- テクノロジー
- 2025/06/20
In every business, legal contracts are foundational documents that define the relationships, obligations, and responsibilities between parties. Whether it’s a partnership agreement, an NDA, or a supplier contract, these documents often contain critical information that drives decision-making, risk management, and compliance. However, navigating and extracting insights from these contracts can be a
- AI
- あとで読む
【機械学習】機械学習を用いたin silico screening【AI創薬】~第5/5 章候補化合物のin silico screening~ - LabCode
- 16 users
- labo-code.com
- テクノロジー
- 2024/02/15
AI創薬とは？AI創薬は、人工知能（AI）技術を利用して新しい薬物を発見、開発するプロセスです。AIは大量のデータを高速に処理し、薬物の候補を予測したり、薬物相互作用を評価したりします。また、AIは薬物の効果や安全性をシミュレートすることも可能で、臨床試験の前の段階でリスクを評価することができます。これにより、薬物開発のコストと時間を大幅に削減することが期待されています。AI創薬は、薬物開発の新しいパラダイムとして注目を集め、製薬企業や研究機関で積極的に研究、導入が進められています。また、バイオインフォマティクス、ケモインフォマティクス、機械学習、ディープラーニングなどの技術が組み合わされ、薬物開発のプロセスを革新しています。さらに、AI創薬は個人化医療の推進にも寄与し、患者にとって最適な治療法を提供する可能性を秘めています。今回はAI創薬の中でも、in silico screeenin
- 機械学習
- あとで読む
python_modules.pdf
- 13 users
- k-techlabo.org
- テクノロジー
- 2023/07/09
Python3 OpenCV / Pillow / pygame / Eel / PyDub / NumPy / matplotlib / SciPy / SymPy / gmpy2 / hashlib, passlib / Cython / Numba / ctypes / PyInstaller / curses / tqdm / JupyterLab / json / psutil / urllib / zenhan / jaconv Copyright © 2017-2025, Katsunori Nakamura 2025 8 19 Python ‘ .py’ Python Python Windows PSF Python py .py Enter macOS Linux PSF Python python3 .py Enter Anaconda Prompt Python p
- Python
- PDF
はじめての自然言語処理 Fusion-In-Decoder でクイズに答えるモデルを作る | オブジェクトの広場
- 13 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/09/07
今回は Fusion-In-Decoder を使ってクイズに答えるモデルを作ります。以前から Wikipedia 等の外部情報を参照できるテキスト生成モデルを試してみたいと思っていました。Fusion-In-Decoder の発表は 2020 年なので少し前のモデルですが、T5 ベースで手軽に試せるサイズ感ですので、日本語で試してみましょう。 1. はじめに今回紹介する Fusion-In-Decoder（以下、FiD ）1 は Meta AI (当時は Facebook AI Research) が発表した Open Domain question Answering タスクを解くテキスト生成モデルです。じつは、以前から外部情報を参照できるテキスト生成モデルを試してみたくて2、 Google の RETRO3 の論文を読んでたんです。なのですが、外部情報のサイズ感が 1000 B
- NLP
- 自然言語処理
- 機械学習
- 勉強
- language
- 言語
- 学習
The Quest for Netflix on Asahi Linux | Blog
- 12 users
- www.da.vidbuchanan.co.uk
- テクノロジー
- 2023/03/10
Welcome to my ::'########::'##::::::::'#######:::'######::: :: ##.... ##: ##:::::::'##.... ##:'##... ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##:::..::: :: ########:: ##::::::: ##:::: ##: ##::'####: :: ##.... ##: ##::::::: ##:::: ##: ##::: ##:: :: ##:::: ##: ##::::::: ##:::: ##: ##::: ##:: :: ########:: ########:. #######::. ######::: ::........:::........:::.......::::......:::: CTF writeups, prog
- linux
- あとで読む
【Python】PyTorch で作る Vertical Federated Learning - ENGINEERING BLOG ドコモ開発者ブログ
- 11 users
- nttdocomo-developers.jp
- テクノロジー
- 2022/12/01
NTTドコモ R&D Advent Calendar 2022 の1日目の記事です。井上と申します。アメリカのシリコンバレーにあるドコモの子会社，DOCOMO Innovations, Inc. (DII) でシニアデータサイエンティストとして機械学習の研究開発に従事しています。現在，DII は Amazon Web Services, Inc. とパートナーシップを組み，Federated Learning (連合学習, FL) の開発に取り組んでいます。 AWS Partner Network (APN) Blog の記事もご覧ください。本記事は，FL の中でも，特に Vertical Federated Learning (VFL) を PyTorch を用いて作り上げていくチュートリアルです。なお，本記事末尾に職場の紹介を載せていますので「シリコンバレーとか DII ってど
- あとで読む
LangChainについて解説。大規模言語モデル(LLM)を効率よく実装するためのフレームワーク - G-gen Tech Blog
- 10 users
- blog.g-gen.co.jp
- テクノロジー
- 2023/09/29
G-gen 又吉です。LangChain とは、大規模言語モデル (LLM) を効率よく実装するために使用するフレームワークです。当記事では LangChain を用いて、Google Cloud (旧称 : GCP) の LLM である PaLM 2 を操作する基本的な方法をご紹介します。はじめに Vertex AI PaLM API LLM 開発の課題学習コスト入力トークン制限事実と異なる回答最新情報に対応していない準備環境構築ライブラリの準備ユーティリティ関数を定義各 AI モデルを初期化 LangChain とは概要 Models 概要 LLMs Chat model Text Embedding Model Memory 概要 ConversationBufferMemory Prompts 概要 Prompt Template Output Parser
- Python
AHC006初心者向け解説～貪欲だけで順位表2ページ目を目指す～ - TERRYのブログ
- 9 users
- www.terry-u16.net
- テクノロジー
- 2021/11/26
ヒューリスティックコンテスト、楽しんでますか？私は楽しんでいます。最近企業AHCなんかも続々と出てきて、これからどんどん盛り上がってくれるんじゃないかと期待しています。とはいえ、ヒューリスティックコンテスト特有の取っつきづらさがあるのも確かです。「どこから手を付けていいか分からない……」「AHC後のTLに焼きなましとか2-optとか流れてきたけど何が何だか……」と思われた方も多くいらっしゃるのではないでしょうか？ AHC006は巡回セールスマン問題を発展させた問題なので、確かに2-optを使った焼きなましができると有利ではあります。しかし、専門知識がないと戦えないかというと全くそんなことはありません。この記事では、AtCoder Heuristic Contest 006 (AHC006)を題材として、焼きなまし → 使いませんビームサーチ → 使いません 2-opt → もちろん
Getting Started with Python
- 9 users
- www.ejable.com
- テクノロジー
- 2022/10/10
Python is a powerful programming language that provides many packages that we can use. Using the versatile Python programming language, we can develop the following: AutomationDesktop applicationAndroidWebIoT home automationData Science and the list goes on.In this article, our primary focus will be knowing how to start learning Python and the essentials required to be a data scientist. Below is t
- あとで読む
はじめての自然言語処理 Hugging Face Transformers で T5 を使ってみる | オブジェクトの広場
- 8 users
- www.ogis-ri.co.jp
- テクノロジー
- 2021/06/18
前回が分量的にやたらと重かったので、今回はその反省(反動?)を踏まえて軽い感じでいってみます。第7回で紹介した T5 ですが Hugging Face の Transformers でもサポートされてますので、その使用方法をご紹介したいと思います。 1. はじめに今回は久しぶりに T5 の話です。T5 に関しては第7回、第8回で一度紹介しているので、未読の方は記事に目を通してから戻ってきて頂けると、より理解がしやすいと思います。さて、 T5 ですが Google のオリジナルコード(以下 “t5"と記述)1は敷居が高いと感じる方もいらっしゃるのではないでしょうか。 Estimator API ベースのコードや gin による設定など慣れていないと、とっつきにくいのではないかと思います。そこで今回は Hugging Face の Transformers 2を使って T5 を動かす方法
- あとで読む
Apple Silicon M1 は自然言語処理も、ちょっと速いよ - Qiita
- 8 users
- qiita.com/asamiKA
- テクノロジー
- 2020/12/26
# コードの大部分は以下のチュートリアルによる。 # https://www.tensorflow.org/tutorials/text/nmt_with_attention?hl=ja # 元のコンテンツは Creative Commons Attribution 4.0 License の下で公開されている。 import io import os import re import time import unicodedata import tensorflow as tf path_to_zip = tf.keras.utils.get_file( 'spa-eng.zip', origin='http://storage.googleapis.com/download.tensorflow.org/data/spa-eng.zip', extract=True) path_to_
- Apple
【目的別】コピペから始めるCython入門 ~はじめてのコンパイルから自作package化まで~ — HACK The Nikkei
- 7 users
- hack.nikkei.com
- テクノロジー
- 2022/02/22
データサイエンティスト(?)の青田です。これは Nikkei Advent Calendar 2021 の 25 日目の記事です。はじめに本記事では Cython を用いるときに発生しがちなつまずきポイントについて実用的な具体例を示す。つまずきポイントをほぼコピペで乗り越えられることを意識して執筆した。すでに数多くのブログや公式ドキュメントがある中でこれを書いたモチベーションがある。 Cython はコンパイルしようとするだけでも 4 種類のやり方が存在し、型宣言の仕方は 3 種類の作法があり、numpy との連携方法は 2 種類存在する。このように同じことをやろうとしたときの選択肢の多さが混乱を招いているように感じた。いろんな流派が存在するものの、ここでは自分の方法を目的別に示す。これにより、利用者の選択の時間を削減し、Cython を道具として使いやすくなるだろう。本記事は以
【Python】HANTSを用いた時系列補正【時系列データ】 - LabCode
- 7 users
- labo-code.com
- テクノロジー
- 2024/07/04
HANTS法とは？HANTS（Harmonic ANalysis of Time Series）は、リモートセンシングデータの時系列解析に使用される手法の一つで、時系列データを周期的な成分（調和成分）に分解し、ノイズや異常値を除去しながらデータを再構築する手法です。今回はNDVIでよく利用されるZhou et al., 2015の方法をもとに、この方法の基本的な考え方と動作原理を以下に解説します。 HANTSの基本概念1. 理論的背景HANTS法は、フーリエ級数展開の考え方を基礎としています。フーリエ級数展開では、任意の周期関数を正弦波と余弦波の和で表現できるという原理を用います。HANTS法は、この原理を時系列データに適用し、データに含まれる様々な周期成分を抽出します。 2. 基本モデルHANTS法では、時系列データ $y(t_j)$を以下のようにモデル化します： $$ \tilde{y
あすけんSlackの人気絵文字ランキング - asken テックブログ
- 7 users
- tech.asken.inc
- テクノロジー
- 2021/08/27
はじめまして！ askenのユウマと申します😊 shoku-pan🍞という名前でTwitterをやっています。 askenでは、MLエンジニアとして働いてます。主に、画像処理や自然言語処理、データサイエンス周りを担当しています。また、業務効率化のためのツールの作成や、ナレッジ共有のための社内勉強会を開いたりもしてます。社外では、kaggleやatmaCupに参加したり、データサイエンティストの方達ともくもく作業したりと、ゆるゆると活動しています。さて、先日以下のTweetが弊社のエンジニアの間で話題になりました。 7月に実施した全社キックオフの余興として、SmartHRのSlackで使われた絵文字のランキングを動くグラフにしてみました📊 絵文字って会社のカルチャーがめっちゃでますね🥰https://t.co/QYLNptK4e7 pic.twitter.com/CLaeu8
- AI
- あとで読む
Pythonでマンデルブロ集合を美しく描画する(摂動論編) - Qiita
- 7 users
- qiita.com/T-STAR
- テクノロジー
- 2023/07/08
はじめにマンデルブロ集合の描画を普通に実装していると、浮動小数点表現の限界により意外と簡単に拡大率の上限に達する。例えばFloat64でも倍率は1E14あたりが限界になるが、複雑で面白い画像はもっと深い場所にあったりする。ここで、摂動論(Perturbation Theory)の考え方を導入すると、この限界を大幅に伸ばすことができる。本記事ではその理論や実装方法、さらに高速化の手法として2023年時点で主流であるBLAも紹介する。本記事は以下の記事の続編。実験用コード摂動論摂動論についてWikipediaの説明から引用する。考えている問題Aを、厳密に解ける問題Bに小さな変更（摂動）が加えられた問題であるとみなす。問題Aの近似解は、問題Bの厳密解に、摂動が加わったことによって生じる小さな補正（摂動項）を加えたものであると考える。ここで求めるべき摂動項は、問題Bの厳密解の組み