本文「pickle python load」を検索 - はてなブックマーク

1 - 32 件 / 32件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

pickle python loadの検索結果1 - 32 件 / 32件

日本のウェブデザインの特異な事例
- 695 users
- okuranagaimo.blogspot.com
- テクノロジー
- 2022/11/26
sabrinas.spaceより。 8週間もかからなかったはずのプロジェクト日本のウェブデザインはどう違うのか? 2013年のRandomwireのブログ投稿で、著者(David)は、日本のデザインの興味深い相違点を強調しました。日本人はミニマリストのライフスタイルで海外に知られていますが、ウェブサイトは奇妙なほどマキシマリストです。ページには様々な明るい色(3色デザイン原則を破っている)、小さな画像、そして多くのテキストが使われています。2022年11月に撮影されたこれらのスクリーンショットで、自分の目で確かめて下さい。ブログ投稿には、文化的専門家、デザイナー仲間、そして不満を抱く市民によって支持されている、考えられる理由がいくつか挙げられていました。この理論が今でも正しいのか、また、もっと定量的なアプローチが可能なのか気になったのでやってみました。私が見つけたもの各国の最も人
- デザイン
- あとで読む
- web
- design
- 日本
- webデザイン
- ui
- webdesign
- ウェブサイト
- ネット
10時間かかっていた遺伝的アルゴリズムをAWS Lambdaで高速化 - Insight Edge Tech Blog
- 113 users
- techblog.insightedge.jp
- テクノロジー
- 2025/06/30
こんにちは、Insight EdgeのLead Engineerの日下です。今回は、DEAPライブラリを利用した遺伝的アルゴリズムをAWS Lambdaで分散並列実行した話を紹介しようと思います。目次目次背景と課題並列化の方法の検討どこを並列化するか？どのように並列化するか？実装の方針呼び出し側コード Lambda側コードその他 Lambdaを呼び出すためのDEAPへのmap実装呼び出し側コード Lambda側コード今回の実装の工夫ポイント改善の評価まとめ前提クラウド基盤: AWS 言語: Python ライブラリ: DEAP 背景と課題ある案件で、遺伝的アルゴリズム (以下、GA)を用いた最適化処理により業務改善の実証実験をしていたところ、性能に課題があるということでデータサイエンティストチームから相談を受けました。当該処理は、EC2 (r7g.4xl
Claude Code×Obsidianで作るナレッジベース開発環境 - YOUTRUST Tech Blog
- 71 users
- tech.youtrust.co.jp
- テクノロジー
- 2025/06/30
この記事で得られること ✅ 30分の会議を5分で議事録化する自動化フロー ✅ 開発量を2.5倍に増やした具体的な環境構築方法 ✅ 情報検索を30秒以内に短縮するナレッジ管理術 ✅ PRレビューを10点満点で自動評価する設定 ✅ すぐに使えるCLAUDE.md設定テンプレートとスクリプト TL;DR Claude CodeとObsidianを組み合わせることで、議事録作成時間を66%削減、開発コントリビューションを2.5倍に増加させました。Tactiq→Google Drive→Obsidianの自動化フローと、AIに最適化されたナレッジベース構築により、マネジメント業務をこなしながらも効率的な開発を実現。本記事では実際の設定ファイルとワークフローを公開します。こんにちは、YOUTRUSTでエンジニアリングマネージャーをしている須藤（YOUTRUST/X）です。AI爆速普及委員会の委員長と
- obsidian
- Claude
- あとで読む
- AI
the peculiar case of japanese web design - sabrinas.space
- 42 users
- sabrinas.space
- テクノロジー
- 2022/11/25
the peculiar case of japanese web design a project that should not have taken 8 weeks how is japanese web design different? in this 2013 Randomwire blog post, the author (David) highlighted an intriguing discrepancy in Japanese design. While the nation is known abroad for minimalist lifestyles, their websites are oddly maximalist. The pages feature a variety of bright colours (breaking the 3 colou
- design
- デザイン
- japan
- web
- フォント
- あとで読む
巨人の肩に乗る
- 42 users
- zenn.dev/ymd
- テクノロジー
- 2025/12/24
本記事は仮想通貨 Advent Calendar 2025 の24日目の記事です。はじめにはじめまして、ymdと申します。普段は、株や暗号資産の分析をし、マーケットが盛り上がったときに落ちているお金を拾っています。今年のAdvent Calendarを眺めていると、DEXの分析やLLMを活用した自動トレード戦略作成など、非常に有益な記事が目白押しです。これらを見て思い出したのが、ニュートンの「巨人の肩に乗る」という言葉。本記事では、この精神に倣い、AIの力と先人の知見という2つの「肩」を借りながら、お金拾いの方法を探っていきます。 AIの肩に乗る AI駆動開発の3つのアプローチ AIを活用した開発には、大きく3つの方向性があります：情報収集の自動化：論文や API ドキュメントの要約戦略生成の自動化：複数のアプローチを並行生成コーディングの自動化：コードそのものを AI に
- AI
- あとで読む
- Stock
- 解説
- 論文
- data
- 投資
【機械学習】機械学習を用いたin silico screening【AI創薬】~第4/5 章予測モデルの作成~ - LabCode
- 21 users
- labo-code.com
- テクノロジー
- 2024/02/12
AI創薬とは？ AI創薬は、人工知能（AI）技術を利用して新しい薬物を発見、開発するプロセスです。AIは大量のデータを高速に処理し、薬物の候補を予測したり、薬物相互作用を評価したりします。また、AIは薬物の効果や安全性をシミュレートすることも可能で、臨床試験の前の段階でリスクを評価することができます。これにより、薬物開発のコストと時間を大幅に削減することが期待されています。AI創薬は、薬物開発の新しいパラダイムとして注目を集め、製薬企業や研究機関で積極的に研究、導入が進められています。また、バイオインフォマティクス、ケモインフォマティクス、機械学習、ディープラーニングなどの技術が組み合わされ、薬物開発のプロセスを革新しています。さらに、AI創薬は個人化医療の推進にも寄与し、患者にとって最適な治療法を提供する可能性を秘めています。今回はAI創薬の中でも、in silico screeeni
- 機械学習
【機械学習】機械学習を用いたin silico screening【AI創薬】~第5/5 章候補化合物のin silico screening~ - LabCode
- 16 users
- labo-code.com
- テクノロジー
- 2024/02/15
AI創薬とは？AI創薬は、人工知能（AI）技術を利用して新しい薬物を発見、開発するプロセスです。AIは大量のデータを高速に処理し、薬物の候補を予測したり、薬物相互作用を評価したりします。また、AIは薬物の効果や安全性をシミュレートすることも可能で、臨床試験の前の段階でリスクを評価することができます。これにより、薬物開発のコストと時間を大幅に削減することが期待されています。AI創薬は、薬物開発の新しいパラダイムとして注目を集め、製薬企業や研究機関で積極的に研究、導入が進められています。また、バイオインフォマティクス、ケモインフォマティクス、機械学習、ディープラーニングなどの技術が組み合わされ、薬物開発のプロセスを革新しています。さらに、AI創薬は個人化医療の推進にも寄与し、患者にとって最適な治療法を提供する可能性を秘めています。今回はAI創薬の中でも、in silico screeenin
- 機械学習
- あとで読む
A simple search engine from scratch*
- 13 users
- bernsteinbear.com
- テクノロジー
- 2025/05/21
*if you include word2vec. Chris and I spent a couple hours the other day creating a search engine for my blog from “scratch”. Mostly he walked me through it because I only vaguely knew what word2vec was before this experiment. The search engine we made is built on word embeddings. This refers to some function that takes a word and maps it onto N-dimensional space (in this case, N=300) where each d
- Search
- あとで読む
はじめての自然言語処理 Fusion-In-Decoder でクイズに答えるモデルを作る | オブジェクトの広場
- 13 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/09/07
今回は Fusion-In-Decoder を使ってクイズに答えるモデルを作ります。以前から Wikipedia 等の外部情報を参照できるテキスト生成モデルを試してみたいと思っていました。Fusion-In-Decoder の発表は 2020 年なので少し前のモデルですが、T5 ベースで手軽に試せるサイズ感ですので、日本語で試してみましょう。 1. はじめに今回紹介する Fusion-In-Decoder（以下、FiD ）1 は Meta AI (当時は Facebook AI Research) が発表した Open Domain question Answering タスクを解くテキスト生成モデルです。じつは、以前から外部情報を参照できるテキスト生成モデルを試してみたくて2、 Google の RETRO3 の論文を読んでたんです。なのですが、外部情報のサイズ感が 1000 B
- NLP
- 自然言語処理
- 機械学習
- 勉強
- language
- 言語
- 学習
Edge AI Just Got Faster
- 13 users
- justine.lol
- テクノロジー
- 2023/04/06
When Meta released LLaMA back in February, many of us were excited to see a high-quality Large Language Model (LLM) become available for public access. Many of us who signed up however, had difficulties getting LLaMA to run on our edge and personal computer devices. One month ago, Georgi Gerganov started the llama.cpp project to provide a solution to this, and since then his project has been one o
【Python】新潟県に一番似ている国は○○？各都道府県に似た形の国を調べてみた - ENGINEERING BLOG ドコモ開発者ブログ
- 7 users
- nttdocomo-developers.jp
- テクノロジー
- 2022/12/05
はじめにこの記事はNTTドコモアドベントカレンダーの4日目の記事です。こんにちは、NTTドコモサービスイノベーション部の福島です。こちらの日本地図、おかしなところがあります。気づきますでしょうか。正解は少し下にあります。話は変わりますが、以前テレビを見ていると「日本地図の四国をオーストラリアに変えても気づかないのでは？」という検証をやっていました。また、パスタが名物の群馬県高崎市の特集番組では、市の形もパスタの本場のイタリアと似ているというトリビアが紹介されていました。名前は知っていても国の形までは知らない国って結構あるな、各都道府県の形に似ている国って知らないだけで実はあるんじゃないかな、と気になったので調べてみます。冒頭の日本地図ですが、正解は九州の各県が別の国のシルエットに置き換えられていました。実現方法図形の形の類似度を数値化するライブラリが無いか調べてみると、最
- Python
scikit-learnの学習結果をpickleしない - Qiita
- 6 users
- qiita.com/nonbiri15
- テクノロジー
- 2021/08/12
機械学習を簡単に行うための有用なライブラリの一つはscikit-learnである。この文書では、scikit-learnの学習結果をpickleしないで済ます方法について述べる。 scikit-learnの特徴各種識別器の学習・予測・評価方法のためのインターフェースがそろえてある設計。各種アルゴリズムを試して、比較しやすい。ドキュメントが充実している。前提 python scikit-learn pickle scikit-learn に欠けているもの scikit-learnで学習した結果を保持するための枠組みが不足している。そのため、sckit-learnで作った学習済みの識別器をpickleして、それをpickl.loads(pickle済みのファイル)して使ってしまうということをしてしまいやすい。問題点 scikit-learn のサイトでも、pickleしたものを使
- python
- 機械学習
はじめての自然言語処理 DeepSpeed-Chat による RLHF の紹介 | オブジェクトの広場
- 6 users
- www.ogis-ri.co.jp
- テクノロジー
- 2023/07/14
今回は DeepSpeed-Chat による RLHF のご紹介です。正直、データセットや計算資源の都合もあり、とりあえず動かしてみました！的な話にはなりますが、RLHF の効果が実際に確認できるか見てみたいと思います。 1. はじめに今回は DeepSpeed-Chat1 を使って RLHF を試してみたいと思います。RLHF は Reinforcement Learning from Human Feedback の略で文字通り「人からのフィードバックを用いた強化学習」ということですね。OpenAI が InstructGPT(ChatGPT の元になったモデル)2 で使ったことで注目された手法になります。 LLM がらみで何か記事にしたいと思いつつ、日々新たな LLM が発表されている昨今に、隔月＆内容が実時間から月単位で遅れ気味wの本連載です。「どうしたもんかな。。。」と悩みに
- 機械学習
- 言語
Tutorial: ChatGPT Over Your Data
- 6 users
- blog.langchain.com
- テクノロジー
- 2023/02/13
Note: See the accompanying GitHub repo for this blogpost here. ChatGPT has taken the world by storm. Millions are using it. But while it’s great for general purpose knowledge, it only knows information about what it has been trained on, which is pre-2021 generally available internet data. It doesn’t know about your private data, it doesn’t know about recent sources of data. Wouldn’t it be useful i
- あとで読む
MACEによる機械学習を用いた分子動力学計算【MD simulation】 - LabCode
- 6 users
- labo-code.com
- テクノロジー
- 2025/02/26
宣伝こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます！【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 MACEとはMACEは、機械学習ポテンシャル（Machine Learning Potential）の一種として開発されたツールで、材料内の原子間相互作用を高精度かつ高速に予測できるのが特
ブラウザサイドでNumPyもscikit-learnもできるPython環境「Pyodide」がすごい
- 5 users
- zenn.dev/bluepost
- テクノロジー
- 2022/04/27
Pyodideとは WASM上にビルドされたPython+NumPyなどのデータ分析ライブラリの実行環境です。これまでにwebでPythonを使うとしたら、サーバサイドで使うか、BrythonのようなものでJavaScriptにトランスパイルするしかありませんでした。Brythonもajaxができたり結構な数の標準モジュールがサポートされていたりとすごいんですが、仕組み上NumPyのようなCによる低レイヤー拡張を含む外部ライブラリは使えません。そこに出てきたのがPyodideです。これはWASMで全部まるっとコンパイルしているので、NumPyもscikit-learnも使えます。get startedしたらあまりの簡単さとポテンシャルにひっくり返ったので書いておきます。 github: https://github.com/pyodide/pyodide ドキュメント: https:/
- Python
Demystify RAM Usage in Multi-Process Data Loaders
- 5 users
- ppwwyyxx.com
- テクノロジー
- 2023/01/19
A typical PyTorch training program on 8 GPUs with 4 dataloaderworkers per GPU would create at least processes.A naive use of PyTorch dataset and dataloader can easilyreplicate your dataset's RAM usage by 40 times. This issue has probably affected everyone who has done anything nontrivial with PyTorch.In this post, we will explain why it happens, and how to avoid the 40x RAM usage. All code example
Python AIプログラミング　その1　環境構築、文字認識 - Qiita
- 4 users
- qiita.com/yk0807
- テクノロジー
- 2024/07/08
import cv2 import pickle from sklearn.model_selection import train_test_split from sklearn import datasets, svm, metrics from sklearn.metrics import accuracy_score def learn(): # データを読み込む --- (*1) digits = datasets.load_digits() x = digits.images y = digits.target x = x.reshape((-1, 64)) # 二次元配列を一次元配列に変換 --- (*2) # データを学習用とテスト用に分割する --- (*3) x_train, x_test, y_train, y_test = \ train_test_split(x,
はじめての自然言語処理 Transformer 系モデルの推論高速化の検証 | オブジェクトの広場
- 4 users
- www.ogis-ri.co.jp
- テクノロジー
- 2023/03/31
今回は Transformer 系のモデル、具体的には BERT, T5, GPT の推論を高速化してみます。高速化手法として FasterTransformer, Torch-TensorRT, AWS Neuron を用い、素の transfomers に比べ、どの程度速くなるか（ならないか）、利点・欠点を確認してみましょう。 1. はじめに今回は Transformer 系のモデル、具体的には BERT, T5, GPT の推論を様々な技術を使って高速化してみます。高速化の元ネタは Hugging Face の transformers1 縛りとして、素の transformers で推論する場合に比べ、どの程度速くなるか（ならないか）見てみましょう。推論を高速化する技術としては FasterTransfomer2, Torch-TensorRT3, AWS Neuron(
［解決！Python］バイナリファイルを読み書きするには：pickle編
- 4 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2021/06/01
pickleモジュールを使用して、Pythonのオブジェクトを直列化／復元（pickle化／非pickle化、シリアライズ／デシリアライズ）する方法と、その際の注意点を紹介する。 import pickle favs = ['beer', 'sake'] mydata = {'name': 'かわさき', 'age': 999, 'weight': 123.4, 'favs': favs} # pickle化してファイルに書き込み with open('pickled.pkl', 'wb') as f: pickle.dump(mydata, f) # 非pickle化 with open('pickled.pkl', 'rb') as f: mydata2 = pickle.load(f) favs2 = mydata['favs'] print(mydata2) # 出力結果 # {'
- Python
Python + Seleniumで何度もログインするのを避けたい - 日記とか、工作記録とか
- 4 users
- windvoice.hatenablog.jp
- テクノロジー
- 2021/08/26
Python + Selenium (Chromedriver)を使って、Webを巡回する仕組みを作ったりしています。 Webサイトにログイン、情報を読み取って保存、属性も併せて保存など、ひととおり自動化できて便利です。しかしSeleniumは起動したその都度初期化され、状態は保存されません。次の起動時にはログイン状態も初期化され、何度も繰り返しログインすることになるのです。サイト側に不審なアクセスと判断されないかとか、心配になったりするわけです。今回、TweetDeckで流れていくタイムラインの情報を保存、クラスタリングして遊べないかなと試行錯誤していたのですが、TweetDeckってログインするたびに「新しい環境からのログインがありました」とスマホに通知がくるので、心配になりました。その流れで、pickleを使うと簡単にcookieを保存しておくことができ、またそれをリストアす
- selenium
- python
【PCDUA】第1回国土交通省地理空間情報データチャレンジの戦い方を考える - たかいとの備忘録
- 4 users
- takaito0423.hatenablog.com
- テクノロジー
- 2024/10/24
はじめに第1回国土交通省地理空間情報データチャレンジに関しては，以下をご参考ください． signate.jp 金融データ活用チャレンジでも実施していたように，今回もbaselineとなるようなnotebookを共有することができたらと思います．キックオフイベントにも参加させてもらいましたが，コンペ開催の目的など，とてもポジティブなものであり，コンペが盛り上がるといいなと思っております．（記事投稿の理由も少しでもコンペの活性化に貢献することを意識しており，最低限の実装とコンペを進める上で手詰まりを避けるためのアイデアをいくつか書かせていただきました．）当該コンペはディスカッション（フォーラム）がなく，金融データ活用チャレンジでもbaselineコードなどの共有が少なかったため，コードを共有することにしました．また，ルールに書いてはありませんが，signateのコンペはたいてい前処
- data
Stable Diffusionファインチューニング用のColab
- 3 users
- birdmanikioishota.blog.fc2.com
- テクノロジー
- 2022/09/01
申し訳ありません間違えてckpt設置前に実行してしまいました正しくは以下エラーです Global seed set to 23 Running on GPUs 0, Loading model from ./checkpoint/sd-v1-4-full-ema.ckpt Traceback (most recent call last): File "main.py", line 614, in <module> model = load_model_from_config(config, opt.actual_resume) File "main.py", line 26, in load_model_from_config pl_sd = torch.load(ckpt, map_location="cpu") File "/usr/local/lib/python3.7/dist
Version 1.0
- 3 users
- scikit-learn.org
- テクノロジー
- 2021/09/10
Version 1.0# For a short description of the main highlights of the release, please refer to Release Highlights for scikit-learn 1.0. Legend for changelogs Major Feature something big that you couldn’t do before. Feature something that you couldn’t do before. Efficiency an existing feature now may not require as much computation or memory. Enhancement a miscellaneous minor improvement. Fix somethin
【Network pharmacology】化合物からの標的タンパク質予測【in silico 創薬】 - LabCode
- 3 users
- labo-code.com
- テクノロジー
- 2025/09/16
Network pharmacologyとは？Network pharmacology（ネットワーク薬理学）は、漢方薬や機能性食品に含まれる複数の成分が、体内のさまざまな標的（タンパク質、遺伝子など）に同時に作用し、複雑な生理的効果をもたらす仕組みを「ネットワーク」として解析する手法です。従来の薬理学が「1成分＝1標的」の考え方に基づいていたのに対し、ネットワーク薬理学は「多成分＝多標的＝多経路」の全体像をとらえます。たとえば、漢方薬「黄芩」に含まれるバイカリンなどの成分が、乳がんに関与する複数の遺伝子やシグナル経路に作用している可能性を、各種データベースを用いて可視化できます。これにより、伝統的処方の有効性を科学的に裏付けたり、新たな疾病への応用可能性を探索したりすることができます。 Network pharmacologyの流れ成分取得：PubChemなど各種データベースを使って、
Spotify で再生中の曲を定期的に YouTube Live のチャットに書き込む Now Playing Bot を作ってみた | DevelopersIO
- 3 users
- dev.classmethod.jp
- テクノロジー
- 2021/06/05
はじめにテントの中から失礼します、CX 事業本部のてんとタカハシです！ YouTube Live で配信を行うことが私の日常なのですが、そんなに視聴してくれる方が多いわけでもないので、チャット欄が結構寂しいです。そこで、Spotify で再生中の曲を定期的に書き込んでくれる Now Playing Bot を作ってチャット欄を賑わせてみました。ソースコードは下記リポジトリに置いています。 GitHub - iam326/now-playing-bot-on-youtube-live デモチャット欄がこんな感じになります。前提条件この Bot を動かすための前提条件は下記の通りです。 YouTube Live を配信可能なアカウントを所持していること YouTube Data API を使用するために必要な認証情報が作成済みであること Spotify Web API を使用するた
- python
- youtube
New research, tooling, and partnerships for more secure AI and machine learning | Microsoft Security Blog
- 3 users
- www.microsoft.com
- テクノロジー
- 2023/03/03
Today we’re on the verge of a monumental shift in the technology landscape that will forever change the security community. AI and machine learning may embody the most consequential technology advances of our lifetime, bringing huge opportunities to build, discover, and create a better world. Brad Smith recently pointed out that 2023 will likely mark the inflection point for AI going mainstream, t
Locality Sensitive Hashingを用いた大規模コーパスの準重複文書排除
- 3 users
- zenn.dev/d2c_mtech_blog
- テクノロジー
- 2023/11/24
0. はじめにこんにちは、株式会社D2Cデータサイエンティストの董です。 D2Cでは、広告配信を効率よく効果よく行うために様々な機械学習モデルを活用しています。今回の記事では、大規模テキストコーパスを用いた言語モデルの学習にあたり、学習データにある準重複文書の除外テクニックについてご紹介します。 1. 開発環境 AWS EC2 (インスタンスタイプ: r5.8xlarge) Python 3.10系 2. Pythonパッケージ transformers scikit-learn 3. 広告文の準重複問題テキスト広告では、キャッチコピーや宣伝文を少しだけ修正して複数回配信し、その効果を測定することがよくあります。また、シリーズ商品の説明文を同じテンプレートに従って大量に作成することも一般的です。それゆえに、広告文を収集してテキストコーパスを作ると、準重複サンプル、つまり完全には重複
大規模言語モデル RWKV-worldで学習で巨大なデータ(学会の予稿集のpdf)をファインチューニング(LoRA)する｜Kan Hatakeyama
- 3 users
- note.com/kan_hatakeyama
- テクノロジー
- 2023/07/17
概要学会の予稿集のような､大規模な文章(pdf)データを大規模言語モデルに学習させてみます 1.5 M tokenほどありますモデルは､学習と出力が高速なRWKVにしました他のタスクでGPUリソースを使っているので､0.1B/ 1.5Bモデルでのお試しです 1.5Bは学習時にVRAM 7GBほど使います執筆時､日本語最強のオープンLLMと謳われるRWKV-4-World-JPNtunedが本命ですが､7bを動かせるGPUが空いていなかったので､小さいモデルで試しています前提: pdfデータの処理LLMとは直接関係がありませんが､一般論として､テキスト学習にはデータの前処理が必要です｡今回は､数百MBのpdfデータとして存在する学会の予稿集をきれいなテキストに変換しました｡まずは､巨大すぎるpdfを分割しておきます｡ #pdfの分割 import os from PyPDF2 i
githubリポジトリをEmbeddingして質問に答えてもらう｜ニケちゃん
- 3 users
- note.com/nike_cha_n
- テクノロジー
- 2023/10/21
必要なライブラリをインストールしておきます。 pip install llama_index llama_hubリンク先の一番下のコードをコピペします。 import pickle import os from llama_index import download_loader, GPTVectorStoreIndex download_loader("GithubRepositoryReader") from llama_hub.github_repo import GithubClient, GithubRepositoryReader docs = None if os.path.exists("docs.pkl"): with open("docs.pkl", "rb") as f: docs = pickle.load(f) if docs is None: github_cl
はじめての自然言語処理 MixCSE による教師なし文章ベクトル生成 | オブジェクトの広場
- 3 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/10/08
今回は教師なしの文章ベクトル化手法である MixCSE の検証です。教師なし学習ですから教師ありの手法よりは精度的に不利でしょうが、局面によっては役に立つケースもあるのでは？と試してみることに。公開されているコードは transformers ベースなのですが、今回は Colab の TPU で動かしてみたので、その方法も紹介しますね。 1. はじめに今回は教師なしの文章ベクトル化手法である MixCSE1 の検証をしてみました。本連載では文章ベクトル化のモデルとして、 Sentence BERT を取り上げたこと(第9回, 第18回)がありますが、品質の良いベクトルを生成する為には大量かつ良質の教師データが必要でした。法律や特許のような特定領域に特化した文章を扱う局面では、対象領域の文書で学習したモデルを使いたいところですが、特定領域限定の都合良いデータはなかなか手に入りません。そ
- NLP
ゼロから始める自作LLM｜Masayuki Abe
- 3 users
- note.com/masayuki_abe
- テクノロジー
- 2024/02/18
今回は、Google Colabで自作LLMの完成を目指す記事となります。既成LLMをどのように使うかの記事を書いて来ましたが、LLMをどのように作るかの記事がなかったので今回書いてみることにしました。 GitHubに自作LLMを作っているページがありましたので、利用させて頂いております。 GitHubのこちらのページは凄く有益ですので、一度読んでみることをおすすめいたします。今回は、上記ページのコードを参考に、Google Colabで実装していきます。今回は、自作LLMを完成させてみようということを目的に書きますので、精度などは問題がありますが、記載のとおりGoogle Colabに貼り付けてもらえれば自作LLMの完成という成功体験を積むことに主眼を置いています。ハイパーパラメータを変更すると考えることが増えるので、原則変更しない方向でいきます。 Google Colabのリソ