[B! *algorithm][*program] [7ページ] sh19910711のブックマーク

Jax/Flax × TransformersでBERTのfine-tuningをTPUで行う | 株式会社AI Shift

こんにちは AIチームの戸田です以前、BERTをfine-tuningする際のTipsとして混合精度の利用や、Uniform Length Batchingをつかった学習効率化を紹介させていただきましたが、今回はTPUを使った高速化について紹介したいと思います。 Flax TPU対応というと、まずGoogleのTensorflowが思い浮かびますが、今回は同じGoogleのニューラルネット学習用フレームワークのFlaxを使います。 FlaxはTensorflowと比較して簡潔に、かつ柔軟に書くことができると言われており、huggingfaceのtransf ormersもv4.8.0からFlaxをサポートするようになっています。 JAX/Flax has joined the ranks of PyTorch and TensorFlow in 🤗Transf ormers! Versio

sh19910711 2022/01/03

"一方学習曲線を見てみると、Flaxの方が精度が悪いようです / トータルのバッチサイズは両方とも32ですが、TPUの場合、デバイスが8個あるので、デバイスごとのバッチサイズが4になることが原因かと思われます"

リンク

グラフニューラルネットワークでQiitaのタグづけをレコメンドする - Qiita

本記事はNTTドコモR&Dアドベントカレンダー2021の8日目の記事です．こんにちは、NTTドコモの橋本(@dcm_hashimotom)です．業務ではレコメンド関連の技術開発・施策検討を行っており，主にPythonやBigQuery, Apache Sparkを触ってます． SNSなどで投稿したコンテンツの検索性を上げるためには，そのコンテンツへのタグ(またはハッシュタグ)の付与が重要です．Qiitaではタグは5つまで付与することができ，タグを指定した絞り込み検索や，マイページでのプロフィールに使われております．しかし，タグの付与はユーザ手動なものが多く(要出典)，検索性が高いものを選択するためには，ドメイン知識が必要です．なので，タグを付ける際に「このタグがついた投稿では他にこんなタグもついてます」的なレコメンドがあれば有用そうです．また，レコメンドということですが，近年レコメンド

sh19910711 2021/12/12

"GNNを用いてQiitaタグをembeddingしたTech2Vecを作成 / DGLのチュートリアルに沿った形式で実装 / 「GNN」を入力してみましたが + 前処理で削られてしまって > もっとGNNの記事が必要"

リンク

splay tree をソラで書く！！！

(2023/02/05) 実はここに書いた方法はとにかく覚えにくいので、今度新しく書きます。考察不足でしたのでおわび申し上げます。動機の例自作ライブラリで Library Checker の問題[1]を解きたい link/cut tree を実装したい splay tree の面白い機能を思いついたときに実装したい平衡二分探索木や動的木が JOI に出る(?)[2] [3] ネタバレ注意 PCK に出る(?)[4] ネタバレ注意目標平衡二分探索木の一種である (bottom-up の) splay tree の C++ 言語による実装例を示す splay tree を覚えやすい・一発で書きやすい方法で実装し、注意点をまとめる注意点はできるだけ多くの点を挙げ、実装の方針が同じ splay tree が正しく動作しなかったときのチェックリストになるようにするこの実装を用いて Li

sh19910711 2021/12/05

"平衡二分探索木の一種である (bottom-up の) splay tree / 覚えやすい・一発で書きやすい方法で実装し、注意点をまとめる / 論文は Daniel Sleator さんと Robert Tarjan さんによって 1984 年に書かれ、1985年に出版"

リンク

Introducing TensorFlow Graph Neural Networks

Posted by Sibon Li, Jan Pfeifer and Bryan Perozzi and Douglas Yarrington Today, we are excited to release TensorFlow Graph Neural Networks (GNNs), a library designed to make it easy to work with graph structured data using TensorFlow. We have used an earlier version of this library in production at Google in a variety of contexts (for example, spam and anomaly detection, traffic estimation, YouTub

sh19910711 2021/11/20

リンク

pytorchで行列分解　〜行列分解をふんわり理解する〜 - Qiita

はじめに IBIS2017のチュートリアルで，林先生が「テンソル分解をニューラルネットのフレームワークでやれば楽チンではないか」みたいなことを言っていて，確かに便利そうだと思ったのでそれを試す．ここではフレームワークとしてpytorchを使う．まずは前段階として単純行列分解をやってみる．テンソル分解はそのうちやりたい．（余裕があれば）テンソル分解もpytorchでテンソル分解（CP分解）でやった．環境 Python 3.6.1 torch (0.2.0.post3) torchvision (0.1.9) モデルの定義 $X$を$U V^{T}$に分解することを考える．$X$が(n,m)行列のとき，Vは(n,r)行列，Vは(m,r)行列になる． import torch from torchvision import datasets, transf orms from torc

sh19910711 2021/11/19

"大体極端なケースを考えれば，理解の手助けになる"

リンク

spaCyを使ってルールベースの記述をシンプルに！ - Qiita

この記事は自然言語処理アドベントカレンダー 2019の12日目です。昨今自然言語処理界隈ではBERTを始めとする深層学習ベースの手法が注目されています。一方それらのモデルは計算リソースや推論速度の観点で制約が大きく、プロダクション運用の際は留意すべき事項を多く持ちます。（googleが検索にBERTを導入というニュースを見た時はとても驚きました）そこで本記事では自然言語処理タスクのシンプルかつ運用しやすい実装方法を考えていきます。実装にはpythonと以降説明するspaCyとGiNZAの2つのライブラリを使います。環境: ubuntu18.04 python 3.6.8 ライブラリインストールはpipから行います今回行うタスク実務で需要が多いと思われる以下の2タスクを取り上げます。固有表現抽出フレーズ抽出固有表現抽出とは固有表現抽出(NER)をWikipediaから

sh19910711 2021/11/10

"spaCyでは出力の可視化機能が豊富 + Jupyter環境で可視化するには以下のspacy.displacy / 固有表現がPERSON + (任意の文字列) + LOC + (任意の文字列) +「働」が含まれる語のルールを記述"

リンク

遺伝的アルゴリズム(GA)で勉強計画立ててみた - Qiita

スケジュールがめんどくさい 1440分の使い方という本は知っているだろうか？一日の時間の使い方を説いた名著であり，僕はとても感銘を受けた．本の内容については読んでくれ，Amazon Prime会員であれば無料で読めるのでぜひ．この本に感銘を受け，僕は1日のスケジュールを毎日30分単位で作成していた．一か月これを続け，その間はとても効率よく課題や勉強が進んだ．効果については僕の１サンプルしかないが，少なくとも僕はとても充実した一か月を過ごすことができた．問題点は一つだけある．スケジュールを立てるのがめんどくさいのであるただひたすらめんどくさい．毎日これを立てるのに結構な時間がかかり，その上修正するのにも時間がかかる．てめー時間が大事って言いながら時間かかる作業勧めてるんじゃねぇよと思いました．機械にやらせよう 1440分の使い方ではブルジョアは秘書を雇ってスケジュールの

sh19910711 2021/11/03

"1440分の使い方: 一日の時間の使い方を説いた名著 > スケジュールを立てるのがめんどくさい / 見込み工数 + 期限 + 重要度をリスト / ペナルティ = タスク超過 + 〆切超過 + 同一タスク連続"

リンク

deno で機械学習

はじめに最近、deno が面白くなり始めています。deno はコマンドラインバイナリを1つインストールすれば、import によりパッケージの読み込みはインターネットからダウンロードしてキャッシュされ、開発者が package.json を書く事もなく、とてもお手軽に TypeScript を書くことができます。もし、機械学習をやりたいとして、事前準備(npm でインストールしたり、conda/pip 等で依存物をインストールしたり)が大幅に削減できるなら、とても便利だと思いませんか？ deno で機械学習 deno で機械学習と聞くと tensorflow.js を使いたくなりますが、残念ながら現在はまだ deno で tensorflow.js を扱える様にはなっていません。しかし deno 1.8 では GPU を扱う為の機能が追加されており、ジワジワではありますが目標に向かって

sh19910711 2021/09/23

"現在はまだ deno で tensorflow.js を扱える様にはなっていません / deno 1.8 では GPU を扱う為の機能が追加されており、ジワジワではありますが目標に向かって進んでいる状況"

リンク

【日本語モデル付き】2020年に自然言語処理をする人にお勧めしたい文ベクトルモデル - Qiita

2023/03/20 追記 Studio Ousia様によるLUKEモデルをベースに学習したSentence-LUKEモデルを公開しました。 Sentence-LUKEモデル: https://huggingface.co/sonoisa/sentence-luke-japanese-base-lite 手元の非公開データセットでは、日本語Sentence-BERTモデル（バージョン2）と比べて定量的な精度が同等〜0.5pt程度高く、定性的な精度は本モデルの方が高い結果でした。 2021/12/14 追記 MultipleNegativesRankingLossを用いて学習した改良版モデルを公開しました。改良版（バージョン2）のモデル: https://huggingface.co/sonoisa/sentence-bert-base-ja-mean-tokens-v2 手元の非公開デー

sh19910711 2021/09/23

TensorBoardにUMAPあったな / scipy.spatial.distance.cdist([query_embedding], sentence_vectors, metric="cosine") / "与えられたクエリ文に意味が近い文を検索 + タイトル文の潜在意味空間をUMAPで可視化"

リンク

PyTorch最新モデルでマルチコアTPUの本気を試す - Qiita

ご覧いただきありがとうございます。 Google Colaboratoryにアカウントをお持ちの方は、上の「Open in Colab」という青いボタンを押せば直接notebookをColabで開けます。ぜひ動かしてみてください。過去の記事も含め、全てのコードをGithubで公開しています。 1. はじめに無料で使えるGoogle ColabはランタイムのタイプにTPUが選択できます。単に選択しただけで使えて欲しいところですが、あいにくそうはなっていません。また、ColabのTPUは8コア構成なのですが、1コアだけでも使えてしまうので、1コアだけで性能比較して、GPUとあんまり変わらないとしてしまっている記事をちらほら見かけます。実際、1コアだけだとP100と同程度の性能っぽいです。ただ、ColabのTPUのいいとろこは8コアを使えることと、TPUに付随するメモリがたくさん使えることな

sh19910711 2021/09/09

torch_xla.distributed.xla_multiprocessing / "ColabのTPUは8コア構成なのですが、1コアだけでも使えてしまうので、1コアだけで性能比較して、GPUとあんまり変わらないとしてしまっている記事をちらほら見かけます"

リンク

最小共通祖先を求めるアルゴリズムの形式検証 | Wantedly Engineer Blog

競技プログラミングには概念を知っておかないと解きようがない、いわゆる覚えゲーのような問題が存在します。典型的な例が 10^9+7 といった素数で割った余りを求めろといったもので、普段業務で日常的に素数で割った余りを求めている人でもなければ、割り算がしたければフェルマーの小定理や拡張ユークリッドの互除法を使えば良いと直ぐには思い付けないのではないでしょうか。最小共通祖先も覚えゲーで必要な概念の一種と言えます。これは読んで字のごとく、与えられた根付き木の下で2頂点に共通する祖先のうち、最も根から遠い頂点を指す概念で、例えば木の2頂点が与えられて、頂点間の経路について何かを求めろといった問題で威力を発揮することが多いです。これを用いて解ける例を挙げるとすると次の問題でしょうか。 https://atcoder.jp/contests/abc014/tasks/abc014_4 最小共通祖先を求

sh19910711 2021/09/09

"Coq 上での定義が我々の定義しようとしている概念と対応しているか、仕様のデバッグを行うためにも、直感的に成り立ってほしい性質を証明するのは形式的検証では大事なこと"

リンク

MD5のハッシュ値オールゼロに挑戦 - わさっきhb

いきなりですが問題です． MD5のハッシュ値（チェックサム，fingerprint，メッセージダイジェスト）がすべて0となるような，入力メッセージを答えなさい．さっそくですが解答…いや，答えは知りません．もし，そんな入力メッセージを得ていたら，弱衝突耐性を破ったってことになります．そんな入力があるかどうかも，分かっていません．そこで，もっと簡単な問題にします． MD5のハッシュ値の先頭32ビット（16進出力では最初の8桁）がすべて0となるような，入力メッセージを答えなさい．これくらいだと，計算機をぶん回せば，答えが出てきそうです．情報セキュリティの試験も終わったことですし，Rubyスクリプトを書いてみました． Find all-zero hash · GitHub 少し気をつかったことが2つ，あります．一つは，入力メッセージをどのように生成するかです．乱数を使うと，周期の問題がありま

sh19910711 2021/09/09

"入力メッセージをどのように生成するかです．乱数を使うと，周期の問題があります．毎回必ず異なる文字列にしたい / String#succが「次の」文字列を作ってくれる"

リンク

弱教師あり学習は何を見ているのか？ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 弱教師あり学習は何を見ているのか？機械学習で分類モデルを学習する際、通常であれば正しくラベリングされたデータを入力としますが、弱教師あり学習では誤ったラベルから学習します。たとえば「飛行機」、「腕時計」、「ヒョウ」を分類するモデルを学習するとき、すべての「飛行機」画像に「腕時計」、「ヒョウ」のいずれかのラベルがついている（＝誤ってラベリングされている）とします。この場合、「腕時計」画像、「ヒョウ」画像の特徴を持たない画像を「飛行機」画像と学習します。この学習を実装するには損失関数を工夫します。具体的には、学習で誤りラベルを推論する

sh19910711 2021/09/08

"「腕時計」、「ヒョウ」ではないものとして「飛行機」を学習した場合、分類モデルは「飛行機」っぽさを学習しているのか、それとも『「腕時計」、「ヒョウ」』でないっぽさを学習しているのか"

リンク

複雑ネットワークの基本 - ⬜︎⬜︎⬜︎

はじめにネットワーク分析に興味をもち過去にこちらの書籍を読み、ネットワーク分析第2版 (Rで学ぶデータサイエンス) 作者:努, 鈴木発売日: 2017/05/24メディア: 単行本以下のような記事を書いていました。 qiita.com qiita.com 複雑ネットワークについてだけ勉強していなかったので、書籍の続きを読みまとめます。コードの詳細等は書籍を確認してください。複雑ネットワークとは複雑ネットワークとは、現実世界に存在する巨大で複雑なネットワークの性質について研究する学問です。例えば、WEBサイトのリンク構造やSNSでのフォロー関係などのネットワーク構造について着目するような取り組みが挙げられます。複雑ネットワークでは各頂点の指標について議論することは少なく、ネットワーク全体の構造を捉えるための指標はよく用いられると考えています。ここでは代表的な指標をあげます

sh19910711 2021/08/29

"複雑ネットワークでは各頂点の指標について議論することは少なくネットワーク全体の構造を捉える / Watts-Strogatzモデル: スモールワールド性をうまく表現 / 次数相関: 次数の大きさが同じようなもの同士が結びつきやすい"

リンク

TensorFlowのSavedModelの便利さを紹介する - 生き抜くぜ21世紀

はじめに今は2020年8月なのですが、コロナ禍だし、暑いし、経済状況最悪で暇だし、良いことないですね。暇になったので、1年ぶりにkaggleをやってみました。 Landmark Retrievalという建物の画像検索コンペに出たところ、そのコンペの提出形式がTensorFlowのSavedModel形式でした。私はTensorFlow案件をけっこうやってきたので抵抗はなかったのですが、この制約が原因となったのか、あまりこのコンペの参加者は多くなかったようです。 kaggleの提出形式としては賛否両論あると思いますが、実務ではとても便利な形式だと私は思っています。それなのにもし実務でも敬遠されているとしたらもったいないと思い、この記事ではSavedModelの便利さについて紹介してみます。ちゃんとした使い方は公式リファレンスを当たってもらうとして、概念やsaved_model_cl

sh19910711 2021/08/25

"saved_model_cliを活用することで、ネットワークのin/outを楽に・確実に確認することができる / saved_model_cli: TensorFlowが公式でサポートしている、SavedModelの中身をチェックするためのcliツール"

リンク

WebAssemblyを用いてBERTモデルをフロントエンドで動かす - OPTiM TECH BLOG

はじめまして。R&Dチーム所属、20.5卒の伊藤です。普段の業務では自然言語処理と格闘していることが多いです。今回は自然言語処理モデルとして有名なBERTをWebAssemblyを使用してフロントエンドで動かしてみた話になります。最近、自然言語処理ライブラリとして普段お世話になっているHugging Face社のTransf ormersのTokenizerがRustで実装されていることを知り、それならばWebAssemblyにコンパイルして動かせるのではないかと試したみたのがきっかけです。 Tokenizerのみ動かしても実用性に乏しいため、Tokenizerから得られた結果からBERTを用いた推論をブラウザで動作させるまでを行い、備忘録がでら手順をまとめました。どなたかの参考になれば幸いです。 8/26追記本記事内のコードを含むリポジトリを公開しました！Dockerを使用してブ

sh19910711 2021/08/21

"Hugging Face 社のTransformers の Tokenizer が Rust で実装されている / WebAssembly にコンパイルして動かせるのではないかと試したみた / Tokenizer から得られた結果から BERT を用いた推論をブラウザで動作させるまで"

リンク

Pyevolveで学ぶ遺伝的アルゴリズム - mfumiの日記

Pyevolveとは、Pythonで書かれた遺伝的アルゴリズムのフレームワークです。公式サイトによれば、Pyevolveの方針は、・ pure python で書く・ APIを簡単に使えるようにする・進化過程をグラフ等で見れる・拡張性をもたせる・パフォーマンスを第一にデザインする・一般的な特徴を持つ・全てのオプションにデフォルト値がある・ open-source (GPL) …とのこと。遺伝的アルゴリズムは前から少し興味があったので、これを使って勉強してみたいと思います。 Pyevolveは日本語はおろか英語での情報もあまりありません。以下に参考になるサイトを挙げておきます。公式サイト Welcome to Pyevolve documentation ! — Pyevolve v0.5 documentation 日本語でPyevolveについて書かれた唯一(

sh19910711 2021/07/21

リンク

pytorch-transformersを触ってみる① - 機械学習・自然言語処理の勉強メモ

今更ながら、pytorch-transf ormersを触ってみます。このライブラリはドキュメントが充実していて、とても親切です。なので、今回はドキュメントに基づいて触ってみただけの備忘録です。以下、有名どころのBERTで試してます。詳しいことはここなどを参照してください。 huggingface.co はじめに以下で、入手できます。簡単です。 pip install pytorch-transf ormersインストールしたら、以下でimportします。 import torch from pytorch_transf ormers import BertTokenizer, BertModel pytorch-transf ormersの基本は以下の3つのクラスで構成されます。 model classes モデル本体 configuration classes モデルのパラメータを設

sh19910711 2021/07/11

リンク

DQNで自作迷路を解く - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? DQNで自作迷路を解く Deep Q Network（いわゆるDQN）で自作の迷路を解いてみました。プログラムはこちらにあります。 https://github.com/shibuiwilliam/maze_solver 概要 DQNは強化学習の一種で、最適な戦略選択にニューラルネットワークを使っているものになります。強化学習やニューラルネットワークの説明は以下が参考になります。強化学習ゼロからDeepまで学ぶ強化学習 - Qiita ニューラルネットワーク TensorFlowのチュートリアルを通して、人工知能の原理について学

sh19910711 2021/07/09

リンク

VAEを用いたUNIXセッションのなりすまし検出 | NHN テコラス Tech Blog | AWS、Google Cloudなどのインフラ技術ブログ

こんにちは。データサイエンスチームの t2sy です。この記事は NHN テコラス Advent Calendar 2018 の17日目の記事です。はじめにニューラルネットワークを用いた代表的な生成モデルとして VAE (Variational Autoencoder) と GAN (Generative Adversarial Network) の2つが知られています。生成モデルは異常検知にも適用できます。今回は、VAE を用いたUNIXセッションのなりすまし検出を試してみたのでご紹介します。 VAEと異常検知データセット fastTextによるUNIXコマンドの分散表現 KerasでVAE 実行環境は以下です。 Amazon EC2 p2.xlarge インスタンス Ubuntu 16.04 Python 3.4.5 Keras 2.1.6 TensorFlow 1.8.0 V

sh19910711 2021/07/05

"実験で用いるデータセットは Masquerading User Data / SEA データセットとも呼ばれるよう / 70人のUNIXコマンド列が含まれ、各ユーザは15,000コマンド / セッションごとに1%の確率でなりすましが発生"

リンク

はてなブックマーク

タグ

関連タグで絞り込む (99)

algorithmとprogramに関するsh19910711のブックマーク (381)

お知らせ

今週のはてなブックマーク数ランキング（2025年10月第4週）

今週のはてなブックマーク数ランキング（2025年10月第3週）

今週のはてなブックマーク数ランキング（2025年10月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (99)

*algorithmと*programに関するsh19910711のブックマーク (381)

お知らせ

今週のはてなブックマーク数ランキング（2025年10月第4週）

今週のはてなブックマーク数ランキング（2025年10月第3週）

今週のはてなブックマーク数ランキング（2025年10月第2週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス

algorithmとprogramに関するsh19910711のブックマーク (381)