[9ページ] *algorithmの人気記事 736件

321 - 360 件 / 736件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

*algorithmの検索結果321 - 360 件 / 736件

Google の FLAN-20B with UL2 を動かしてChatGPT APIのように使ってみる！ - Qiita
- 20 users
- qiita.com/sakasegawa
- テクノロジー
- 2023/03/04
こんにちは！逆瀬川 ( https://twitter.com/gyakuse )です！今日は昨日公開されたFLAN-20B with UL2を使ってChatGPT APIのように会話をしてみたいと思います。概要 Google BrainのYi Tayさんらが開発した新しく公開された言語モデルのFLAN-20B with UL2を使ってChatbotみたいな対話をしてみるテストです。翻訳を組み合わせて実現します。デカ言語モデルが手元で動いてめちゃくちゃ嬉しさがあります。 Google Colab Colab ProのプレミアムGPUでないと動きません使い方ランタイム > ランタイムのタイプを変更からGPU / プレミアムとする A100 40GB VRAMであることを確認しておきましょうすべてのセルを実行注意ローカルで動かす場合 VRAMを33GB程度使用します今後int
- NLP
- Google
- あとで読む
- qiita
- API
SushiGAN2 〜この寿司は実在しません〜 - Qiita
- 20 users
- qiita.com/shionhonda
- テクノロジー
- 2020/12/20
はじめに 2年ほど前，私はGANというものに出会って感銘を受け，Qiitaで『SushiGAN 〜人工知能は寿司を握れるか？〜』というちょっと釣りっぽいタイトルの記事を書きました．中身はChainerのexampleにあったDCGANの実装を寿司の画像で学習させてみるというもので，下のようなモード崩壊気味の寿司画像を作って満足していました．あれから2年あまりが経ち，画像生成の技術は驚くべき発展を遂げました1．StyleGAN，そしてStyleGAN2が登場し，すぐには見分けがつかないほどの品質で1024x1024の人の顔の画像が生成できるようになりました [1]．そのインパクトは凄まじく，"This Person Does Not Exist"を皮切りに，GANで生成したリアルな偽物のサンプルをランダムに表示するWebサイトがちょっとした流行になりました．いくつか例を挙げると，次のような
- 機械学習
- あとで読む
グラフを用いた近似最近傍探索の理論と応用
- 20 users
- speakerdeck.com/matsui_528
- テクノロジー
- 2023/08/30
NLP若手の会 (YANS) 第18回シンポジウム (2023) チュートリアル　https://yans.anlp.jp/entry/yans2023 松井勇佑（東京大学）https://yusukematsui.me/ 近似最近傍探索とは、「似ているベクトルを探す」というシンプルかつ基…
- Algorithm
https://pc.watch.impress.co.jp/docs/news/1321493.html
- 20 users
- pc.watch.impress.co.jp
- テクノロジー
- 2021/04/27
最近の登壇資料と出版予定の書籍、インタビュー記事 - c-bata web
- 20 users
- nwpct1.hatenablog.com
- テクノロジー
- 2021/07/07
最近は勉強会での登壇や書籍の出版などアウトプットが色々重なりました (昨年は一度もプロポーザルを書かず登壇依頼もなかったので随分増えました)。そのたびにツイートもしてきましたが、ほとんど流れてしまって少しもったいない気がしたのでブログにまとめておこうと思います。登壇資料 PyData.Tokyo Meetup #23「サイバーエージェントにおけるMLOpsに関する取り組み」 Optuna Meetup #1「CMA-ESサンプラーによるハイパーパラメータ最適化」 World Plone Day「Web パネルディスカッション（Python Webと非同期）」 CA BASE NEXT「サイバーエージェントにおけるMLOpsに関する取り組み」書籍実践Django Pythonによる本格Webアプリケーション開発（翔泳社：7月19日発売）エキスパートPythonプログラミング改訂3版
- MLOps
- python
- HotEntry
- oss
- 機械学習
- あとで読む
- 書籍
社内CV輪講資料 / PyTorch Lightning
- 20 users
- speakerdeck.com/takarasawa_
- テクノロジー
- 2021/04/26
社内のCV輪講で PyTorch Lightningについて共有したときの資料です「今日から始める PyTorch Lightning」サンプルレポ：https://github.com/karasawatakumi/monodepth-dev
広告システムにおける機械学習モデルの推論差分検知について - Gunosy Tech Blog
- 20 users
- tech.gunosy.io
- テクノロジー
- 2023/08/24
こんにちは。データサイエンス部の石川です。弊社では広告配信の最適化のために CTR・CVR*1 を推定する機械学習モデルを開発していて、定期的な学習とモデルの更新を行っています。このようなシステムにおいて、学習済みモデルが推論システムで問題なく動作することを保証するために、デプロイされるモデルの挙動を検証する仕組みが必要です。特に、学習時と推論時で同一の広告リクエストに対して同じ推論値を出力するかを確認する仕組みを「差分検知」と呼んでいます。この記事では、弊社の広告システムにおける機械学習モデルの差分検知について紹介します。背景課題解決策 PyO3 の実装まとめ背景弊社の CTR・CVR を推定する機械学習システムでは、ワークフローエンジンが定期的にモデルの学習を実行し、その後学習済みモデルを S3 にアップロードします。広告スコアリングサーバは S3 上のモデル変更
GitHub - lucidrains/deep-daze: Simple command line tool for text to image generation using OpenAI's CLIP and Siren (Implicit neural representation network). Technique was originally created by https://twitter.com/advadnoun
- 19 users
- github.com/lucidrains
- テクノロジー
- 2021/03/15
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- deep learning
- tool
- command
- github
- 画像
なぜ今AI倫理なのか？　AIがもたらす「意図しない結果」を防ぐために開発者ができること
- 19 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2022/02/16
なぜ今AI倫理なのか？　AIがもたらす「意図しない結果」を防ぐために開発者ができること：エンジニアが知っておくべきAI倫理（1）正しくAIを作り、活用するために必要な「AI倫理」について、エンジニアが知っておくべき事項を解説する連載。初回は、AIの普及により浮き彫りになった課題と、AI開発プロセスに内在するリスクについて。スマートフォン、スマートスピーカーに搭載されている音声アシスタントやお掃除ロボットなど、身の回りのさまざまなところにAI（人工知能）が導入され、私たちの生活は今まで以上に便利になっている。だが、新しい技術であるが故に、AIのブラックボックス化やAIによる差別の助長など、今までなかったような新たな課題が見えつつある。本連載では正しくAIを活用するための手法である「AI倫理」について解説する。今回はまず、AIの普及により浮き彫りになった課題と、AI開発プロセスに内在する
オープンな日本語埋め込みモデルの選択肢 / Exploring Publicly Available Japanese Embedding Models
- 19 users
- speakerdeck.com/nttcom
- テクノロジー
- 2024/01/30
イノベーションセンターテクノロジー部門 Generative AI PJ の内部勉強会で発表した資料です。Retrieval-Augmented Generation (RAG) において重要な役割を果たす埋め込みモデル（特に日本語に特化したもの）について整理しました。
- RAG
- llm
- 勉強
- AI
- 資料
- あとで読む
大規模言語モデル時代のHuman-in-the-Loop機械学習
- 19 users
- speakerdeck.com/yukinobaba
- テクノロジー
- 2023/07/25
画像の認識・理解シンポジウム（MIRU2023）チュートリアル
- 機械学習
- あとで読む
Redirect
- 19 users
- www.fast.ai
- テクノロジー
- 2021/07/21
- 機械学習
- github
- AI
- programming
- HotEntry
- language
SIF/uSIFを使ってRustで簡単高速文埋め込み - たまに書く
- 18 users
- kampersanda.hatenablog.jp
- テクノロジー
- 2023/12/09
本記事は、情報検索・検索技術 Advent Calendar 2023 9日目の記事です。 SIF/uSIFという文埋め込み手法と、そのRust実装であるsif-embeddingを紹介します。最後にちょこっとベクトル検索もします。はじめに SIF SIF-weighting Common Component Removal アルゴリズム使用上の注意 uSIF sif-embedding 準備単語埋め込みの準備ユニグラム言語モデルの準備 Let's 文埋め込み性能評価速度性能評価用データセットを使ったベンチマーク英語日本語ベクトル検索おわりにはじめに自然言語文の密ベクトル表現を文埋め込みと呼びます。文埋め込み同士のコサイン類似度などを使って、文同士の意味的な類似度が計算できるので、自然言語処理や情報検索などで重宝します。特に最近では、今年のAdvent Calen
- Rust
- あとで読む
- search
- techfeed
⾃⼰教師あり学習によるビジョン基盤モデルの事前学習
- 18 users
- speakerdeck.com/hf149
- テクノロジー
- 2024/05/24
ロボット工学セミナー：「ロボットのためのLLM・VLM 利活用」 2024年5月23日⾃⼰教師あり学習は，ラベルなしデータを⽤いた事前学習法である．⾃⼰教師あり学習では，データから正解ラベルを⾃動で作成できるプレテキストタスクにより事前学習を⾏い，様々な下流タスクに効果的な特徴表現を獲得する．…
- 機械学習
- あとで読む
メルカリShopsを支えるMonorepo ML開発環境 | メルカリエンジニアリング
- 18 users
- engineering.mercari.com
- 暮らし
- 2023/04/11
こんにちは！SouzohのMLチームでSoftware Engineerをしているwakanaです。 SouzohのMLチームは2021年4月にスタートし、ちょうど2年が経ちます。当時1人だったメンバーも、今では4人になり、レコメンデーションを中心に5, 6個の機能を提供するようになりました。MLOpsも成熟し、より新しく高度なML機能開発に集中して取り組める環境が整ってきていると感じています。そこでこの記事では、立ち上げから2年たった今SouzohのPython, ML環境がどのようになっているか紹介しようと思います。これからPythonやMLのMonorepoでの開発環境を整えようとしている方、特に少人数での運用を考えてる方の参考になれば嬉しいです。 TL;DR SouzohではPoetry, Bazel, VertexAI Pipelinesで快適なMonorepo開発環境を実現
機械学習デザインパターン
- 18 users
- www.oreilly.co.jp
- テクノロジー
- 2021/10/04
本書は、機械学習で繰り返し登場する課題を30のパターン（データ表現、問題表現、モデルの訓練、再現性、対応性、運用性、説明性、公平性などに関するもの）に分類し、それぞれについてベストプラクティスを提示・解説するデザインパターン集です。すぐ動かせるコード例とデータセットを豊富に含み、手を動かしながら機械学習を学びたい初心者の実践的な入門書としても、現場のデータサイエンティストやエンジニアのリファレンスとしても有用な内容となっています。著者のGoogle Cloudのデータ分析＆AI部門トップとしての豊富な経験に基づく実用本位の一冊です。はじめに 1章　機械学習デザインパターンの必要性 1.1　デザインパターンとは 1.2　本書の利用方法 1.3　機械学習の用語 1.3.1　モデルとフレームワーク 1.3.2　データと特徴量エンジニアリング 1.3.3　機械学習のプロセス 1.3.4　データお
noteの機械学習フローを共通化してレコメンデーションで成果をあげた話｜やすけん / yskn67
- 18 users
- note.com/yskn67
- 暮らし
- 2022/08/10
こんにちは．noteの基盤開発グループ機械学習チームに所属している安井です．普段は機械学習を活用したシステムの開発から運用までトータルでおこなっています． noteでは記事の分類やレコメンデーションに機械学習を用いて作成されたモデルが使われています．いくつか例を挙げますと，noteに投稿された記事をカテゴリごとにまとめて見るために，記事をカテゴリごとに機械学習で分類しています．また，”あなたへのおすすめ”としてユーザごとにパーソナライズされたおすすめ記事をとどけるためにも機械学習が活用されています． (図1)noteにおける機械学習の活用箇所それらサービスで活用されている複数の機械学習モデルには記事の内容から分散表現を獲得する似たような仕組みが存在しました．今回はそれらを共通コンポーネントとして切り出し，分散表現を推論・保存まで行う仕組みを構築しました．また，その分散表現を活用したレコメン
- machineLearning
- 機械学習
ONNX 2020 - OPTiM TECH BLOG
- 17 users
- tech-blog.optim.co.jp
- テクノロジー
- 2020/12/18
R&D チームの奥村（@izariuo440）です。相変わらず深層学習モデルの推論に取り組んでいます。深層学習モデルの推論器として二年前に ONNX Runtime を軽くレビューしましたが、当時と比較するとかなり進歩しており、ONNX Runtime だけでなく ONNX 自体や関連ソフトウェアも成熟が進んでいるので、備忘録として私がお世話になっているものをかいつまんで紹介します。 OPTiM TECH BLOG Advent Calendar 2020 12/18 の記事です。 ONNX や ONNX Runtime は二年前の記事で少し解説しています。必要に応じてご参照ください。 tech-blog.optim.co.jp ONNX チュートリアル ONNX Model Zoo オプティマイザその他 ONNX 関連のソフトウェア ONNX Runtime onnx-tensorrt
ABCIの大規模言語モデル分散学習ハッカソンを振り返る
- 17 users
- zenn.dev/ohtaman
- テクノロジー
- 2023/08/14
７月6日〜14日の9日間、ABCIの主催で第1回大規模言語モデル分散学習ハッカソンが開催されました。自分はいいだしっぺ兼チューターとして参加したのですが、今回のイベントは個人的な学びも多かったし、なにより楽しかったので、忘れないうちに振り返っておこうと思います。いいだしっぺというのは、3月に上記の tweet をしたら NVIDIA の @sfuruyaz さんが拾って諸々進めてくれた、という話です。自分はイベント内容の案をだしたり、技術検証やサンプルプログラムを作成したりしました。イベント概要イベント概要は以下の通りです期間: 2023/07/06 - 2023/07/14 （9日間）場所: オンライン（初日・最終日はオフラインとのハイブリッド開催）参加数: 20チーム提供リソース: Vノード（1000 ABCIポイント）サポート: チューター（言語モデルや機械学
kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift
- 17 users
- www.ai-shift.co.jp
- テクノロジー
- 2024/06/12
はじめにこんにちは、AIチームの大竹です。最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸いです。モデルの直近のリリースをまとめると、以下のようになっています。ReazonSpeechコーパスのリリースを皮切りに日本語に特化した音声認識モデルの開発の勢いが加速しているように思えます。ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。公開時期モデル名公
- 機械学習
- あとで読む
BERT2BERTによるニュース記事のタイトル生成 - Qiita
- 17 users
- qiita.com/m__k
- テクノロジー
- 2022/04/25
はじめに huggingfaceを使ったEncoder-Decoderモデルの練習の一貫として、BERT2BERTによる文章生成をやってみました。 BERT2BERTはEncoder-Decoderモデルの一種で、Encoder層もDecoder層もBERTのアーキテクチャーを採用したモデルのことを言います。ただし、Decoder層のBERTは通常のBERTと以下の2点で異なります。最初のMutil Head AttentionがMusked Multi Head Attenion(単方向)になってる MMHAとFFNの間にCross Attention層があり、Encoderの特徴量を受け取れるようになってるアーキテクチャーはほぼほぼTransformerと同様の認識ですかね。この辺の構造も含めて、Encoder-DecoderモデルやBERT2BERTの理論的なお話やhuggin
- BERT
- NLP
- 自然言語処理
- qiita
- あとで読む
量子計算のQmod言語の仕様を眺めて少し触ってみた感想 - Insight Edge Tech Blog
- 17 users
- techblog.insightedge.jp
- テクノロジー
- 2025/02/25
こんにちは! Insight Edge分析チームの梶原(悠)です。最近ひょんな経緯で量子計算用のQmodという言語のフィジビリ兼ゆる勉強会に顔を出しています。 Qmod言語 1 はclassiq社という量子ベンチャーが提供している無償有償ツール※で、簡便に量子アルゴリズムを実装できる高水準言語をうたっています。私は量子計算について何も知らない素人ですが、基本的なpythonと線形代数の知識があれば使えるとのことで、量子畑の人たちにあれこれ教えていただきながら、すこし触ってみました。量子計算に興味や前提知識はないが、技術動向はある程度把握しておきたいと考える技術者の読み手を想定して、言語仕様の一部やツールに触れてみた感想などを書きます。 ※ 2025.3.7 classiq社様より無償ツールの記述は誤りであるとのご連絡を頂いた為訂正しました。公式サイト中の"free for non-c
次世代「アイサイト」に向けた AI 開発をマネージドな機械学習プラットフォーム Vertex AI でスピードアップ | Google Cloud 公式ブログ
- 17 users
- cloud.google.com
- テクノロジー
- 2021/10/19
Google Cloud を試す$300 分の無料クレジットと 20 以上の無料プロダクトがある Google Cloud で構築を始めよう無料トライアル 2030 年までに自社製乗用車による「死亡交通事故ゼロ※」を掲げる株式会社ＳＵＢＡＲＵ。2020 年 12 月には東京渋谷に AI 開発拠点「SUBARU Lab（スバルラボ）」を開設し、運転支援システム「アイサイト」の安全性をさらに向上させる研究開発を加速させています。そんな同社が 2019 年に Google Cloud を導入したのにはどういった背景があったのか。SUBARU Lab の中核メンバーとして AI 開発を担う 2 人のエンジニアにお伺いしました。 ※ＳＵＢＡＲＵ乗車中の死亡事故およびＳＵＢＡＲＵ車との衝突による歩行者・自転車等の死亡事故をゼロに利用している Google Cloud サービス Vertex AI、
自分の研究を自腹で広告した体験談 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
- 17 users
- joisino.hatenablog.com
- テクノロジー
- 2022/04/26
皆さんは自分の研究成果をどうやって広めていますか？ひとつの研究は実働時間だけでも最低数ヶ月、全出版プロセスを考えると一年単位で取り組むこととなります。そうして手塩にかけて育てた研究が誰にも認知されない、というのはなんとも悲しいことです。僕が所属している機械学習分野は人工知能ブームにより、日々洪水のように論文が発表され、その中で存在感を発揮するのは難しくなっています。一昔前であれば、名のある国際会議やジャーナルに採択されればそれなりに存在感を発揮できたようですが、今では一つの会議に数千本の論文が採択されるため、採択された後にも競争に勝たなければ目立てないという事態になっています。論文のクオリティを上げて名のある国際会議に採択されるだけでは不十分、となれば一体どうすれば良いでしょう。有望な策は無く、天に祈って運に任せる、というのが最も一般的なパターンではないでしょうか。広く読まれる論
自然言語理解とそのモデリング - Reproc.pnz
- 17 users
- penzant.hatenadiary.com
- テクノロジー
- 2021/03/16
はじめにさいきん自然言語処理分野では「自然言語理解」なるものをどう考えるかについて議論があったりします。膨大なパラメータを大量のコーパスで訓練したシステム（ GPT-3 とか）を用いると言語理解が関わるようなさまざまなタスクで高い性能が達成できることがわかってきた今日このごろ、そうしたシステムが本当に「言語理解」なるものを実現しているのかということが焦点です。これは言語理解である、言語理解ではない、そもそも言語理解ってなんやねん……などなど、考えさせられる議論が論文やブログ記事などで展開されています。読んでいても何もわからん……状態になったので、ともかく自分の理解を整理してみようというのがこの記事を書き始めた動機です。こうした議論から得られる帰結（あるいは教訓）のひとつは、結局は理想的な言語理解なるものを定義しようと試みても決着しないので、具体的にどういった振る舞いがそれに含まれるのか
- nlp
- 言語
- 研究
- *あとで読む
https://twitter.com/zatazata/status/1572376514364346370
- 17 users
- twitter.com/zatazata
- テクノロジー
- 2022/09/21
1ペタバイトのデータセットで機械学習する / WebDataset入門
- 17 users
- zenn.dev/turing_motors
- テクノロジー
- 2022/05/23
深層学習をする上で、最も大切なマシンスペックを聞かれたら何と答えますか? GPUのTensor性能、VRAM、GPUの数、CPU性能、メモリ、… 問題によって正解は異なりますね。しかし、特に大規模なデータセットで機械学習する場合では、しばしばネットワーク帯域とストレージシステムのディスクI/Oによって制限されます。この記事ではそのような課題に対して、学習側でどのようにデータを扱うかを見ていきたいと思います。 1. この記事は? こんにちは、TURING MLチームです。TURINGはEnd-to-Endな深層学習モデルでLv5完全自動運転車の開発を目指す会社です。私たちは自動運転モデルを動かすため、可視域のカメラセンサによる画像で学習し、カメラ映像のみから車体の操作や経路選択、安全性の判断を行わせています。(実際の車を動かす事例はこちらの記事をご覧ください。) そのため、機械学習のため
コウメ太夫氏のネタの面白さを分析してみた【自然言語処理】 - Qiita
- 16 users
- qiita.com/masaka_programming
- テクノロジー
- 2022/01/26
やること一世を風靡したお笑い芸人、コウメ太夫氏のネタは、白塗りメイクと派手な着物に身を包み、甲高い裏声で「Xかと思ったら、Yでした〜！」と歌い上げてから、絹を裂くような金切り声で「チクショー！」と叫ぶというものです。その面白さを言葉によって説明するのは極めて難しいですが、「Xかと思った」という前振りの文Aと、「Yでした」というオチの文Bの接続の突拍子のなさが可笑しみを生み出しているというのは間違いないでしょう。しかし、ただ脈略のない二文を繋げればよいというわけではなく、理解不能ではあるけれどまるで無関連というわけではない、その飛躍具合の妙でネタの出来が決まると考えられます。そこで、今回はコウメ太夫氏のネタを構成する二つの文の飛躍の程度を定量化し、ネタの面白さにどのような関係があるかを分析します。文の意味を捉えるために、自然言語処理モデルであるBERTを使います。また、ネタの面白さの指
Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善
- 16 users
- techblog.yahoo.co.jp
- テクノロジー
- 2021/12/03
1.2 なぜDeep Metric Learningにしたか改善前のモデルでも特徴量を頑張って作れば解決できないことはないとは思います。「地名、ジャンル等に引っ張られて、拠点名指定を無視してしまう」パターンでは、クエリを解釈するロジックを入れ、地名だということを理解して地名部分のみを拠点の住所とマッチングさせて、それ以外を拠点名にマッチングさせて、という具合で特徴量を作れば正解できる可能性があると思います。しかし、これは一例で全体的に精度を上げるにはさまざまなケースを人が考慮して特徴量を作っていく必要があるので大変です。そこで、学習データ（クエリと正解拠点のペア）が大量にあることを生かして、DNN（Deep Neural Network）がよしなに学習してくれるのに期待しました。また、プロダクト化することを考えると遅くとも数百ミリ秒以内で応答する必要があるので、クエリと拠点側をそれぞれ
MLU-Explain
- 16 users
- mlu-explain.github.io
- テクノロジー
- 2022/03/11
MLU-EXPLAIN Visual explanations of core machine learning concepts Machine Learning University (MLU) is an education initiative from Amazon designed to teach machine learning theory and practical application. As part of that goal, MLU-Explain exists to teach important machine learning concepts through visual essays in a fun, informative, and accessible manner. Neural Networks Learn about neural net
μTransfer: 小規模モデルでのハイパラ探索を大規模モデルに転移し学習を効率化する｜Tatsuya Shirakawa
- 16 users
- note.com/tatsuyashirakawa
- テクノロジー
- 2024/02/26
最近、友人から大規模モデルの学習を劇的に効率化しそうな下記の事実（μTransfer）を教えてもらい、こんなことが成り立つことに非常に驚くとともに、それを知らなかったことにちょっとしたショックを受けました。 μTransfer 下記の手順で大規模モデル（Neural Networks）の最適なハイパーパラメータを効率的に獲得できる 1. 学習したい大規模モデル（ターゲットモデル）と同じアーキテクチャの次元や層数のより小さいモデルを用意し、それぞれのモデルのパラメータと最適化アルゴリズムを μP と呼ばれる方法でパラメータ付けする 2. その小さいモデルで、最適なハイパーパラメータ（学習率など）を探索する 3. ターゲットモデルに小さいモデルで獲得されたハイパーパラメータを適用する Greg Yang+, "Tensor Programs V: Tuning Large Neural Net
- 機械学習
Sentencepiece の分割を MeCab っぽくする - Qiita
- 16 users
- qiita.com/taku910
- テクノロジー
- 2023/04/13
Sentencepieceは公開から約6年経ち、月間のpipダウンロード数が1000万を超え、開発者として嬉しい限りです。ただ、Sentencepieceを使用する際にMeCabなどの形態素解析器を前処理に使うケースが散見されます。単語分割をしたいというニーズは理解できますが、作者としてはあまり満足していません。多言語処理が一般的になり、しかもSentencepieceは言語非依存のシステムであるにもかかわらず、なぜベタな日本語処理に依存するのでしょうか。このような使い方は、精度が向上するかもしれませんが、以下のようなデメリットもあります。形態素解析が入力した空白と、元からある空白を区別できないため、分割されたデータから元の文を復元することができません。（可逆処理ではない）。形態素解析システムに依存するため、メンテナンス性や可搬性が低下します。正しいバージョンの辞書を維持し、管理するこ
- NLP
- あとで読む
仮名加工情報はAI開発をどのように変えるのか～医療AI開発のケースを元に考えてみた～｜知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
- 15 users
- storialaw.jp
- テクノロジー
- 2021/05/12
2023年8月17追記（仮名加工情報の共同利用について） 2021年5月12日に公開した本記事ですが、その後、多くの方にお読みいただき多数のお問い合わせをいただきました。もっとも、改正個人情報保護法の全面施行日（2022年4月1日）に先立って公開した本記事においては、全面施行後、注目を集めている仮名加工情報の共同利用に関する記述がほとんどございません。仮名加工情報の共同利用については、その後公開しました「AI医療機器開発のための医療データ収集と個人情報保護法」において、研究デザインに応じたデータ収集のスキームを整理する中で触れておりますので、同記事をご覧いただけますと幸いです。１　はじめに～令和2年個人情報保護法改正個人情報保護法が2020年（令和2年）6月12日に改正され、公布されました（以下改正法を「法」といい、現行法と同じ条文番号のものも含めて統一して引用します）。改正法の全面
SimCSEとベクトル検索で類似内容を掲出し、利便性を改善する（Yahoo!検索の関連検索ワードでの事例）
- 15 users
- techblog.yahoo.co.jp
- テクノロジー
- 2023/05/08
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo!検索で機械学習エンジニアをしている由川です。 Yahoo!検索では、ユーザーが入力した検索クエリに関連する内容を掲出する関連検索ワードという機能があります（検索結果ページ上部と下部にあります）。従来の方法では、この関連検索ワードを出したくても掲出できないケースがありました。本記事では、高品質な文ベクトルを生成する手法SimCSEを用いて検索クエリと意味が類似する内容を掲出することで、関連検索ワード機能を改善させた事例を紹介します。 ※この記事で取り扱っているデータは、プライバシーポリシーの範囲内で取得したデータを個人が特定できない状態に加工しています。詳しくはYahoo! JAPAN プライバシーセンター
- NLP
- 学習
- 検索
- あとで読む
porkbun.com | parked domain
- 15 users
- kobra.dev
- テクノロジー
- 2021/05/13
kobra.dev has been registered at Porkbun but the owner has not put up a site yet. Visit again soon to see what amazing website they decide to build.
GPT-3互換のGPT-J-6Bで日本語推論
- 15 users
- zenn.dev/yu89mo
- テクノロジー
- 2021/06/24
この記事は何？自然な文章を生成できるとして、一時期話題になったGPT-2の後継であり、パラメータサイズの大きさからより高性能と更に話題になったGPT-3と同等の精度かつApache-2.0で商用利用可能なGPTが登場したので日本語で試してみた記事です。実装や理論については触れていません。 GPT-3とは OpenAIにより作成された1750億パラメータの自然言語処理モデル Microsoftが独占ライセンスを取得しており、一般ユーザが利用するためにはOpenAI APIへの登録が必要、1000tokenあたり$0.0008~$0.0600[1] MODEL PRICE PER 1K TOKENS
- NLP
- 日本語
- 言葉
- あとで読む
CLIP+Faiss+Streamlitで画像検索アプリを作成してみる - OPTiM TECH BLOG
- 15 users
- tech-blog.optim.co.jp
- テクノロジー
- 2022/07/04
R&Dチーム所属の伊藤です。気がついたら半年ぶりくらいの投稿になってしまいました。今回はrinna株式会社より公開された言語画像モデルである日本語対応CLIPを使ってみた話になります。元々はCLIPとFaissを組み合わせて画像検索のためのツールを作れないかを試していたのですが、どうせだったら可視化までしようと考えてStreamlitを使用したアプリ化も行いました。今回作成したコードはGithubのリポジトリにありますので、興味がある方は覗いてみてください。 CLIPとは？ Faissとは？ CLIPとFaissで画像検索事前準備画像ベクトルのインデックス作成インデックスを読み込んで画像検索 Streamlitで画像検索アプリを作成する最後に CLIPとは？ CLIPはOpenAIより提案された、テキストと画像を使用して画像分類モデルです。 CLIPはContrastive
- clip
- あとで読む
GitHub - postgresml/postgresml: Postgres with GPUs for ML/AI apps.
- 15 users
- github.com/postgresml
- テクノロジー
- 2022/04/20
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- PostgreSQL
- db
- techfeed
- github
日本語 BERT RetroMAE モデルの公開と、後続検索タスクでの評価 - A Day in the Life
- 15 users
- secon.dev
- テクノロジー
- 2024/10/30
結果として、ほぼ全てのスコアにおいて性能向上が確認されており、RetroMAEの有益性が確認された。また学習方法も、教師なしでテキストのみを与えれば良いという手軽さも実用性が高いであろう。 RetroMAE について RetroMAEの特徴は、Masked Auto-Encoderの手法を採用しながら、以下の3つの設計を取り入れた点である。入力文に対して異なるマスクを適用する新しいワークフローエンコーダーとデコーダーで非対称な構造を採用エンコーダーとデコーダーで異なるマスク率を使用これらの工夫により、文書の意味をより深く理解し、効果的な検索を可能にする表現学習を実現している。実際の評価においても、BEIRやMS MARCOなどのベンチマークで優れた性能を示している。また高性能のマルチリンガル密ベクトルモデルの BAAI/bge-m3 も RetroMAE を用いた事前学習を行なって
Onnx RuntimeをUnityで動かす - Asus4 onD
- 15 users
- asus4.hatenablog.com
- テクノロジー
- 2023/12/29
Onnx Runtimeをネイティブプラグインとして、Unity上で動かす実験とサンプルを公開しています。 github.com 開発の動機 4年前に、TensorFlow LiteをUnityで動かす実験を初めて、はじめは全くの趣味で始めたものが、今では海外からいただく相談の半分以上が機械学習関連になっています。四年前に始めた実験↓ asus4.hatenablog.com ところが、実際にシェアを見ると、研究関連ではPytorchのシェアが圧倒的。Unityの公式推論ライブラリBarracudaやTensorFlow Liteで動かすために一旦Onnxに変換するなどの事例なども増え始め、速度的にはTFLiteは非常に満足していますが、サクッとモデルを試してみたいという時に、変換するのが億劫になってきていました。公式ツールで変換しようにもOnnxやPytorchのNCHWからTFLi
- unity
- 機械学習
- ai
- あとで読む