misshikiのブックマーク / 2022年12月14日

misshiki id:misshiki

2022年12月14日のブックマーク (18件)

Data2vec 2.0: Highly efficient self-supervised learning for vision, speech and text
Data2vec 2.0: Highly efficient self-supervised learning for vision, speech and text Many recent breakthroughs in AI have been powered by self-supervised learning, which enables machines to learn without relying on labeled data. But current algorithms have several significant limitations, often including being specialized for a single modality (such as images or text) and requiring lots of computat
misshiki 2022/12/14
“Data2vec 2.0: 視覚、音声、テキストのための非常に効率的な自己教師あり学習”

コンピュータビジョン

音声処理

自然言語処理
リンク
fairseq/examples/data2vec at main · facebookresearch/fairseq
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2022/12/14
自然言語処理

コンピュータビジョン

ディープラーニング
リンク
Meta AI on Twitter: "Announcing data2vec 2.0, a new general self-supervised algorithm built by Meta AI for speech, vision & text that ca… https://t.co/fJl24aEatl"
misshiki 2022/12/14
“data2vec 2.0 を発表。音声、視覚、テキスト用に Meta AI によって構築された新しい一般的な自己教師ありアルゴリズム。同じ精度を達成しながら、画像用の最も一般的な既存のアルゴリズムよりも 16 倍速くトレーニング”

ディープラーニング
リンク
RAPIDS cuDF for accelerated data science on Google Colab
misshiki 2022/12/14
“RAPIDS cuDF は、データを処理および分析するための使い慣れた pandas API を実装するオープンソースの GPU 高速化データフレームライブラリです。”

Jupyter

Python
リンク
GitHub - dotnet/TorchSharp: A .NET library that provides access to the library that powers PyTorch.
Please check the Release Notes file for news on what's been updated in each new release. TorchSharp is now in the .NET Foundation! If you are using TorchSharp from NuGet, you should be using a version >= 0.98.3 of TorchSharp, and >= 1.12.0 of the libtorch-xxx redistributable packages. We recommend using one of the 'bundled' packages: TorchSharp-cpu, TorchSharp-cuda-windows, or TorchSharp-cuda-linu
misshiki 2022/12/14
“TorchSharp は .NET Foundation に含まれるようになりました。”

PyTorch

C#
リンク
Python(pandas、NumPy、scikit-learnなど)によるデータの前処理大全
普段、筆者がデータの前処理で使っているpandasやNumPy、scikit-learnなどのモジュールの使い方を逆引きのリファレンス形式でまとめました。一部のサンプルデータや前処理の手法については、データサイエンティスト協会の100本ノック(構造化データ加工編)を参考にさせていただきました。素晴らしいコンテンツをご用意頂いたこと本当に感謝します。それでは、以下のモジュールをインポートして、この記事をデータ前処理時の辞書代わりにして利用してください。モジュールのインポート import numpy as np import pandas as pd from sklearn import preprocessing as pp from sklearn.model_selection import train_test_split from imblearn.under_sampli
misshiki 2022/12/14
Python
リンク
GPTでKey作品の名言から文章を生成してみた - ABEJA Tech Blog
目次目次はじめにそもそもGPTとは日本語データセットで学習されたGPT 入力文章 GPTによる生成コード出力結果 ChatGPTで生成まとめ ABEJAについてはじめに本記事はABEJAアドベントカレンダー2022の13日目の記事です。こんにちは！カスタマーサクセス統括部データサイエンスグループでインターンをやらせていただいている村尾(@MURA_omura)です。私は高専の専攻科生で、現在GANsを用いた音声生成に関する研究に取り組んでいます。高専といえばYouTubeで100万人の登録者がいるかっつーさんや、生活に技術を取り込むのが上手なラムダ技術部さんが有名です。 1年半ほど前からKey作品にはまっていて、この間Summer Pockets REFLECTION BLUEを購入しました！ Kye作品は泣ゲーで知られていて、「CLANNADは人生」というフレ
misshiki 2022/12/14
GPT-2
リンク
https://twitter.com/stateofai_ja/status/1602757047598338048
misshiki 2022/12/14
“「人間によるフィードバックを用いた強化学習 (RLHF; Reinforcement Learning from Human Feedback)」の非常に分かりやすい解説動画 (by HuggingFace)”

強化学習
リンク
Vertex AI Model Registry で機械学習モデルのバージョン管理をする - Qiita
Vertex AI Model Registry とはその名の通り、 ML モデルのバージョンを管理するための場所です。モデルのバージョン管理をするだけであれば GCS 等にモデルの情報を記載したテキストファイルを用意するなどの方法が考えられますが、 Vertex AI Model Registry を使うことの1番のメリットはやはり他の Vertex AI サービスとの親和性が高い点です。例えば Model Registry に配置したモデルは以下のように利用できます。テストデータに対するモデルの精度検証 Vertex AI Endpoint へのデプロイバッチ予測の実行また BigQuery ML や AutoML で学習されたモデルも Model Registry で管理できるため、 GCP の何らかのサービスで学習した ML モデルは全て Model Registry に
misshiki 2022/12/14
GCP
リンク
K-Meansクラスタリング scikit-learnを使わずゼロから実装する(Python)｜｜es
K-Meansは個人的にも好きなアルゴリズムで、教師あり学習を必要とせず、混沌とした中からパターンを見つけ出してくれる可能性があります。実際、実践で使うとそのような都合の良いデータはほとんどなく、むしろ仮説を否定する場合に使う方が現実的かもしれません。自分の場合、顧客のセグメント分けに使うことが多いです。ステップ 1. ランダムに k 個のデータポイントを初期のセントロイドとして選ぶ。ステップ 2. トレーニングセット内のデータポイントと k 個のセントロイドの距離（ユークリッド距離）を求める。ステップ 3. 求めた距離に基づいて、データポイントを一番近いセントロイドに割り当てる。ステップ 4. 各クラスタグループ内のポイントの平均を取ることでセントロイドの位置を更新する。ステップ 5. ステップ 2 から 4 をセントロイドが変化しなくなるまで繰り返します。以下、シンプ
misshiki 2022/12/14
機械学習
リンク
Python機械学習プログラミング PyTorch＆scikit-learn編 - インプレスブックス
4,620円（本体 4,200円＋税10%）品種名書籍発売日2022/12/15 ページ数712 サイズB5変形判著者 Sebastian Raschka　著/Yuxi (Hayden) Liu　著/Vahid Mirjalili　著/株式会社クイープ　訳/福島真太朗　監修 ISBN 9784295015581 第3版まで続くロングセラーのPyTorch版！機械学習の基本から、PyTorchによる先進的手法まで本格解説―本書の前半は、定番の機械学習ライブラリscikit-learnによる手法を解説。基本的なモデルから単層ニューラルネットまで実装するほか、データ前処理、次元削減、ハイパーパラメーター、アンサンブル学習、回帰分析などを取り上げます。後半はPyTorchの仕組みを説明し、CNN／RNN／Transf ormerなどの実装を解説。GAN、グラフニューラルネットワーク、強化学習
misshiki 2022/12/14
“2022/12/15”

PyTorch

scikit-learn
リンク
RT-2: Vision-Language-Action Models
RT2: Vision-Language-Action Models RT-2 model picking up object given the prompt "pick up the extinct animal." Anthony Brohan Noah Brown Justice Carbajal Yevgen Chebotar Xi Chen Krzysztof Choromanski Tianli Ding Danny Driess Avinava Dubey Chelsea Finn Pete Florence Chuyuan Fu Montse Gonzalez Arenas Keerthana Gopalakrishnan Kehang Han Karol Hausman Alex Herzog Jasmine Hsu Brian Ichter Alex Irpan Ni
misshiki 2022/12/14
ロボット

Transformer
リンク
GitHub - google-research/robotics_transformer
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2022/12/14
ロボット

Transformer
リンク
RT-1: Robotics Transformer for real-world control at scale
Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more
misshiki 2022/12/14
“RT-1: 大規模な実世界制御用のロボティクストランスフォーマー”

Transformer

ロボット
リンク
https://twitter.com/jaguring1/status/1602842583780102145
misshiki 2022/12/14
“実世界で700以上のタスクを97%の成功率で実行する汎用ロボット「RT-1（Robotics Transformer 1）」を発表”

Google

ロボット
リンク
画像生成AI「Stable Diffusion」などの開発に大きな貢献を果たした超巨大データセット「LAION-5B」とは？
AIを構築する上ではアルゴリズムだけでなく訓練用のデータセットも重要であり、データセットの質によってAIの精度も大きく左右されます。高精度な画像生成AIとして話題のStable Diffusionでは、「LAION-5B」という50億以上もの画像とテキストのペアを含むデータセットを用いています。 LAION-5B: A NEW ERA OF OPEN LARGE-SCALE MULTI-MODAL DATASETS | LAION https://laion.ai/blog/laion-5b/ 大規模な機械学習モデルやデータセット、関連コードなどの一般公開を掲げる「Large-scale Artificial Intelligence Open Network(LAION)」というドイツの非営利団体は、2022年3月に超巨大なデータセットである「LAION-5B」をリリースしました。LAI
misshiki 2022/12/14
“高精度な画像生成AIとして話題のStable Diffusionでは、「LAION-5B」という50億以上もの画像とテキストのペアを含むデータセットを用いています。”

オープンデータ
リンク
中国が画像生成AIの画像に「AI生成マークの表示」を義務化＆AIユーザーも実名登録制へ
近年、Stable DiffusionやMidjourneyなどの画像生成AIの開発が急速に進んでおり、誰でも手軽にAIによるコンテンツ生成を実行できる環境が整いつつあります。そんな中、中国政府が画像やムービーを生成できるAIについて「ユーザーの実名登録」や「AIによって生成された旨の表示」を義務付ける規則を発表しました。国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》-中共中央网络安全和信息化委员会办公室 http://www.cac.gov.cn/2022-12/11/c_1672221949318230.htm China bans deepfakes created without permission or for evil • The Register https://www.theregister.com/2022/12/12/china_deep_syn
misshiki 2022/12/14
“中国政府が画像やムービーを生成できるAIについて「ユーザーの実名登録」や「AIによって生成された旨の表示」を義務付ける規則を発表”

人工知能
リンク
「GAFAで働くのが夢だったのに」巨大テックの人員削減に翻弄される米国の優秀な学生たち（クーリエ・ジャポン） - Yahoo!ニュース
misshiki 2022/12/14
“今年の夏以降、複数の巨大テックで人員削減が行われており、学生たちは好条件のオファーどころか、インターンシップの機会すら手に入れるのが難しくなっている”

気になる
リンク
- 2022年12月15日
- 2022年12月14日
- 2022年12月13日