samurairodeoのブックマーク / 2021年10月18日

Multitask Prompted Training Enables Zero-Shot Task Generalization

Large language models have recently been shown to attain reasonable zero-shot generalization on a diverse set of tasks (Brown et al., 2020). It has been hypothesized that this is a consequence of implicit multitask learning in language models' pretraining (Radford et al., 2019). Can zero-shot generalization instead be directly induced by explicit multitask learning? To test this question at scale,

samurairodeo 2021/10/18

リンク

東京都のCOVID-19

東京都の情報は2021-05-24以降は毎日16:45に東京都福祉保健局からPDFで発表されているが，手作業での更新のようで，うまくスクレープできないこともあった。そうこうしているうちに厚労省が16:00ごろ全国の都道府県についてオープンデータを更新することになったので、そちらを取得して COVID-tokyo.csv を作成し，自動ツイートしている（描画部分のコード：COVID-tokyo.py）。そのグラフ：実効再生産数を，(直近7日間の陽性数/n日前7日間の陽性数)**(5/n)で近似したもの。東洋経済オンラインでは n=7 としているが，ここでは 1 から 7 までの7本のグラフを示した。全区間にわたってプロットしたもの：縦軸を対数目盛にしたもの：奥村晴彦 Last modified: 2022-12-31 16:26:39 JST

samurairodeo 2021/10/18

あとで読む

リンク

【SIGNATE】BERTで医療論文を2値分類する(PyTorch BERT)

何をしたのか(概要) 🤗Huggingface Transf ormersで提供されているmicrosoft/BiomedNLP-PubMedBERT-base-uncased-abstract-fulltextをベースにして、医療論文の2値分類用にFine tuningしました。 Modelには、上記のBERTをベースとして、LSTM, Conv1D, Linear層を追加し、BERTの重みを最大限活かした予測ができるように工夫しています。 Datasetには、Argument(データ拡張)処理を実装し、学習データの文章をランダムに削除したり入れ替えることで過学習の抑制をしました。ラベル1が全体のうちの 1/43 程度しかなかったこと、評価指標がラベル1の正解を高く評価する指標であることから、損失関数のラベル1に対する重みを130倍 (ヒューリスティックス) に設定した。 Datase

samurairodeo 2021/10/18

あとで読む

リンク

CDNは5時間で開発できる | POSTD

「CDN」（content delivery network）という言葉からは、Googleのような大企業がいくつもの巨大なハードウェアを管理し、1秒当たり何百ギガビットものデータを処理する様子が想像されます。しかし、CDNは単なるWebアプリケーションです。私たちのイメージとは違いますが、それが事実です。8年前に買ったノートパソコンを使って、コーヒーショップの席に座りながらでも、きちんと機能するCDNを構築できます。この記事では、これから5時間でCDNを開発しようとするときに、直面するかもしれないことを紹介します。まずはCDNの機能を明らかにしておきましょう。CDNはセントラルリポジトリ（通称：オリジン）からファイルを吸い上げ、ユーザーに近い場所でコピーを保存します。初期のオリジンはCDNのFTPサーバーでした。現在、オリジンは単なるWebアプリとなり、CDNはプロキシサーバーとして機

samurairodeo 2021/10/18

あとで読む

リンク

日立、AIでTwitterから反響を分析モラルと意外性の分析が可能に | Ledge.ai

株式会社日立製作所（日立）は10月7日、AI（人工知能）を活用し、Twitterなどのテキストデータから企業や商品に対する反響を「感情」の観点で分析・可視化する「感性分析サービス」に、新たに道徳の観点で分析する「モラル分析」、意外性の観点で分析する「意外性分析」の2つの機能を追加した。「モラル分析」機能は、道徳基盤理論（※1）を参考に作成した道徳基盤辞書（※2）にもとづき、東京工業大学笹原研究室の助言をもとに開発した。（※1）アメリカの社会心理学者であるジョナサンハイトが提唱したもので、人は生まれつき道徳的な善し悪しに関する五つの普遍的・通文化的基盤を持っているとする理論。（※2）Moral Foundations Dictionary（MFD）とJapanese Moral Foundations Dictionary（J-MFD）を活用している。 AIでテキストから特徴語を抽出

samurairodeo 2021/10/18

あとで読む

リンク

GitHub - eugeneyan/applied-ml: 📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

samurairodeo 2021/10/18

あとで読む

リンク

Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

ビジネス文書をデータ化し構造や内容を理解するアプリケーションはドキュメント・インテリジェンスと呼ばれ、画像処理や自然言語処理といった複数の要素技術を組み合わせて開発する必要があります。何が必要でどう実現すれば良いのかといった第一歩を、Pythonでの具体的な構築事例とともに紹介します。 https…

samurairodeo 2021/10/18

あとで読む

リンク

量子機械学習で何が起こっているのか？

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。はじめ機械学習は国際的な分野になっています。MLはますます強力になっており、これらのシステムの学習や開発の難易度も急速に高まっています。このため、研究者の間では、量子コンピューティングを利用した機械学習（QML）への関心が高まっています。大小のハイテク企業が、量子コンピュータでMLを実行するための開発に投資を始めています。しかし、量子コンピューティング自体はかなり難しい。何百万個もの量子ビットを統合する必要があるフォールト・トレラントな量子コンピュータの開発は困難を極めます。現在利用可能なNoisy Intermediate Scale Quantum（NISQ）デバイス上で強力なQMLアルゴリズムを実現できる可能性はいくつかあります。実際、すでにいくつかのブレークスルーがな

samurairodeo 2021/10/18

あとで読む

リンク

個人情報保護法改正2020年の重要ポイントをわかりやすく解説

個人情報保護法改正2020年2021年のポイント解説改正法2022年4月施行 2020.1（2022.5改訂）弁護士水町雅子 Wordバージョンも公開中 http://www.miyauchi-law.com/f/220324piikaiseigaiyou_bunshou.pdf NEW! http://www.miyauchi-law.com/f/200923piikaisei.pdf 仮名加工情報と匿名加工情報 https://cyberlawissues.hatena blog.com/entry/2021/09/27/141947 ※本資料はあくまで当職の意見にすぎず、当局見解と異なる場合があり得ます。また誤記・漏れ・ミス等あり得ますので、改正法、現行法やガイドライン原典に必ず当たるようお願いします。講師略歴弁護士水町雅子（みずまちまさこ） http://www.m

samurairodeo 2021/10/18

あとで読む

リンク

https://jp.techcrunch.com/2021/10/14/linked-ideal-toposoid-release/

samurairodeo 2021/10/18

あとで読む

リンク

Vertex Pipelines ではじめるサーバーレス機械学習パイプライン

資料中で出てくるサンプルには次の URL からアクセスできます GitHub: https://github.com/reproio/lab_sample_pipelines/tree/main/kfp 解説ブログ: https://tech.repro.io/entry/2021/06/22/…

samurairodeo 2021/10/18

あとで読む

リンク

NTTの新暗号、なるか世界標準　中国の量子暗号に対抗 - 日本経済新聞

ネット通販から国家の機密情報のやりとりまで支える暗号通信の方式が早ければ2024年から変わる。超高速計算が可能な量子コンピューターの登場で、現行方式では簡単に解読される恐れがあるためだ。新方式にはNTTが提唱する新暗号が有力候補として残る。世界の通信覇権を握ろうと「IOWN構想」を掲げるNTTに弾みがつくか。「この暗号は簡単に解く方法があるのではないか」「いや、安全性に問題はない」。6月、米国

samurairodeo 2021/10/18

あとで読む

リンク

Pytorch Template 個人的ベストプラクティス（解説付き） - Qiita

はじめに Pytorchでコードを書き始めるとき、乱数固定やデータローダー、モデルの訓練や学習結果の取得等、毎度色々なサイトを参照するのは面倒だと思い、現時点の個人的ベストプラクティス・テンプレートを作成してみました。今後のバージョンアップや便利なライブラリの登場で変わるかもしれませんげ、現在はこれで落ち着いています。個人的な備忘録も兼ねて、前半に簡単な解説付きのコードと最後に全コードを載せています。もっと便利な書き方やライブラリなどあれば、コメントいただけると嬉しいです。テンプレート（解説付き） 1. ライブラリインポートと初期設定 torchやよく利用するライブラリ(numpy, matplotlib)のインポートモデルの訓練時（for文）の進捗を表示するtqdmライブラリ（jupyter notebookとコマンドライン版）進捗表示は待ち時間の見積もりやエラーに気づくこと

samurairodeo 2021/10/18

あとで読む

リンク

General-Purpose Question-Answering with Macaw

samurairodeo 2021/10/18

あとで読む

リンク

すかいらーく、2000店舗に配膳ロボ　感染対策強化 - 日本経済新聞

ファミレスチェーン最大手のすかいらーくホールディングス（HD）は2022年末までに約2000店舗で配膳ロボットを導入する。店員の作業負担を減らし、新型コロナウイルスの感染予防策も狙う。行動制限が緩和されるなか、人手不足や非接触に対応したサービスが広がりそうだ。22年4月までに主力業態「ガスト」の一部や「しゃぶ葉」全店の計約1000店に導入する。22年末までには「バーミヤン」などにも導入し、店舗

samurairodeo 2021/10/18

リンク

はてなブックマーク

タグ

2021年10月18日のブックマーク (15件)

Multitask Prompted Training Enables Zero-Shot Task Generalization

東京都のCOVID-19

【SIGNATE】BERTで医療論文を2値分類する(PyTorch BERT)

CDNは5時間で開発できる | POSTD

日立、AIでTwitterから反響を分析モラルと意外性の分析が可能に | Ledge.ai

GitHub - eugeneyan/applied-ml: 📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production.

Pythonで始めるドキュメント・インテリジェンス入門 / Introduction to Document Intelligence with Python

量子機械学習で何が起こっているのか？

個人情報保護法改正2020年の重要ポイントをわかりやすく解説

https://jp.techcrunch.com/2021/10/14/linked-ideal-toposoid-release/

Vertex Pipelines ではじめるサーバーレス機械学習パイプライン

NTTの新暗号、なるか世界標準　中国の量子暗号に対抗 - 日本経済新聞

Pytorch Template 個人的ベストプラクティス（解説付き） - Qiita

General-Purpose Question-Answering with Macaw

すかいらーく、2000店舗に配膳ロボ　感染対策強化 - 日本経済新聞

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス