showyouのブックマーク / 2020年2月26日

Camphr: spaCy plugin for Transformers, Udify, KNP - Qiita

CamphrはspaCyのプラグインです．日本だとGinzaがspaCyを利用しており有名ですね． spaCyはNLPフレームワークで，以下のような特長があります(主観). 様々な機能を簡単に合成できる (深層学習からパターンマッチまで何でもOK) パイプラインを1コマンドで保存&復元できる 1つ目の機能は実用上とても重要です．NLPはここ数年で大幅に進歩しましたが，実際のタスクはend-to-endにデータを食わせればOK，みたいに美味しいものばかりではありません．かといって新しい手法を全く使わないのも，あまり筋が良くなさそうです． spaCyを使うと，最新の手法からルールベースの手法まで，様々な手法を組み合わせることができます．そしてCamphrを使うと，例えばBERTをfine-tuneした後にKNPと正規表現を組み合わせる，ということが簡単にできます．また2つめの機能のおかげで，

showyou 2020/02/26

自然言語処理

リンク

How to train a new language model from scratch using Transformers and Tokenizers

How to train a new language model from scratch using Transf ormers and Tokenizers Over the past few months, we made several improvements to our transf ormers and tokenizers libraries, with the goal of making it easier than ever to train a new language model from scratch. In this post we’ll demo how to train a “small” model (84 M parameters = 6 layers, 768 hidden size, 12 attention heads) – that’s th

showyou 2020/02/26

Transformer公式で、言語モデルの学習から転移学習までのチュートリアルが公開。学習済みモデルをさくっと転移、ではなくTokenizerの学習からスタートして言語モデルの学習、精度確認、転移、と順を追って解説している。

リンク

The Annotated GPT-2

Introduction Prerequisites Language Models are Unsupervised Multitask Learners Abstract Model Architecture (GPT-2) Model Specifications (GPT) Imports Transf ormer Decoder inside GPT-2 CONV1D Layer Explained FEEDFORWARD Layer Explained ATTENTION Layer Explained Scaled Dot-Product Attention Multi-Head Attention GPT-2 Model Architecture in Code Transf ormer Decoder Block Explained The GPT-2 Architectur

showyou 2020/02/26

Hugging Faceの実装を参考に、1からGPT-2を実装した記事。個別のレイヤから始まり全体の構成まで丁寧に解説されている。

リンク

機械学習・深層学習による自然言語処理入門|マイナビブックス

備考中山光樹（なかやまひろき） 1991年生まれ。電気通信大学卒、電気通信大学情報理工学研究科修士課程修了。現在、企業にて、自然言語処理や機械学習に研究開発に従事。また、GitHub上でオープンソースソフトウェアの自然言語処理ライブラリ開発にも貢献している。 Contents Chapter 1 自然言語処理の基礎 1-1 本章の概要 1-2 自然言語処理とは？ 1-2-1 自然言語と人工言語 1-2-2 自然言語処理 1-3 自然言語処理のタスク 1-3-1 自然言語処理の基礎技術 1-3-2 自然言語処理の応用技術 1-4 自然言語処理の難しさ 1-4-1 おさらい Chapter 2 機械学習 2-1 本章の概要 2-2 機械学習とは？ 2-3 教師あり学習 2-3-1 分類 2-3-2 回帰 2-4 教師なし学習 2-4-1 クラスタリング 2-4-2 次元削減 2-5 強化

showyou 2020/02/26

リンク

GitHub - PKSHATechnology-Research/camphr: Camphr - NLP libary for creating pipeline components

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

showyou 2020/02/26

PKSHAがspaCyから直感的にTransformer等を扱えるCamphrを公開(spaCy公式からも紹介)。BERTベースの係り受け解析モデルUdifyやTransformerの潜在表現が使えるだけでなく、KNPの解析結果も使うことができる。

リンク

Listen to Transformer

Music Transf ormer is an open source machine learning model from our research group that can generate long musical performances. We find it interesting to see what these models can and can’t do, so we made an app to make it easier to explore and curate the model’s output. If you listen to a bunch of samples, you’ll probably find that most compositions (like a lot of fully AI-generated music) are no

showyou 2020/02/26

Transformerベースの音楽生成モデルMusic Transformerで生成した音楽が聴けるサイトが公開。Music TransformerはMagentaから使うことが可能。ちなみに左側のアートワークも自動生成されているとのこと。

リンク

メンバーに恨まれそうな3つのコードレビュー施策を徹底したら、逆にメンバーが爆速で成長した話 - Qiita

ある程度経験を積んだレビュワーがやりがちな失敗は、指摘しやすいコーディング規約違反だけ指摘しているというもの。コードレビューで指摘するべき欠陥とは、必ずしも規約違反だけではなく、仕様考慮もれや機能的なバグ、非機能的なセキュリティやパフォーマンス上の問題点も含まれる。一つ関数に対して複数の視点でソースチェックをしないといけないが、人間は同時に複数のことは考えられない。そこでどうすればいいかと情報をあさっていたところ、われらがIPAがセキュアプログラミング講座というWEBページで、四回に分けてレビューすることを提唱していた。１回目はどこに何があるか、２回目は可読性が確保されているか、規約にのっとっているか３回目は機能性４回目はセキュリティといった具合である。 IPAの講座では４回目はセキュリティに限定しているが、担当していたプロダクトは、非機能面はセキュリティはも

showyou 2020/02/26

リンク

【動画付き】 draw.io 使い方まとめ〜エンジニアでなくても使えるTips集〜 - Qiita

draw.io はブラウザを使用してフローチャート、プロセス図、組織図、UML 図、ER モデル、ネットワーク図などを作成できる優れたツールです。作成した図は xml ファイルとして保存でき、GitHub との連携もシームレスに行われます。3 年ほど愛用しているツールですが、隠された使い方がたくさんあります。すぐに忘れてしまうので取りまとめておきます。「こんな使い方あるよ！オススメだよ！！」という方はぜひ編集リクエストをいただければ追記していく予定です 😊 ※ 主に参照している文献は以下、公式ブログは非常に分かりやすいのでオススメです。ツイッター公式アカウント公式ブログショートカットショートカット集です。机の上に置いて覚えましょう。 Line / 線まずは最も頻繁に使う Line(線)の使い方からご紹介します。矢印をまっすぐに揃えるちまちまと矢印の線をドラッグして微調整し

showyou 2020/02/26

超絶有用だった

リンク

はてなブックマーク

タグ

2020年2月26日のブックマーク (8件)

Camphr: spaCy plugin for Transformers, Udify, KNP - Qiita

How to train a new language model from scratch using Transformers and Tokenizers

The Annotated GPT-2

機械学習・深層学習による自然言語処理入門|マイナビブックス

GitHub - PKSHATechnology-Research/camphr: Camphr - NLP libary for creating pipeline components

Listen to Transformer

メンバーに恨まれそうな3つのコードレビュー施策を徹底したら、逆にメンバーが爆速で成長した話 - Qiita

【動画付き】 draw.io 使い方まとめ〜エンジニアでなくても使えるTips集〜 - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス