タグ

2020年2月26日のブックマーク (8件)

  • Camphr: spaCy plugin for Transformers, Udify, KNP - Qiita

    CamphrはspaCyのプラグインです.日だとGinzaがspaCyを利用しており有名ですね. spaCyNLPフレームワークで,以下のような特長があります(主観). 様々な機能を簡単に合成できる (深層学習からパターンマッチまで何でもOK) パイプラインを1コマンドで保存&復元できる 1つ目の機能は実用上とても重要です.NLPはここ数年で大幅に進歩しましたが,実際のタスクはend-to-endにデータをわせればOK,みたいに美味しいものばかりではありません.かといって新しい手法を全く使わないのも,あまり筋が良くなさそうです. spaCyを使うと,最新の手法からルールベースの手法まで,様々な手法を組み合わせることができます.そしてCamphrを使うと,例えばBERTをfine-tuneした後にKNPと正規表現を組み合わせる,ということが簡単にできます. また2つめの機能のおかげで,

    Camphr: spaCy plugin for Transformers, Udify, KNP - Qiita
  • How to train a new language model from scratch using Transformers and Tokenizers

    How to train a new language model from scratch using Transformers and Tokenizers Over the past few months, we made several improvements to our transformers and tokenizers libraries, with the goal of making it easier than ever to train a new language model from scratch. In this post we’ll demo how to train a “small” model (84 M parameters = 6 layers, 768 hidden size, 12 attention heads) – that’s th

    How to train a new language model from scratch using Transformers and Tokenizers
    showyou
    showyou 2020/02/26
    Transformer公式で、言語モデルの学習から転移学習までのチュートリアルが公開。学習済みモデルをさくっと転移、ではなくTokenizerの学習からスタートして言語モデルの学習、精度確認、転移、と順を追って解説している。
  • The Annotated GPT-2

    Introduction Prerequisites Language Models are Unsupervised Multitask Learners Abstract Model Architecture (GPT-2) Model Specifications (GPT) Imports Transformer Decoder inside GPT-2 CONV1D Layer Explained FEEDFORWARD Layer Explained ATTENTION Layer Explained Scaled Dot-Product Attention Multi-Head Attention GPT-2 Model Architecture in Code Transformer Decoder Block Explained The GPT-2 Architectur

    showyou
    showyou 2020/02/26
    Hugging Faceの実装を参考に、1からGPT-2を実装した記事。個別のレイヤから始まり全体の構成まで丁寧に解説されている。
  • 機械学習・深層学習による自然言語処理入門|マイナビブックス

    備考 中山 光樹(なかやま ひろき) 1991年生まれ。電気通信大学卒、電気通信大学情報理工学研究科修士課程修了。現在、企業にて、自然言語処理や機械学習に研究開発に従事。また、GitHub上でオープンソースソフトウェアの自然言語処理ライブラリ開発にも貢献している。 Contents Chapter 1 自然言語処理の基礎 1-1 章の概要 1-2 自然言語処理とは? 1-2-1 自然言語と人工言語 1-2-2 自然言語処理 1-3 自然言語処理のタスク 1-3-1 自然言語処理の基礎技術 1-3-2 自然言語処理の応用技術 1-4 自然言語処理の難しさ 1-4-1 おさらい Chapter 2 機械学習 2-1 章の概要 2-2 機械学習とは? 2-3 教師あり学習 2-3-1 分類 2-3-2 回帰 2-4 教師なし学習 2-4-1 クラスタリング 2-4-2 次元削減 2-5 強化

    機械学習・深層学習による自然言語処理入門|マイナビブックス
    showyou
    showyou 2020/02/26
  • GitHub - PKSHATechnology-Research/camphr: Camphr - NLP libary for creating pipeline components

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - PKSHATechnology-Research/camphr: Camphr - NLP libary for creating pipeline components
    showyou
    showyou 2020/02/26
    PKSHAがspaCyから直感的にTransformer等を扱えるCamphrを公開(spaCy公式からも紹介)。BERTベースの係り受け解析モデルUdifyやTransformerの潜在表現が使えるだけでなく、KNPの解析結果も使うことができる。
  • Listen to Transformer

    Music Transformer is an open source machine learning model from our research group that can generate long musical performances. We find it interesting to see what these models can and can’t do, so we made an app to make it easier to explore and curate the model’s output. If you listen to a bunch of samples, you’ll probably find that most compositions (like a lot of fully AI-generated music) are no

    Listen to Transformer
    showyou
    showyou 2020/02/26
    Transformerベースの音楽生成モデルMusic Transformerで生成した音楽が聴けるサイトが公開。Music TransformerはMagentaから使うことが可能。ちなみに左側のアートワークも自動生成されているとのこと。
  • メンバーに恨まれそうな3つのコードレビュー施策を徹底したら、逆にメンバーが爆速で成長した話 - Qiita

    ある程度経験を積んだレビュワーがやりがちな失敗は、 指摘しやすいコーディング規約違反だけ指摘している というもの。 コードレビューで指摘するべき欠陥とは、必ずしも規約違反だけではなく、 仕様考慮もれや機能的なバグ、非機能的なセキュリティやパフォーマンス上の問題点も含まれる。 一つ関数に対して複数の視点でソースチェックをしないといけないが、 人間は同時に複数のことは考えられない。 そこでどうすればいいかと情報をあさっていたところ、 われらがIPAがセキュアプログラミング講座というWEBページで、 四回に分けてレビューすることを提唱していた。 1回目はどこに何があるか、 2回目は可読性が確保されているか、規約にのっとっているか 3回目は機能性 4回目はセキュリティ といった具合である。 IPAの講座では4回目はセキュリティに限定しているが、 担当していたプロダクトは、非機能面はセキュリティはも

    メンバーに恨まれそうな3つのコードレビュー施策を徹底したら、逆にメンバーが爆速で成長した話 - Qiita
    showyou
    showyou 2020/02/26
  • 【動画付き】 draw.io 使い方まとめ 〜エンジニアでなくても使えるTips集〜 - Qiita

    draw.io はブラウザを使用してフローチャート、プロセス図、組織図、UML 図、ER モデル、ネットワーク図などを作成できる優れたツールです。作成した図は xml ファイルとして保存でき、GitHub との連携もシームレスに行われます。3 年ほど愛用しているツールですが、隠された使い方がたくさんあります。すぐに忘れてしまうので取りまとめておきます。 「こんな使い方あるよ!オススメだよ!!」という方はぜひ編集リクエストをいただければ追記していく予定です 😊 ※ 主に参照している文献は以下、公式ブログは非常に分かりやすいのでオススメです。 ツイッター公式アカウント 公式ブログ ショートカット ショートカット集です。机の上に置いて覚えましょう。 Line / 線 まずは最も頻繁に使う Line(線)の使い方からご紹介します。 矢印をまっすぐに揃える ちまちまと矢印の線をドラッグして微調整し

    【動画付き】 draw.io 使い方まとめ 〜エンジニアでなくても使えるTips集〜 - Qiita
    showyou
    showyou 2020/02/26
    超絶有用だった