2021年2月25日のブックマーク (5件)

  • 「Google Colaboratory(GPU)上でBERTのチュートリアルを行う」の2021年2月24日時点での修正点 - Qiita

    Google Colaboratory(GPU)上でBERTのチュートリアルを行う」の2021年2月24日時点での修正点Python自然言語処理DeepLearningGoogleColaboratorybert 記事の目的 @Yuu94 様の「Google Colaboratory(GPU)上でBERTのチュートリアルを行う」に従って BERT のチュートリアルをやってみました。内容自体はわかりやすく BERT の動作を簡単に学べるのですが、執筆時点から Google Colaboratory かそこで使われている Python のバージョンかが変わったことが原因と思われるエラーが一部で発生していました。そこで、こちらで2021年2月24日に実行した際に詰まった部分とその対処方法を共有させていただきます。 (家記事様への編集リクエストという方法も考えましたが、編集リクエスト内容が

    「Google Colaboratory(GPU)上でBERTのチュートリアルを行う」の2021年2月24日時点での修正点 - Qiita
    gengohouse
    gengohouse 2021/02/25
    “「Google Colaboratory(GPU)上でBERTのチュートリアルを行う」の2021年2月24日時点での修正点”
  • 【初心者向け】自然言語処理界隈を盛り上げるアルゴリズム・モデルまとめ - Qiita

    はじめに 最近の自然言語処理界の発展スピードがあまりにも早い。 Deep Learningの汎用化に伴い、自然言語処理界にもAIの波が押し寄せている。 直近で最も世間を騒がせたのはおそらくBERTという研究だと思われる。 ・【図解】BERTとは?Googleの新自然言語処理がどう影響するのか ・Googleの検索エンジンに「過去5年で最大の飛躍」。新たな言語処理モデル「BERT」の秘密 論文発表でもBERTを使ってこんなことができました、あんなことをやってみましたという内容が多いように思う。 しかし、すでにBERTを超える研究結果が報告されているのも事実で、BERTに負けるなと、世界中で盛んに研究が進んでいるようだ。 数多くの技術がでてきているが、一覧として紹介されている記事はあまり見られなかったので、ここに残す。 BERT[2018年10月発表] 2018年にブレイクスルーをおこした最も

    【初心者向け】自然言語処理界隈を盛り上げるアルゴリズム・モデルまとめ - Qiita
  • 自然言語処理のサンプルデータセットを簡単に取り扱えるライブラリdatasetsの紹介 - Qiita

    datasetsで公開されているデータセットはdatasets.list_datasets()で確認できます。 記事の投稿現在(2021年2月24日)では680件のデータセットが公開されているようです。 import datasets # 公開されているデータセット一覧 print(datasets.list_datasets()[:10]) # 最初の10件だけ表示 print(len(datasets.list_datasets())) # 全件数も確認 # ['acronym_identification', 'ade_corpus_v2', 'adversarial_qa', 'aeslc', 'afrikaans_ner_corpus', 'ag_news', 'ai2_arc', 'air_dialogue', 'ajgt_twitter_ar', 'allegro_revi

    自然言語処理のサンプルデータセットを簡単に取り扱えるライブラリdatasetsの紹介 - Qiita
  • 【自然言語処理】TF-IDFの概要とPythonでの実装方法について - 聖刻の里

    どうもLibraです。 今回は自言語処理(Natural Language Processing: NLP)でよく使われるTF-IDFと呼ばれる技術について解説していきます。Bag of Wordsと同じく文書を分析して特徴ベクトルに変換する特徴抽出手法の一つですが、ここではTF-IDFの概要とPythonによる実装方法についてみていきます。Bag of Wordsや特徴ベクトルについては過去の記事でまとめていますので、興味のある方は合わせてご覧になってみてください(´∀`*) scarlet09libra.hatenablog.com 【目次】 実行環境 TF-IDFとは TF-IDFの意味 TF(Term Frequency:単語の出現頻度) IDF(Inverse Document Frequency:DFの逆数) TF-IDFの計算方法 TF(Term Frequency:単語の出

    【自然言語処理】TF-IDFの概要とPythonでの実装方法について - 聖刻の里
  • マルコフ連鎖ライブラリ markovify  - Pythonの利用と情報

    マルコフ連鎖ライブラリを使って文章を学習して自動生成します。 環境はWinsows10、Anacondaです。 github.com マルコフ連鎖とは Wikipediaによると、 マルコフ連鎖(マルコフれんさ、英: Markov chain)とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なもの(離散状態マルコフ過程)をいう。 マルコフ連鎖を用いて文生成を行う例を示します。 {明日は, 雨, です, 。}という状態の集合があったとする。 「明日は」という状態の次に「です」という状態がくる確率はP(です | 明日は)で表される。 P(明日は | 明日は)、P(雨 | 明日は)、P(です | 明日は)、P(。 | 明日は)の4つのうち、最も高い確率をもつのはP(雨 | 明日は)であるはずである。 確率的に「雨」へと状態が遷移すると、「明日は 雨」という文が

    マルコフ連鎖ライブラリ markovify  - Pythonの利用と情報
    gengohouse
    gengohouse 2021/02/25
    マルコフ連鎖ライブラリを使って文章を学習して自動生成します。 環境はWinsows10、Anacondaです。