The General Language Understanding Evaluation (GLUE) benchmark is a collection of resources for training, evaluating, and analyzing natural language understanding systems.
こんにちは。 カスタマーサクセス部リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。 今回の記事では、国立国語研究所様との共同研究で作成した日本語話し言葉BERTとその利用方法について紹介します。 概要 BERTの簡単な説明 話し言葉BERT作成方法 書き言葉BERTの文法を表現する部分のみをCSJで追加学習 書き言葉BERTに対して、話し言葉データを用いた分野適応 実験 文法を表現する部分のみを追加学習することの有効性の確認 話し言葉データを用いた分野適応を行うことの有効性の確認 日本語話し言葉BERTの公開 ご利用方法 まとめ 概要 近年、自然言語処理の分野ではBERT(Bidirectional Encoder Representations from Transformers)と呼ばれるモ
*As of August, 2021 code is no longer maintained. It is preserved here in archival form for people who wish to continue to use it. 🎉 1T or bust my dudes 🎉 An implementation of model & data parallel GPT3-like models using the mesh-tensorflow library. If you're just here to play with our pre-trained models, we strongly recommend you try out the HuggingFace Transformer integration. Training and inf
About A natural language parser is a program that works out the grammatical structure of sentences, for instance, which groups of words go together (as "phrases") and which words are the subject or object of a verb. Probabilistic parsers use knowledge of language gained from hand-parsed sentences to try to produce the most likely analysis of new sentences. These statistical parsers still make some
We’ve trained a large-scale unsupervised language model which generates coherent paragraphs of text, achieves state-of-the-art performance on many language modeling benchmarks, and performs rudimentary reading comprehension, machine translation, question answering, and summarization—all without task-specific training. Our model, called GPT-2 (a successor to GPT), was trained simply to predict the
ISO 639-1コード一覧(ISO 639-1コードいちらん)は、ISO 639-1に登録されている言語の完全な一覧である。同時に、それらの言語のISO 639-2、ISO 639-3、ISO 639-6(英語版)コードも掲載している。 なお、ISO 639-2はTコードとBコードに分かれている。多くの言語でこの2つは同じだが、同じでないものについては、Bコードを「(※)」の記号を付して表す。 語族 言語 原語名 639-1 639-2/T 639-2/B 639-3 639-6 備考
fi’i do .ui ― ようこそ(^o^) ニューゲーム暫定完成しました! 誤植や細かな修正を除けば完成しています! 進化したはじロジをよろしくお願いします! ようこそ!「はじめてのロジバン」は、ロジバン入門講座です! ロジバンは人工言語の中でも、専門の文法用語の多さや、独特な文法構造のせいで難しいと思われがちです。 しかし、ロジバンは従来の自然言語の「贅肉」を取り払った、非常にシンプルな言語だと言えます! このサイトでは、こしょん(kocon),そら(soran),セヴァン(sevan)といった女の子たちの会話をききながら、 楽しくロジバン文法の基礎を学ぶことができます。 ただいま誤植・凡ミス鋭意訂正中です。 読んでいく中で、少しでも分かりにくい箇所・ちょっとした質問があれば、はじめてのロジバン第二版 誤植・修正案・要望・文句 集積所 に書いてくだされば対応します。今後の方針として、
地域の違いでも表記の仕方でもありません。音声現象です。 この現象を、言語学では、母音調和といいます。単語の語幹の母音と語尾の母音が呼応する現象です。 奈良時代に日本語に母音調和があったのは知られていますが、現代大阪方言に母音調和がある事実は、国語学者でも知らない人が多いのです。 大阪方言では、 「できる」の否定形は、「できひん」「でけへん」のとちらも正しいです。(京都では、正しい形は「できへん」「できやへん」となって母音調和しません。最近は大阪の形も進出してはいますが) しかし、このように両形可能なのは「できる」だけで、その他の上一段動詞は、「ひん」になるのが普通です。たとえば、 「おちる」「おちひん」。(「おてへん、おちぇへん」は×) 「きる(着る)」「きいひん」。(「けえへん」は「来ない」の意味)。 「おりる」「おりひん」。(「おれへん」は「いない」「折れない」の意味)。 「あびる」「
4. コミュニケーションの言語哲学(II)――「関連性理論」―― フランス生まれのダン・スペルベル(Dan SPERBER 1942-)は、パリ大、次いでオックスフォードで文化人類学を学んだ人類学者で、ディアドリ・ウィルソン(Deirdre WILSON 1941-)は、オックスフォードで哲学を、MIT(マサチューセッツ工科大学)で言語学を学び、現在はロンドン大学で教える言語学者です。彼らは、コミュニケーションにとって重要なのはグライスの「関連の原則」(maxim of relevance)であると考え、そこから「関連性理論」(Relevance Theory)(21)を作り上げました。 1986年に初版が刊行されるや、たちまち話題を呼ぶに到った二人のコラボレーション『関連性理論』で提案された考えは、チョムスキーの統辞論のように、賛否両論の嵐を巻き起こしつつ現在も発展を続けており、著者たち
候文(そうろうぶん)は、日本の中世から近代、昭和前期にかけて用いられた、日本語の文語体の一型式である。文末に丁寧の補助動詞「候」(そうろう、そろ、歴史的仮名遣いではサウラフ)を置く。 歴史[編集] 「候」(古くはサモラフ、サブラフなど)は、元来、貴人の傍に仕える意の動詞であったが(「さむらい」もこれに由来)、平安時代に「居り」の謙譲語、さらに丁寧を表す助動詞に転じた。平安末期には現代語の「ですます体」のように口語で盛んに用いられたらしい(『平家物語』の語りの部分に多くの用例がある)。 鎌倉時代には文章としても書簡などに用いられ、文語文体として確立した。室町時代には謡曲(能)の語りの文体としても用いられた。この頃には、口語としては廃れたとされる(ただし「です」は「にて御座在り参らす」に由来するとされる)。 対照的に、文語としてはさらに普及し、江戸時代には、公文書・実用文などのほとんどをこの文
このページでは、助詞「は」の話をしましょう。「は」は、日本語の文の述べ方(特に、情報の提示の仕方)に深く関係する、日本語に最も特徴的な助詞だといってよいものです。ついでに、「は」と、よく似ているとされる「が」との違いについても、簡単に触れます。 1. case markerとは;「は」はcase markerではない 「日本語って、どんな言葉?」のページで、次のように述べました(以下十数行は、そのページの最初の部分の要約です)。 (a)田中さんはお茶を飲みました。(Tanaka drank tea.) (b)田中さんは佐藤さんときっさてんでお茶を飲みました。(Tanaka drank tea at a coffeeshop with Sato.) (a)(b)の「お茶を」の「を」は「目的語のしるし」object markerで、「お茶」が目的語であることを示します。(b)の「佐藤さんと」の
Macの「辞書.app」にデフォルトで入っていない辞書を追加する方法 by amya · 5月 1, 2017 mac OS Xの「辞書.app (Dictionary.app)」はとても便利です。OSのバージョンによって使用方法や初期に用意されている辞書の種類などがじゃっかん異なりますが、control+spaceバーで入力した文字を辞書検索したり、選択中の文字列を右クリックで辞書検索し内容を表示できます。 この図だと3つの辞書で該当したようですが、詳しく見たい辞書の結果をクリックすればさらに詳細を確認できます。 ちなみにControl + Command + Dでもポップアップします。 表示する辞書は「環境設定」で選択することでより使いやすい環境にできます。 で、ここまでは基本的なお話ですが、この辞書はオンラインなどで対応フォーマットの辞書を手に入れることで追加可能です。日本語の記事が
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く