タグ

資料とjapaneseに関するItisangoのブックマーク (2)

  • 官制大観_律令官制下の官職に関するリファレンス

    当サイトについて 当サイト「官制大観」は、わたしを含む一般の人々を対象に、人文系独習のための、律令官制度に関する導入的なリファレンスとして、(当初、公開を予定していなかった、来、公開できたもんじゃない)自習ノートをもとに作成しています。個人のエンターテイメントとしてではなく、講座や論文を趣旨とするものでもなく、ノートは眠らせておくよりも、と、自身の勉強を兼ねて公開しているものです。広義な「律令制度下の官制」がメインで、他の官制に手を付ける予定はありません(若干載せてはいますけど)。 記述に際して(以下敬称略)、わたしの自習ノートの出発点となった講談社学術文庫「新訂 官職要解」和田英松著・所功校訂、及び、養老律令の現代語訳の底とした岩波書店「日思想体系 律令」井上光貞・関晃・土田直鎮・青木和夫校注をはじめ、文に反映していないものも含めて、多くの研究者の業績を参考にさせていただいていま

  • グーグルが日本語N-gramデータを公開 ― @IT

    2007/11/01 グーグルは11月1日、大規模日語コーパスのN-gramデータを公開した。N-gramは自然言語処理の領域で、単語同士の結びつきを統計的に処理する計算モデル。「グーグルで検索」「グーグルで調べる」「グーグルで探す」のように特定の単語(例では“グーグル”)と、他の単語の結びつきを予測できる。 N-gramは特定の位置にある単語が何であるかを、その直前の単語、さらに前の単語……、とN個分さかのぼって推測できるという仮説に基づいている。かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに使われている。 公開したのはグーグルがWebサイトから抽出した約200億文(約2550億単語)の日語データから作成したN-gramデータ(1~7gram)。データは特定非営利活動法人 言語資源協会を通じて配布しており、団体・個人の区別なく利用できる。これまで米グーグル英語について同

  • 1