ホーム 日本語歴史コーパス(CHJ) 概要 概要 INTRODUCTION to CHJ 『日本語歴史コーパス』は、デジタル時代における日本語史研究の基礎資料として開発を進めているコーパスです。全てのテキストに読み・品詞などの形態論情報が付与されているため、従来の紙の総索引の代わりになるだけでなく、より高度な検索や集計が行えます。 公開中の内容については、以下の各ページをご覧ください。 『日本語歴史コーパス』の構築は、以下のプロジェクトの成果の一部です。 国立国語研究所共同研究プロジェクト「通時コーパスの設計」 国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」 JSPS科研費 JP15H01883「日本語歴史コーパスの多層的拡張による精密化とその活用」 形態論情報 『日本語歴史コーパス』は、通時的な分析を可能とするため、『現代日本語書き言葉均衡コーパス』をはじ
音声コーパスリスト →音声コーパスを用いた研究成果一覧 (※DSC Reference Portal のサイトに飛びます) 無償コーパス ※当面は配布手数料(郵送料等)も無料とします 重点領域研究「音声言語」・試験研究「音声DB」 連続音声データベース (PASL-DSR) 筑波大 多言語音声コーパス (UT-ML) 東北大‐松下 単語音声データベース (TMW) 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD) RWCP 音声データベース 音声対話データベース - 96年版 (RWCP-SP96) 音声対話データベース - 97年版 (RWCP-SP97) 検索・要約用ニュース音声データベース (RWCP-SP99) 会議音声データベース (RWCP-SP01) RWCP 実環境音声・音響データベース (RWCP-SSD) 重点領域研究「音声対話」 対話音声コーパス
英語コーパス学会東支部 What's New 英語コーパス学会東支部 研究会 コーパスの言語学諸分野における活用(2) 歴史言語学 日時: 2017年3月11日(土) 14:00~17:00 場所: 東京成徳大学 東京キャンパス(東京都北区十条) アクセス 参加費: 無料 司会・講師 塚本 聡 (日本大学) 講師 西村 秀夫(三重大学) 神谷 昌明(豊田高専) 発表概要 (PDF以下と同一) 英語史コーパスとしてはHelsinki Corpusがよく知られている。その拡大版としてのPenn-Helsinki Parsed Corporaが利用されている。一方、最近の研究では史的コーパスとしてCorpus of Historical American Corpus(COHA)が頻繁に利用されている。Early English Books Online (EEBO)として史的テキスト電
<iframe name="ngram_chart" src="" width=900 height=500 marginwidth=0 marginheight=0 hspace=0 vspace=0 frameborder=0 scrolling=no></iframe> Part-of-speech tags cook_VERB, _DET_ President Wildcards King of *, best *_NOUN Inflections shook_INF drive_VERB_INF Arithmetic compositions (color /(color + colour)) Corpus selection I want:eng_2019
通巻432号(第33巻14号)⇒電子版を購入する ◆特集 日本語史研究と歴史コーパス 第1章 歴史コーパスの広がり 歴史コーパスとは何か(近藤泰弘) デジタル技術を活用した人文学研究の現在(永崎研宣) 前近代日本史史料をベースとしたテキストデータベースの特徴と課題(山田太造) オックスフォード上代日本語コーパス(ビャーケ フレレスビッグ) 第2章 日本語の歴史コーパス 『日本語歴史コーパス』の構築(田中牧郎) 『日本語歴史コーパス』の設計を支えるマークアップとはなにか─基礎データはどのようにして作られるのか─(河瀬彰宏) 歴史コーパスにおける形態素解析と辞書整備(小木曽智信) 近世口語資料のコーパス化─狂言・洒落本のコーパス化の過程と課題─(市村太郎) 近代雑誌のコーパス化における課題とその対処法─『国民之友コーパス』にみる最新事情─(近藤明日子) 第3章 コーパスによる日本語史研究 【文
<「耳ざわりな音楽だ。」という使い方がある一方で,「耳ざわりの良い言葉ばかりで信用ならない。」といった表現を目にすることもあります。「耳ざわり」とは,どのように使うべき言葉なのでしょうか。> 問1 「耳ざわり」とは,本来どのような意味なのでしょうか。 答 「聞いていて気にさわること」という意味で使われるのが一般的ですが,「聞いたときの感じのこと」という意味で用いられることもあります。 「耳ざわり」を辞書で調べてみましょう。 「広辞苑 第6版」(平成20年・岩波書店) みみざわり【耳障り】 聞いていていやな感じがすること。聞いて気にさわること。▽「―がよい」というのは誤用。 「明鏡国語辞典 第2版」(平成24年・大修館書店) みみざわり【耳障り】 〔名・形動〕聞いていて不快に感じること。▽「耳触り」と解し「耳触りがよい」のように使うのは,本来は誤り。「目障り」についても同様。 このように「耳
楽天グループ株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。 2022/03/10 更新 データ概要 以下のデータが含まれています。 楽天市場:全商品データ (約2億8300万商品),商品レビューデータ (約7000万レビュー),ショップレビューデータ (約2250万レビュー) 楽天トラベル:施設データ (約2.9万施設),レビューデータ (約656万レビュー) 楽天GORA:ゴルフの施設データ (1,669施設),レビューデータ (約32万レビュー) 楽天レシピ:レシピ情報 (約80万レシピ),レシピ画像 (約80万画像),Pickupレシピ (1,854レシピ),デイリシャスニュース (362件) アノテーション付きデータ 筑波大学文単位評価極性タグ付きコーパス(TSUKUBAコーパス):筑波大学よりご提供いただいた,楽天トラベルのレビューデータに対して,文単位
OUR MESSAGE We would like to introduce the mission and research directions of RIT to convey our excitement. Mission & Vision Missions of RIT is fully aligned with Rakuten's mission to empower Rakuten membership. Vision of RIT is "automation, better than human." Very impressive aspect of AI in the recent years is the demonstration of power of AI that can be better than human in tasks such as langua
母集団と標本の違いを知ること 標本抽出の方法、特に無作為抽出法について知ること 乱数を使って、無作為抽出をできるようにすること 無作為抽出や層別の利点・問題点を把握すること 異なり語数と延べ語数の違いを理解すること 何をもって同語とみなすかについて、様々な基準を設定できること ある語を原形に戻す方法にどのようなものがあるかを知ること コーパスという形で言語データを扱うとき、最も基本的な手段となるのが語の頻度の数え上げです。数え上げるというと、単純なことのように聞こえるかもしれません。しかし、それでも、どんな方法でデータを抽出するのか、どういう基準で数え上げるのか、ということを考える必要があります。ここでは、特に標本の抽出方法と、何をもって語と認定するかという問題について考えていきたいと思います。 標本抽出 コーパスというのは、言語のごく一部を取り出してきたものに過ぎません。取り出す方法が違
メインコンテンツに移動 検索 すべて 本文あり 詳細検索 タイトル 内容記述 著者名 著者所属 著者ID 出版者 刊行物名 日付 巻 号 開始ページ 終了ページ DOI 各種ID 資源タイプ 出版タイプ 助成機関名 プログラム情報 機関 学位授与機関 学位授与番号 検索 並び替え
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く