2022年6月6日のブックマーク (2件)

  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

  • NDL Ngram Viewerを使って「私小説」概念の歴史を大づかみしてみた - 日比嘉高研究室

    [目次] 1.文芸用語「私小説」の使用頻度を調べる 2.複数の検索語彙を重ねて表示させる 3.「私小説/心境小説/小説」 4.「私小説/純文学/通俗小説」「通俗小説/大衆小説」 5.「探偵小説/歴史小説/家庭小説/私小説」 6.冷静になってちょっとデータを補正する 7.まとめ〈点と線の文学史〉から〈量の文学史〉へ 言及した文献(年代順) 国会図書館NDL Lab.で、NDL Ngram Viewerというサービスの公開が始まったので、ちょっと使ってみた感想を書く。 が、ちょっとのつもりで書いていたらものすごく長くなってしまった。結論だけ知りたい人は目次から「まとめ 〈点と線の文学史〉から〈量の文学史〉へ」へどうぞ。 lab.ndl.go.jp どんなサービスなのかということは、NDL Lab.のページに簡潔に書いてあるので、そちらをご覧いただくとよいのだけれど、要するに、国会図書館

    NDL Ngram Viewerを使って「私小説」概念の歴史を大づかみしてみた - 日比嘉高研究室
    barringtonia
    barringtonia 2022/06/06
    面白いけれど、対象文献の数自体が年代ごとに大きく異なるので、一部の議論は、「出版年代ごとの総対象Ngram数」で割った比率で見ないといけないのでは?検索結果の左上のトグルスイッチで切り替えられる。