2023年1月10日のブックマーク (2件)

  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

    kimisteva
    kimisteva 2023/01/10
    #NDLNgramViewer の使い方が記載されているサイト。2023年1月時点で登録されている資料は、「図書及び雑誌約230万点」「図書約97万点」「雑誌約132万点」「著作権保護期間満了の図書約28万点」これは
  • NDL Ngram Viewer

    kimisteva
    kimisteva 2023/01/10
    #NDLNgramViewer の対象範囲に、著作権保護期間内の図書資料約69万点及び雑誌資料約132万点が追加され、計230万点になったというニュース。ついに日本語版NgramViewerとして使えそうなレベルになったと言えるのでは…!?