並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 11 件 / 11件

新着順 人気順

Ngramの検索結果1 - 11 件 / 11件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

Ngramに関するエントリは11件あります。 search英語service などが関連タグです。 人気エントリには 『NDL Ngram Viewer | NDLラボ』などがあります。
  • NDL Ngram Viewer | NDLラボ

    サービスURL https://lab.ndl.go.jp/ngramviewer/ 概要 OCRによって作成されたテキストデータから、出版年代ごとの単語及びフレーズ(以下「キーワード」といいます。)の出現頻度を可視化・列挙することができるサービスです。 可視化グラフの縦軸は、年代ごとにキーワードが何回出現したかを表す出現頻度と、出現頻度を出版年代ごとの総ngram数で割った値を表す出現比率の2種類を切り替えることができます。 2023年1月現在の対象は、国立国会図書館デジタルコレクションで提供されているデジタル化済み資料のうち、図書約97万点及び雑誌約132万点のOCRテキストデータから集計した、約17億種類のキーワードです。 具体的な内訳は次の通りです 図書及び雑誌約230万点(約17億種類のキーワード) 図書約97万点(約8.5億種類のキーワード) 雑誌約132万点(約8.9億種類の

    • NDL Ngram Viewerを使って「私小説」概念の歴史を大づかみしてみた - 日比嘉高研究室

      [目次] 1.文芸用語「私小説」の使用頻度を調べる 2.複数の検索語彙を重ねて表示させる 3.「私小説/心境小説/本格小説」 4.「私小説/純文学/通俗小説」「通俗小説/大衆小説」 5.「探偵小説/歴史小説/家庭小説/私小説」 6.冷静になってちょっとデータを補正する 7.まとめ〈点と線の文学史〉から〈量の文学史〉へ 言及した文献(年代順) 国会図書館のNDL Lab.で、NDL Ngram Viewerというサービスの公開が始まったので、ちょっと使ってみた感想を書く。 が、ちょっとのつもりで書いていたらものすごく長くなってしまった。結論だけ知りたい人は目次から「まとめ 〈点と線の文学史〉から〈量の文学史〉へ」へどうぞ。 lab.ndl.go.jp どんなサービスなのかということは、NDL Lab.のページに簡潔に書いてあるので、そちらをご覧いただくとよいのだけれど、要するに、国会図書館の

        NDL Ngram Viewerを使って「私小説」概念の歴史を大づかみしてみた - 日比嘉高研究室
      • NDL Ngram Viewer

        • E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス

          NDL Ngram Viewerの公開:全文テキストデータ可視化サービス 電子情報部電子情報企画課次世代システム開発研究室・青池亨(あおいけとおる) 国立国会図書館(NDL)は,次世代の図書館システムの開発に役立てるための調査研究を行っており,最近では特に,デジタル化資料の新たな利活用を想定した実験サービスを構築・提供している。 2021年度,NDLはデジタル化資料の光学文字認識(OCR)テキスト化事業に取り組み,国立国会図書館デジタルコレクション(デジコレ)に収録されているほぼ全てのデジタル化資料247万点(2億2,300万画像)のOCRテキストデータを作成した。このOCRテキストデータを活用したサービスとして,2022年5月31日にNDLラボのウェブサイトから実験サービス“NDL Ngram Viewer”を公開した。2022年8月現在,著作権保護期間の満了した図書資料約28万点のテキ

            E2533 – NDL Ngram Viewerの公開:全文テキストデータ可視化サービス
          • NDL Ngram viewerの正規表現検索が面白い - digitalnagasakiのブログ

            正規表現検索といえば、テキスト検索に凝ってる人なら知っているけど、そうでもない人は「何それ?」という感じだと思います。 人文系とか質的研究で電子テキストも扱うことがある社会科学系の人は、絶対に知っていた方がよい技術です、が、そう言われても、「何ができるか」わからないとやる気は全然出てこないと思います。ここで 良いあんばいのツールとして登場したのがNDL Ngram viewerの正規表現検索機能です。 lab.ndl.go.jp 正規表現の「.」を試してみる たとえば、「..新聞」で検索すると、「○○新聞」という検索をしてくれます。 そうすると、以下のように、○○新聞で、数十万冊の明治大正期の資料をざくっと数えてきてくれて、 さらに、新聞ごとにカウントしてグラフにしてくれます。 「正規表現」での検索というのは、「○○新聞」で検索してくれるところまでで、 そのあと分類してカウントしてくれるの

              NDL Ngram viewerの正規表現検索が面白い - digitalnagasakiのブログ
            • NDL Ngram Viewerで近代語の経時的変化を眺めて遊ぼう - kzhr's diary

              この記事は「言語学な人々Advent Calender 2023」の18日目の記事です。 adventar.org はじめに 国立国会図書館(以下NDL)では、大規模デジタル化予算を用いて所蔵資料のデジタル化を格段に進めましたが、そのOCRテキスト化も近年おおはばに進んでいます。その具体的な内容は公式記事をご覧いただければと思いますが、とにもかくにも言語資源が格段に増えたわけで、思いつくままに使ってみようというのが今回の内容です。なお、この内容はNDLのウェビナーでお話しした内容といちぶ重なるところもありますが、もうすこし言語学(技術)向けです。 OCRテキストは、公式記事からダウンロードの方法なども示されていますが、手っ取り早くは、国立国会図書館デジタルコレクション(以下NDC)で検索することができます。それだけではなく、n-gramという考え方を用いてテキストデータを単語単位で細分化し

                NDL Ngram Viewerで近代語の経時的変化を眺めて遊ぼう - kzhr's diary
              • 第24回図書館総合展 国立国会図書館主催フォーラム「#NDL全文使ってみた~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」 | NDLラボ

                ホーム > イベント(参加する) > 第24回図書館総合展 国立国会図書館主催フォーラム「#NDL全文使ってみた~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」 目次 イベント概要 開催概要 イベントのアーカイブ ハッシュタグ お問い合わせ先 イベントは終了しました。動画・概要はイベントのアーカイブご覧ください。 イベント概要 フォーラム「#NDL全文使ってみた ~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」をオンラインで開催します。 当館は、令和3年度OCRテキスト化事業において、247万点(2億2300万画像)のデジタル化資料の全文テキストデータを作成しました。そのうち著作権保護期間の満了した図書約28万件は、実験サービス「次世代デジタルライブラリー」及び「NDL Ngram Viewer」で利用可能となっています。 当フォーラムでは、

                • haruyosh🌤️ on Twitter: "前置詞わからん民、みんなGoogle Books Ngram Viewerで幸せになりましょう https://t.co/oIQghBx38J https://t.co/Q3U13z6f3e"

                  前置詞わからん民、みんなGoogle Books Ngram Viewerで幸せになりましょう https://t.co/oIQghBx38J https://t.co/Q3U13z6f3e

                    haruyosh🌤️ on Twitter: "前置詞わからん民、みんなGoogle Books Ngram Viewerで幸せになりましょう https://t.co/oIQghBx38J https://t.co/Q3U13z6f3e"
                  • 【完全ガイド】英語学習者のためのGoogle Ngram Viewerの使い方・活用術

                    Google Ngram Viewer とは Google Nragm Viewer では、Google Books (出版物)のテキストコーパスを検索し、検索語の時系列の折れ線グラフを見ることができます。 検索結果は以下の画像のように表示されます。

                      【完全ガイド】英語学習者のためのGoogle Ngram Viewerの使い方・活用術
                    • NDL Ngram Viewerのソースコードとngramのデータセットを公開しました | NDLラボ

                      2022年12月09日 2022年5月にNDLラボの実験サービスとして公開したNDL Ngram Viewer のソースコードとデータセットを公開しました。 これらを組み合わせることで自由にngram viewerを構築することができます。 (1) ソースコード NDL Ngram Viewerのソースコード(Version 1,2022年12月時点)です。利用条件はCC BY 4.0ライセンスです。 URL: https://github.com/ndl-lab/ndlngramviewer_v1 (2) データセット 令和3年度に実施したデジタル化資料のOCRテキスト化事業で作成したOCRテキストデータのうち、著作権保護期間が満了した図書資料約28万点について、 キーワードの頻度統計情報をまとめたデータセットです。利用条件はPDM(パブリックドメインマーク)です。 URL: https

                      • 形態素解析・Ngramとbag-of-words - Qiita

                        引き続き、機械学習やその他色々について得た知識を 復習and記事作成の練習and個人の備忘録としてまとめていきますよん! 今回も前回と同様、自然言語処理の分野です! タイトルの内容について、ざっくりといろいろ書いていきます! ⚠︎※※注意※※⚠︎ ・出来るだけ専門知識のあまりない人に対して、分かりやすく書くことを目標にしています。 そのため、厳密に言うと間違っている部分があると思いますがご容赦ください。 ・また、ネットで調べたレベルの知識がほとんどなので、 "厳密に言うと"レベルではなく間違っている箇所があるかもしれません。。 その場合は非常に申し訳ないです。指摘していただけると幸いです! 参考 自然言語処理の仕組みと手順 日本語形態素解析の裏側を覗く!MeCabはどのように形態素解析しているか 前回までの記事 ・機械学習について ・教師あり学習 〜回帰〜 ・教師あり学習 〜分類〜 ・Ra

                          形態素解析・Ngramとbag-of-words - Qiita
                        1

                        新着記事