並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 151件

新着順 人気順

くずし字認識の検索結果1 - 40 件 / 151件

  • 源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

      源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai
    • そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス

      ライブラリのアプリ化 現代のニュースをくずし字で読んでみませんか?内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュース その他の事例については、活用事例を参照してください。 構成 古活字とくずし字 そあん(soan)で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字(草書体)も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。 そあん(soan)は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ

        そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス
      • ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ

        今回は「異体字」についてお話しします。すこし専門的な部分もあるので、適宜不要な部分は読み飛ばすことをお勧めします。 こんな問題から始めてみましょう。世田谷区の区章とその説明文は以下のように書かれています。 外輪の円は区内の平和、中心は「世」の文字が三方に広がり、人びとの協力と区の発展を意味しています。(世田谷区の紋章、シンボル | 世田谷区ホームページより) 「中心は『世』の文字」とありますが、そうは見えません。なぜこのような形なのでしょうか。 前回の記事 本記事は連載形式で、前回の補足のような内容になっています。前回の記事もご参照ください。 shokaki.hatenablog.jp クリックで目次の表示/非表示 前回の記事 異体字とは 異体字の認識 異体字の使われ方 どこまでが同じ漢字か 誤字か異体字か 異体字はどうできるのか よく使う字は略字化する 画数の多い字は正確でなくても読める

          ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ
        • くずし字認識アプリ『みを』で江戸時代の数学書『塵劫記』を読む

          古書市で、江戸時代の数学書『塵劫記』(じんこうき)を買った。 『塵劫記』は、くずし字で書いてあるので、文章はさっぱり読めない。しかし、最近はくずし字を翻訳してくれる便利なアプリがある。 アプリで文字を翻訳し、数学に詳しい人に見てもらえば、なにが書いてあるのか、だいたいわかるのではないか? 『塵劫記』を古書市で買った 少しまえに、神保町の古書市で、江戸時代の数学書『塵劫記』を購入した。 右の『塵劫記』(文化三年)は500円、左の『新編塵劫記大成』(寛政三年)は1500円だった かつて、江戸時代の日本では和算という独自の数学が発展し、ヨーロッパなど先進的な地域の水準に劣らないほど発達したといわれる。教科書にも出てくる関孝和などはみなさまご存知だろう。 『塵劫記』は、江戸時代初期に、吉田光由が著した和算のテキストで、寺子屋でそろばんや初歩的な数学について学ぶさいに使われた。 江戸時代の数学入門書

            くずし字認識アプリ『みを』で江戸時代の数学書『塵劫記』を読む
          • みんなで翻刻 - MINNA DE HONKOKU

            歴史資料を「みんなで」読み解く 日本国内には江戸時代以前に筆記・出版された、多数の文字資料が残されています。古文書・古記録・古典籍など、これらの資料は内容や形態によってさまざまに分類されますが、いずれも私達の過去を知るための貴重な手がかりです。また、地震や洪水など過去の自然災害を記録した資料は、現在の防災にとっても大きな意味を持ちます。 こうした歴史資料を活用するには、まず文字を現代の活字に直し、データとして扱いやすくする必要があります。この作業を歴史学の用語で「翻刻」と言います。歴史資料の翻刻は、これまで日本史学や国文学分野で訓練を積んだ専門家の役割とされてきました。しかし、現代に伝わる歴史資料の数は膨大であり、少数の専門家の手でその全てをカバーすることはできません。 「みんなで翻刻」は、多数の人々が協力して史料の翻刻に参加することで、歴史資料の解読を一挙に推し進めようというプロジェクト

              みんなで翻刻 - MINNA DE HONKOKU
            • ROIS-DS人文学オープンデータ共同利用センター(CODH)

              ROIS-DS人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)は、情報学・統計学の最新技術を用いて人文学資料(史料)を分析する「データ駆動型人文学」や、人文学研究の成果に基づき構築したデータセットを超学際的に活用する「人文学ビッグデータ」など、オープンサイエンス時代の新しい人文学研究を展開します。[もっと詳しく..][CODHパンフレット..] 重要なお知らせ 2023-11-02 歴史×技術の出会いの場として、第1回ヒストリーテック勉強会を11月22日にオンラインで開催します。参加無料です。 2023-10-18 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~ >> お知らせ一覧 X (Twitter) - Timeline

                ROIS-DS人文学オープンデータ共同利用センター(CODH)
              • 「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics

                日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があります。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが重要な課題となっています。 そこでこの社会課題の解決にAI(人工知能)を活用する方法を探るため、この7月から10月にかけて、世界最大規模の機械学習コンペプラットフォームである「Kaggle(カグル)」で、「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題する全世界的なコンペを開催します。コンペを通して画期的なくずし字認識手法の開発が進むだけでなく、くずし字データセット

                  「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics
                • 古文書を自動翻訳する日も近い!?江戸時代の8万字超の「くずし字 字形データ」が無償公開へ : Japaaan

                  大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)と大学共同利用機関法人 人間文化研究機構 国文学研究資料館(国文研)がすごいデータを無償公開しました! 11月17日に公開されたのは、江戸時代の古典籍に書かれたくずし字の1文字ずつの字形画像データ。その数なんと8万6176件(1,521文字種)になります。 「どういうこと?」と思ってますか?どれほどすごいことか、以下のリリース情報の画像解説を見ればわかります! データは「日本古典籍字形データセット」という名称で、字形画像データのほか、文字が古典籍のどの位置に書かれているかを示す文字座標データと、原本の画像データも含まれています。このデータは二次利用を歓迎するオープンデータとして無償提供中。 例えば、古典籍から抽出された「あ」のほんの一部。「あ」にも色々な癖がある。 例えば、古典籍から抽出された「か」のほんの一部。 収録

                    古文書を自動翻訳する日も近い!?江戸時代の8万字超の「くずし字 字形データ」が無償公開へ : Japaaan
                  • みを(miwo):AIくずし字認識アプリ

                    アプリのインストール Android: Google Play - 「みを」で検索 iOS: App Store - 「みを」で検索 2021年8月30日、Android版とiOS版のアプリを正式公開しました。アプリの利用は無料です。くずし字資料をカメラで写真撮影し、認識ボタンを押すだけで、AIがくずし字を現代文字に変換してくれます。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。 [もっと詳しく..] 「みを」アプリに関する情報をシェアする際には、ハッシュタグ「#miwoapp」をお使いください。 X (Twitter) - #miwoapp 主な機能 ご利用にあたって 「みを」のご利用にあたっては、プライバシーポリシー/利用規約や、注意事項をお読みください。 「みを」のAIくずし字認識は決して完璧ではありません。くずし字認

                      みを(miwo):AIくずし字認識アプリ
                    • 最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you

                      こんにちは。@shunk031 です。 普段は最先端の技術が大好きなパソコンのオタクですが、京都へ旅行して古き良き日本の文化に感化されました。 この記事は 法政大応情 Advent Calendar 2020 21 日目の記事です。 From http://codh.rois.ac.jp/ 今回は日本古典籍の分類タスクについて取り組んでみようと考え、近年の日本古典籍における「くずし字認識」に着目して調査をしました *1。 日本古典籍といった古文書に対して、OCR 等の文字認識技術によって文字情報をデジタル化し、それらの情報をもとに解析を行う流れは現代では自然だと考えています。 しかしながら、一般的に OCR は難しく、また古文書を機械に解析させることはさらなる困難があるのは容易に想像できます。 くずし字認識に対して、近年の取り組みでは ROIS-DS 人文学オープンデータ協働センターが K

                        最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you
                      • 江戸時代の国語辞典には人相占いがある

                        1993年生まれ。京都市伏見区出身、宮崎県在住。天性の分からず屋で分かられず屋。ボードゲームと坂口安吾をこよなく愛している。 > 個人サイト もがき続けて100年生き抜くブログ まずボロすぎて笑う 『宝暦節用字海蔵』(1756年)。じいちゃんから借りてきた。 突然こんな古書を披露されて驚いたが、オークションサイトを覗いてみると状態のいいものが6,000円くらいで落札されていた。金銭的な価値はそう高くないようだ。 表紙を含めた数十ページが欠損しているけれど、250年もの月日を物語っているとかではなく、単に管理が悪くてボロボロになっているだけだと思う。土産物の菓子が入っていた雑な紙袋から取り出されたのを見てしまったのだ。きっと先祖代々そんな調子で守り継いできたのだろう。 思い返せば僕も物を雑に扱うほうである。中学生のころ、友達から借りた本を風呂場で読んでクタクタにして返したらキレられた記憶がふ

                          江戸時代の国語辞典には人相占いがある
                        • チームラボ・猪子寿之さん「AIを労働力の削減などには使わない」 | Ledge.ai

                          「チームラボボーダレス」「チームラボプラネッツ」などのデジタルアートで知られる、チームラボ株式会社 代表取締役の猪子寿之さん 経済産業省と国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)は2月19日、人工知能(AI)技術や新原理のコンピューティング技術などを活用し、イノベーションを創出できる人材の育成を目的とする「AIフロンティアプログラム(第2期)」の育成対象者による成果報告会を開催した。 本成果報告会では、お台場の「森ビルデジタルアートミュージアム:エプソン チームラボボーダレス(チームラボボーダレス)」や、豊洲の「チームラボプラネッツ TOKYO DMM 豊洲(チームラボプラネッツ)」などで有名な、チームラボ株式会社 代表取締役の猪子寿之さんによる講演「チームラボとAI」が実施された。 この記事では、チームラボが手がけるデジタルアートにおけるAI活用はもちろん、猪子さ

                            チームラボ・猪子寿之さん「AIを労働力の削減などには使わない」 | Ledge.ai
                          • 源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 : 痛いニュース(ノ∀`)

                            源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 1 名前:エイブルダー(茸) [CN]:2021/10/11(月) 13:00:59.33 ID:YDhvmomo0 ビデオ会議の背景は『源氏物語絵巻』。気さくで明るい人柄だが、古典のくずし字が読まれない日本の現状には不満をあらわにする。彼女からは古典文学が「好き」という気持ちがあふれ出していた。 タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。 彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、

                              源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 : 痛いニュース(ノ∀`)
                            • tkasasagi 🐻 on Twitter: "本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB"

                              本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB

                                tkasasagi 🐻 on Twitter: "本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB"
                              • AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai

                                SmallTrainサイトのトップ画面 株式会社Geek Guild(ギークギルド)は11月9日、商用AI(人工知能)サービスのための、高精度なAI学習済みモデルの開発に使えるディープラーニング(深層学習)フレームワーク「SmallTrain(スモールトレイン)ver.0.2.0」のソースコードを公開したと発表。オープンソースなので、無償で誰でも利用できる。 SmallTrainは、ライブラリ機能とラッパー機能を兼ね備えたオープンソースフレームワーク。Kerasのように使えるという。多様なデータを学習済みのAIモデルを起点に、転移学習をするだけで、工数をかけずにAIを構築できるとのこと。 SmallTrainを使うと、精度を損なわず、大量のデータを取得する労力もいらず、ディープニューラルネットワークをすぐに開発できるという。MITライセンスに準拠しており、商用利用も可能だ。 需要と供給にあ

                                  AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai
                                • 「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目

                                  by Peter Roan 日本の古典籍や古文書で用いられている「くずし字」を現代日本語の文字に変換する作業を「翻刻」と呼びます。多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。モントリオール大学の博士課程で機械学習の研究を行うアレックス・ラム氏が、くずし字の活字化を取り巻く事情をまとめています。 How Machine Learning Can Help Unlock the World of Ancient Japan https://thegradient.pub/machine-learning-ancient-japan/ 過去の人々が残した膨大な書物や文書は、歴史や文化を考える上で非常に重要な資料となります。しかし、言語や記法は時間と共に変化していくものであり、古い文書

                                    「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目
                                  • AIくずし字認識アプリ「みを(miwo)」を使ってみた

                                    現在使用されている平仮名は1種類のみですが、昔は何種類もの平仮名が存在しました。現在使用されていない平仮名は「変体仮名」と呼ばれており、さまざまな漢字が基となっています。この変体仮名を崩して書いた文字が「くずし字」で、くずし字は歴史的な文献などで多数使用されています。そんなくずし字を手軽に読めるようにするために開発されたのが、人工知能(AI)くずし字認識アプリの「みを(miwo)」です。 みを(miwo) - AIくずし字認識アプリ | ROIS-DS人文学オープンデータ共同利用センター(CODH) http://codh.rois.ac.jp/miwo/ 本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります)https://t.co/00c6b4xJsZ Androidhttps://t.co

                                      AIくずし字認識アプリ「みを(miwo)」を使ってみた
                                    • AIくずし字認識アプリ「みを」開発者が語る開発経緯の取り組む姿勢に感動

                                      tkasasagi 🐻 @tkasasagi PhD Japanese literature 早大文学博士 源氏古注専門 Research Scientist @SakanaAILabs Prev: @GoogleDeepMind Google Brain @rois_codh #miwoapp creator tkasasagi.github.io tkasasagi 🐻 @tkasasagi 私が院生(早大文学)のとき、研究室ではくずし字を読めない人はいませんでした。博士課程の入試もくずし字資料に線が引かれて「この文章の状況を説明しなさい」でした。 2022-07-31 23:09:38

                                        AIくずし字認識アプリ「みを」開発者が語る開発経緯の取り組む姿勢に感動
                                      • KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター

                                        本サービスは無料ですが、利用状況の把握と過度な利用の防止のために、ログインを必須としています。ログインサービスの実装には、Google社のFirebase認証を活用しており、Google、Facebook、Twitterのアカウントと連携するか、電子メールアドレスを入力することで、ログインが可能となります。 「KuroNetくずし認識ビューア」と「ダッシュボード」は、両方とも同じアカウントでログインする必要がありますのでご注意下さい。ログイン機能は、いずれの場合も画面の右上にあります。なお、アカウント連携はログイン機能の実現のみに利用し、取得した情報はそれ以外の目的には活用いたしません。 「KuroNetくずし認識ビューア」に、認識したい本のIIIFマニフェストをドラッグ&ドロップしてください(注意:IIIFの利用)。そして、ページ移動やサムネイル表示などを用いて、認識したい画像を表示して

                                          KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター
                                        • 【書籍メモ】『Software Design 2021年11月号』Kaggleで知る機械学習(技術評論社) - u++の備忘録

                                          Kaggle特集に惹かれ、今月の『Software Design』を購入しました。 gihyo.jp 特集の目次は、以下のとおりです。 第1特集 Kaggleで知る機械学習 前処理から学習モデルの構築,スコアの上げ方までわかる 第1章:Kaggleにエントリーしよう 登録からSubmitまでブラウザ上で完結 第2章:自然言語処理のコンペに挑戦① データの前処理・学習・推論の流れ 第3章:自然言語処理のコンペに挑戦② モデル変更でスコアを底上げする 第4章:くずし字認識のコンペに挑戦① パラメータチューニングの奥深さに触れる 第5章:くずし字認識のコンペに挑戦② さらなるスコアアップのためにKagglerがやっていること まずは、広くソフトウェアエンジニア向けの雑誌にKaggleの特集が掲載されたのが印象的でした。その中で第1章では、Kaggleの概要や機能をスクリーンショットと共に紹介して

                                            【書籍メモ】『Software Design 2021年11月号』Kaggleで知る機械学習(技術評論社) - u++の備忘録
                                          • 「ナイスステップな研究者2022」に精鋭10人、多彩な分野で成果

                                            文部科学省科学技術・学術政策研究所(NISTEP、ナイステップ)は、科学技術イノベーションのさまざまな分野で活躍している研究者10人を「ナイスステップな研究者2022」に選定した。現代の課題に密接に関わる研究など多岐にわたる分野で、社会に成果を広く還元している人物を選んだという。 「ナイスステップな研究者2022」に選ばれた吉田慎哉氏の研究から。試作した「飲む体温計」と動作原理(吉田氏提供) 活躍が期待される若手研究者を中心に、AI(人工知能)技術の人文科学への応用研究、地熱資源の基礎研究や地域との関わり、噴火による津波の発生メカニズムの解明といった分野から選ばれている。 専門家約1700人への調査などにより、最近の活躍が注目される約250人の候補を抽出。研究実績に加え、人文・社会科学との融合などの新興・融合領域を含めた最先端の画期的な研究内容、産学連携・イノベーション、国際的な研究活動の

                                              「ナイスステップな研究者2022」に精鋭10人、多彩な分野で成果
                                            • 日本古典籍くずし字データセット

                                              ライセンス 『日本古典籍くずし字データセット』(国文学研究資料館ほか所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 データセット全体をご利用の際には、例えば以下のような表示をお願いします。個別の古典籍のみをご利用の場合には、それぞれのページをご覧下さい。 『日本古典籍くずし字データセット』(国文研ほか所蔵/CODH加工) doi:10.20676/00000340 可能な場合は、データ提供元であるROIS-DS人文学オープンデータ共同利用センターへのリンクをお願いします。 提供:ROIS-DS人文学オープンデータ共同利用センター データ提供方法・注意事項 書籍ごとに字形をまとめたZIPファイル、および全部をまとめたZIP

                                                日本古典籍くずし字データセット
                                              • 便利すぎるこれ!古文書や浮世絵のくずし字を自動解読してくれる無料の「AIくずし字認識」が素晴らしい! : Japaaan

                                                大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)と大学共同利用機関法人 人間文化研究機構 国文学研究資料館(国文研)がすごいデータを無償公開しました!11月17日に公開… この「日本古典籍くずし字データセット」を活用して、古文書や浮世絵などに書かれたくずし字を自動で解読してくれるサービス「AIくずし字認識」が素晴らしく便利なのです! 「AIくずし字認識」は、古文書や浮世絵などの画像の中からくずし字を一文字指定すると、そのくずし字を解読してくれるのです。しかもこの作業をブラウザ上で即座に行ってくれます。 使い方の流れを紹介しますね。 1、古文書や浮世絵などの画像URLを指定 まず必要なのは、画像配信形式「IIIF (International Image Interoperability Framework)」に対応した画像URLです。Japaaanでよく紹介している

                                                  便利すぎるこれ!古文書や浮世絵のくずし字を自動解読してくれる無料の「AIくずし字認識」が素晴らしい! : Japaaan
                                                • 松尾豊さん「AI研究は米中がトップ」日本は……? | Ledge.ai

                                                  日本ディープラーニング協会(JDLA)は9月18日、「第1回全国高等専門学校ディープラーニングコンテスト2020(DCON2020)」の一環として、東京大学大学院工学系研究科 教授で、同協会の理事長も務める松尾豊さんによる、最優秀賞受賞の東京工業高等専門学校(東京高専)への表敬訪問を実施した。 その際に、松尾豊さんに日本におけるAI(人工知能)教育やAI活用の状況についてどう考えているか、少しだけお話を聞く機会を得た。松尾豊さんは『人工知能は人間を超えるか』(KADOKAWA)などの著書でも知られる、AI研究の第一人者である。 AI研究は「米中の両国がトップ」日本は?まずは「現在の日本のAI研究はアメリカや中国と比較して、どのように位置にあると考えているか?」聞くと、松尾豊さんは学術面について「米中の両国がトップで、その後にイギリス、カナダ、ドイツ、シンガポールなどが続き、日本はまだその下

                                                    松尾豊さん「AI研究は米中がトップ」日本は……? | Ledge.ai
                                                  • くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」

                                                    ロバート キャンベル @rcampbelltokyo 数億点規模という世界でも稀な量の古典籍・古文書を有しながら「くずし字」で書かれているため読める人が殆どいない現代日本。全世界のデータサイエンティストにAIを活用した認識モデルを募り、今日、その結果発表と授賞式が行われます。新時代に古典知の扉をみんなで開こうと #Kaggle #NIJL #NII pic.twitter.com/ba8jSygCrQ 2019-11-11 10:01:34

                                                      くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」
                                                    • くずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)

                                                      くずし字検索 文字またはUnicode(U+????)を入力: 検索結果: 日本古典籍くずし字データセットを文字または文字コードで検索し、ひらがな(変体仮名)・カタカナ・漢字の字形を表示します。2019年11月現在、古典籍44点の画像データ6,151コマから切り取った、くずし字4,328文字種の字形データ1,086,326文字が検索対象です。それぞれの文字の出現頻度については文字種ごとのくずし字一覧、変体仮名についてはUnicode変体仮名一覧をご覧下さい。 サイトの使い方 検索ボックスに文字列を入力します。一文字の場合は、文字コード(Unicode)ごとの字形一覧ページに直接移動します。また複数文字の場合は、文字コードごとのページへのリンクを表示します。 字形一覧ページの個々の文字をクリックすると、くずし字認識ビューア上に原本のデジタル画像を表示するとともに、文字の位置(四角形)を青線で

                                                        くずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)
                                                      • AIで“くずし字”を解読するスマホアプリが無料公開 コンペ1位の認識モデル採用

                                                        人文学オープンデータ共同利用センター(CODH)は8月30日、古文書に書かれた「くずし字」をAIで解読するスマートフォン(iOS/Android)向け無料アプリ「みを」を公開した。元のくずし字と変換後の文字を比較でき、古文書に慣れてない人の理解を手助けするという。 変換したい資料の写真や、ネットからダウンロードした画像などをアプリで読み込むと、くずし字を変換して元の文章の上に表示する。同じ文字を強調表示する機能や変換後の文章をメモ帳などにコピー&ペーストできる機能などを備える。 AIの学習には、国文学研究資料館の日本古典籍くずし字データセットを基に、CODHが開発したくずし字認識モデル「KuroNet」(クロネット)と、機械学習の精度を競い合うプラットフォーム「Kaggle」(カグル)のくずし字認識コンペティションで1位になったtascj氏の認識モデルを活用している。くずし字は江戸時代のデ

                                                          AIで“くずし字”を解読するスマホアプリが無料公開 コンペ1位の認識モデル採用
                                                        • IIIF - digitalnagasakiのブログ

                                                          IIIFに関する日本語情報の私的なまとめ (2019/11/14版) IIIF (International Image Interoperability Framework) に関してこのブログで色々記事を書いてきましたが、それを中心にしつつ、他の方々が書かれたものも含め、日本語の記事に関して情報をまとめてみました。ご参考になりましたら幸いです。 構築の仕方についても、下の方にリンク&解説を用意しておりますので、構築について悩んでいる人はぜひ一度ご覧になってみてください。 なお、英語を読むことに支障がない人は、ぜひ「Awesome IIIF」もご覧ください。 IIIFとは何か 今、まさに広まりつつある国際的なデジタルアーカイブの規格、IIIFのご紹介 「デジタルアーカイブ」における画像共有のための国際規格IIIFについてのご紹介(続) 仏教図像DBで学ぶ「デジタルアーカイブ」の国際規格I

                                                            IIIF - digitalnagasakiのブログ
                                                          • KuroNetくずし字認識サービス(AI OCR)

                                                            ディープラーニング(AI)を用いた多文字のくずし字OCRサービスを提供します。 なお、スマホアプリについては、みを(miwo) - AIくずし字認識アプリをご利用下さい。 KuroNetくずし字認識サービス KuroNetくずし字認識サービス KuroNetくずし字認識サービスは、IIIF (International Image Interoperability Framework)に準拠した画像を対象に、RURIを利用した多文字くずし字OCR機能を提供します。無料サービスですが、ログインが必要です。具体的な利用方法につきましては、リンク先をご覧下さい。 KuroNetくずし字認識ビューア KuroNetくずし字認識ビューア KuroNetくずし字認識ビューアは、KuroNetくずし字認識サービスを利用するための入口となります。ビューアにIIIF (International Image

                                                              KuroNetくずし字認識サービス(AI OCR)
                                                            • 「Kaggle Days Tokyo」参加録 - u++の備忘録

                                                              ※ 「Kaggle Advent Calendar 2019」*1の12日目の記事です。 2019年12月11、12日に開催された「Kaggle Days Tokyo」*2に参加しました。1日目はワークショップとプレゼンテーション、2日目はオフラインコンペティションが開催されました。 資料や動画は恐らく公式から公開されると思うので、本記事では私の聴講した内容を基に、個人的な所感を述べます。なお1日目の内容はGunosyブログの記事*3やWantedlyブログの記事*4、twitterまとめ*5に詳しく記載されています。 1日目 Leveling-up Kaggle Competitions Ben Hamner, Kaggle CTO KaggleのCTOを務めるBenさんから、Kaggleの遍歴や今後の展望についてのお話でした 深層学習の大躍進以前からKaggleを開催している歴史や、強

                                                                「Kaggle Days Tokyo」参加録 - u++の備忘録
                                                              • AIはくずし字が読めるのか?古今集十本による可読率ランキング|燈露

                                                                これは十本の『古今和歌集』仮名序の冒頭をくずし字OCRにかけて、どの程度読めているのかをランキング形式で確認したものです。 近年はAIの技術も進んでいるので、巷では、くずし字を読む時代が終わるとも言われています。聞くところによると、くずし字AIの可読率は95%とのことで、凄そうですよね。 ○2021年度日本近世文学会春季大会シンポジウム「デジタル時代の和本リテラシー 古典文学研究と教育の未来」2021年6月12日(土) https://youtu.be/X03CMIV5SW8 しかし、実際はどうなのでしょうか。95%とはどのぐらい読めているのでしょうか。AIが人間の代わりにくずし字を読んでくれて、古写本の全文検索ができる日を夢見てみたりするわけですが、数字だけだと具体的なことがわかりません。 具体的にどうなのか、検討しているものを見つけられなかったので、実際に自分でやってみようというわけで

                                                                  AIはくずし字が読めるのか?古今集十本による可読率ランキング|燈露
                                                                • IIIF Curation Viewer | ROIS-DS人文学オープンデータ共同利用センター(CODH)

                                                                  “IIIF Curation Viewer”は、IIIF (International Image Interoperability Framework)準拠の画像ビューワであり、ページ移動やズームといった一般的なビューワが持つ機能に加え、複数の資料から画像の一部を切り取り、収集し、任意の順序で閲覧できる独自の「キュレーション」機能を備えている。 この文書は、本ビューワの画面上に示されていない動作詳細を中心に記述する。その他の情報については、以下の別資料を参照のこと。 IIIF Curation Viewer for Timeline:時系列拡張に関する情報 インストール:ビューワの設置に関する情報 プラグイン:プラグインに関する情報 アノテーションビューモード:アノテーションビューモードに関する情報 目次 動作デモ 活用例 基本利用者向け機能 ビューワ画面 キュレーションリスト画面 部分

                                                                    IIIF Curation Viewer | ROIS-DS人文学オープンデータ共同利用センター(CODH)
                                                                  • Welcome to tkasasagi’s website

                                                                    Welcome to tkasasagi’s website My name is Tarin Clanuwat. I am a research scientist at Sakana AI in Tokyo. I got my PhD in Classical Japanese Literature (文学) from Waseda University, Graduate School of Arts Letters and Science. I specialized in the Tale of Genji’s commentary books from Kamakura and Nambokucho period. Previously I was a senior research scientist at Google Research, Brain team, Googl

                                                                    • 日本文化とAIシンポジウム2019 〜AIがくずし字を読む時代がやってきた〜

                                                                      日本では、古典籍・古文書・古記録などの過去の資料(史料)が千年以上も大切に受け継がれており、数億点規模という、世界でも稀にみる大量の資料が現存しています。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが喫緊の重要な課題となっています。そこで本シンポジウムは、AI(人工知能)を活用してくずし字を読み解く研究の、過去・現在から未来までを議論し、世界に広がるくずし字研究の最前線をご紹介します。 Kaggleコンペティション:くずし字認識 基本情報

                                                                        日本文化とAIシンポジウム2019 〜AIがくずし字を読む時代がやってきた〜
                                                                      • 2021年の自分のブックマークを振り返る - ごった煮イマジネーション

                                                                        この記事ははてなブックマーク Advent Calendar2021の12日目です。 adventar.org id:wuzuki さんが作ってくださったアドベントカレンダーを知り、 ブコメで2021年を振り返ってみようと思いました。 もらった星の数ランキングとかで抽出できれば良かったのですが、 あいにくそんなツールを作るスキルが無いため、 はてブの自分のブックマークしたページを1月から延々とさかのぼって、 星の多寡にかかわらず、振り返りたいブコメやブックマークを羅列していきます。 妻が統合失調症になった 書いてくれてありがとうございます。いつ、身近な人が発症してもおかしくない病気だよね。 先日Twitterで統合失調症を患ったエッセイ漫画が投稿されていたのでシェア↓ <a href="https://twitter.com/m_hytk09/status/1339583162255437

                                                                          2021年の自分のブックマークを振り返る - ごった煮イマジネーション
                                                                        • 日本古典籍データセット活用例| 歴史的典籍NW事業|国文学研究資料館

                                                                          他にも、本データセットを活用している事例がありましたら、当サイトでご紹介したいと思いますのでお知らせ願います。 【連絡先】   古典籍共同研究係 婦人画報かわいい琳派ステンシル(株式会社ハースト婦人画報社) 株式会社ハースト婦人画報社が発行する「婦人画報(2017年12月01日発売号)」の付録として新日本古典籍総合データベースの「光琳画譜」より「仔犬」を使ったステンシルが作られました。 ページのトップへ 2018年カレンダー(インフォコム株式会社) インフォコム株式会社より新日本古典籍総合データベースの画像を利用したカレンダーが作られました。 ページのトップへ 武鑑全集 (http://codh.rois.ac.jp/bukan/) 人文学オープンデータ共同利用センターから公開しているデータセットで、江戸時代の200年続いたベストセラーである『武鑑』を網羅的に解析し、江戸時代の大名家や幕府

                                                                            日本古典籍データセット活用例| 歴史的典籍NW事業|国文学研究資料館
                                                                          • 日本古典籍データセット活用例| 歴史的典籍NW事業|国文学研究資料館

                                                                            他にも、本データセットを活用している事例がありましたら、当サイトでご紹介したいと思いますのでお知らせ願います。 【連絡先】   古典籍共同研究係 婦人画報かわいい琳派ステンシル(株式会社ハースト婦人画報社) 株式会社ハースト婦人画報社が発行する「婦人画報(2017年12月01日発売号)」の付録として新日本古典籍総合データベースの「光琳画譜」より「仔犬」を使ったステンシルが作られました。 ページのトップへ 2018年カレンダー(インフォコム株式会社) インフォコム株式会社より新日本古典籍総合データベースの画像を利用したカレンダーが作られました。 ページのトップへ 武鑑全集 (http://codh.rois.ac.jp/bukan/) 人文学オープンデータ共同利用センターから公開しているデータセットで、江戸時代の200年続いたベストセラーである『武鑑』を網羅的に解析し、江戸時代の大名家や幕府

                                                                              日本古典籍データセット活用例| 歴史的典籍NW事業|国文学研究資料館
                                                                            • 近藤泰弘「AIくずし字認識について―過大評価と過小評価のその先へ―」

                                                                              文学通信|多様な情報をつなげ、多くの「問い」を世に生み出す出版社 日本語・日本文学の研究書を中心に、人文学書全般を刊行する出版社、文学通信のブログ。 文学だけにこだわらず周辺領域も含め、意欲的に刊行していきます。 出版活動と同様に、webでも積極的に活動することで、多様な情報をつなげ、多くの「問い」を世に生み出していきたいと思います。 〒113-0022 東京都文京区千駄木2-31-3 サンウッド文京千駄木フラッツ1階101 電話03-5939-9027 FAX03-5939-9094 info@bungaku-report.com インボイス登録番号:T4011501023591 AIによるくずし字認識アプリがリリースされたのにあわせ、その技術をどう考えていけばいいのか、みなさんと考えていきたいと思い、近藤泰弘氏にご寄稿いただきました。ぜひご一読ください。(文学通信編集部) *****

                                                                                近藤泰弘「AIくずし字認識について―過大評価と過小評価のその先へ―」
                                                                              • みを(miwo):AIくずし字認識アプリ

                                                                                アプリのインストール Android: Google Play - 「みを」で検索 iOS: App Store - 「みを」で検索 2021年8月30日、Android版とiOS版のアプリを正式公開しました。アプリの利用は無料です。くずし字資料をカメラで写真撮影し、認識ボタンを押すだけで、AIがくずし字を現代文字に変換してくれます。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。 [もっと詳しく..] 「みを」アプリに関する情報をシェアする際には、ハッシュタグ「#miwoapp」をお使いください。 X (Twitter) - #miwoapp 主な機能 ご利用にあたって 「みを」のご利用にあたっては、プライバシーポリシー/利用規約や、注意事項をお読みください。 「みを」のAIくずし字認識は決して完璧ではありません。くずし字認

                                                                                  みを(miwo):AIくずし字認識アプリ
                                                                                • くずし字判読ひとりまなび|静大生錦画深読み

                                                                                  独習用教材を公開します。 補足情報を随時下に追加します。 若干情報を補足します。(最新:20230618) 前口上 2021年1月13日付、日経新聞に「東大など、東アジア最大の漢字字形データベース公開」という記事が出て、少し話題になりました。ニュース記事なのでいずれリンクが切れてしまうかも知れませんので、最初と最後だけ引用します。 木簡や版本などの歴史資料に書かれたくずし字をはじめとする漢字を「史的文字」という。中国では王朝の変遷とともに漢字の形が変化し、様々な異体字も存在する。東京大学史料編纂所など国内外の6つの研究機関はこうした多様な来歴のある漢字を一括検索できる「史的文字データベース連携システム」を開発、このほどインターネット上に公開した。 +++++++++++++++++++ データベースは「IIIF」と呼ばれる国際規格に沿って制作した。史料編纂所の山田太造氏は「IIIFは世界中

                                                                                    くずし字判読ひとりまなび|静大生錦画深読み