並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 47件

新着順 人気順

くずし字認識の検索結果1 - 40 件 / 47件

  • 源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

      源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」 | Ledge.ai
    • そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス

      ライブラリのアプリ化 現代のニュースをくずし字で読んでみませんか?内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュース その他の事例については、活用事例を参照してください。 構成 古活字とくずし字 そあん(soan)で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字(草書体)も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。 そあん(soan)は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ

        そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス
      • ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ

        今回は「異体字」についてお話しします。すこし専門的な部分もあるので、適宜不要な部分は読み飛ばすことをお勧めします。 こんな問題から始めてみましょう。世田谷区の区章とその説明文は以下のように書かれています。 外輪の円は区内の平和、中心は「世」の文字が三方に広がり、人びとの協力と区の発展を意味しています。(世田谷区の紋章、シンボル | 世田谷区ホームページより) 「中心は『世』の文字」とありますが、そうは見えません。なぜこのような形なのでしょうか。 前回の記事 本記事は連載形式で、前回の補足のような内容になっています。前回の記事もご参照ください。 shokaki.hatenablog.jp クリックで目次の表示/非表示 前回の記事 異体字とは 異体字の認識 異体字の使われ方 どこまでが同じ漢字か 誤字か異体字か 異体字はどうできるのか よく使う字は略字化する 画数の多い字は正確でなくても読める

          ゼロから始める異体字の世界【レトロデザインのための近代日本語講座〈2〉】 - マチポンブログ
        • くずし字認識アプリ『みを』で江戸時代の数学書『塵劫記』を読む

          古書市で、江戸時代の数学書『塵劫記』(じんこうき)を買った。 『塵劫記』は、くずし字で書いてあるので、文章はさっぱり読めない。しかし、最近はくずし字を翻訳してくれる便利なアプリがある。 アプリで文字を翻訳し、数学に詳しい人に見てもらえば、なにが書いてあるのか、だいたいわかるのではないか? 『塵劫記』を古書市で買った 少しまえに、神保町の古書市で、江戸時代の数学書『塵劫記』を購入した。 右の『塵劫記』(文化三年)は500円、左の『新編塵劫記大成』(寛政三年)は1500円だった かつて、江戸時代の日本では和算という独自の数学が発展し、ヨーロッパなど先進的な地域の水準に劣らないほど発達したといわれる。教科書にも出てくる関孝和などはみなさまご存知だろう。 『塵劫記』は、江戸時代初期に、吉田光由が著した和算のテキストで、寺子屋でそろばんや初歩的な数学について学ぶさいに使われた。 江戸時代の数学入門書

            くずし字認識アプリ『みを』で江戸時代の数学書『塵劫記』を読む
          • 「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics

            日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があります。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが重要な課題となっています。 そこでこの社会課題の解決にAI(人工知能)を活用する方法を探るため、この7月から10月にかけて、世界最大規模の機械学習コンペプラットフォームである「Kaggle(カグル)」で、「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題する全世界的なコンペを開催します。コンペを通して画期的なくずし字認識手法の開発が進むだけでなく、くずし字データセット

              「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催― - 国立情報学研究所 / National Institute of Informatics
            • みを(miwo):AIくずし字認識アプリ

              アプリのインストール Android: Google Play - 「みを」で検索 iOS: App Store - 「みを」で検索 2021年8月30日、Android版とiOS版のアプリを正式公開しました。アプリの利用は無料です。くずし字資料をカメラで写真撮影し、認識ボタンを押すだけで、AIがくずし字を現代文字に変換してくれます。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。 [もっと詳しく..] 「みを」アプリに関する情報をシェアする際には、ハッシュタグ「#miwoapp」をお使いください。 X (Twitter) - #miwoapp 主な機能 ご利用にあたって 「みを」のご利用にあたっては、プライバシーポリシー/利用規約や、注意事項をお読みください。 「みを」のAIくずし字認識は決して完璧ではありません。くずし字認

                みを(miwo):AIくずし字認識アプリ
              • 最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you

                こんにちは。@shunk031 です。 普段は最先端の技術が大好きなパソコンのオタクですが、京都へ旅行して古き良き日本の文化に感化されました。 この記事は 法政大応情 Advent Calendar 2020 21 日目の記事です。 From http://codh.rois.ac.jp/ 今回は日本古典籍の分類タスクについて取り組んでみようと考え、近年の日本古典籍における「くずし字認識」に着目して調査をしました *1。 日本古典籍といった古文書に対して、OCR 等の文字認識技術によって文字情報をデジタル化し、それらの情報をもとに解析を行う流れは現代では自然だと考えています。 しかしながら、一般的に OCR は難しく、また古文書を機械に解析させることはさらなる困難があるのは容易に想像できます。 くずし字認識に対して、近年の取り組みでは ROIS-DS 人文学オープンデータ協働センターが K

                  最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you
                • 江戸時代の国語辞典には人相占いがある

                  1993年生まれ。京都市伏見区出身、宮崎県在住。天性の分からず屋で分かられず屋。ボードゲームと坂口安吾をこよなく愛している。 > 個人サイト もがき続けて100年生き抜くブログ まずボロすぎて笑う 『宝暦節用字海蔵』(1756年)。じいちゃんから借りてきた。 突然こんな古書を披露されて驚いたが、オークションサイトを覗いてみると状態のいいものが6,000円くらいで落札されていた。金銭的な価値はそう高くないようだ。 表紙を含めた数十ページが欠損しているけれど、250年もの月日を物語っているとかではなく、単に管理が悪くてボロボロになっているだけだと思う。土産物の菓子が入っていた雑な紙袋から取り出されたのを見てしまったのだ。きっと先祖代々そんな調子で守り継いできたのだろう。 思い返せば僕も物を雑に扱うほうである。中学生のころ、友達から借りた本を風呂場で読んでクタクタにして返したらキレられた記憶がふ

                    江戸時代の国語辞典には人相占いがある
                  • チームラボ・猪子寿之さん「AIを労働力の削減などには使わない」 | Ledge.ai

                    「チームラボボーダレス」「チームラボプラネッツ」などのデジタルアートで知られる、チームラボ株式会社 代表取締役の猪子寿之さん 経済産業省と国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)は2月19日、人工知能(AI)技術や新原理のコンピューティング技術などを活用し、イノベーションを創出できる人材の育成を目的とする「AIフロンティアプログラム(第2期)」の育成対象者による成果報告会を開催した。 本成果報告会では、お台場の「森ビルデジタルアートミュージアム:エプソン チームラボボーダレス(チームラボボーダレス)」や、豊洲の「チームラボプラネッツ TOKYO DMM 豊洲(チームラボプラネッツ)」などで有名な、チームラボ株式会社 代表取締役の猪子寿之さんによる講演「チームラボとAI」が実施された。 この記事では、チームラボが手がけるデジタルアートにおけるAI活用はもちろん、猪子さ

                      チームラボ・猪子寿之さん「AIを労働力の削減などには使わない」 | Ledge.ai
                    • 源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 : 痛いニュース(ノ∀`)

                      源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 1 名前:エイブルダー(茸) [CN]:2021/10/11(月) 13:00:59.33 ID:YDhvmomo0 ビデオ会議の背景は『源氏物語絵巻』。気さくで明るい人柄だが、古典のくずし字が読まれない日本の現状には不満をあらわにする。彼女からは古典文学が「好き」という気持ちがあふれ出していた。 タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。 彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、

                        源氏物語ファンのタイ人女性がAIくずし字認識アプリ開発 日本の研究者が批判「望ましくない」 : 痛いニュース(ノ∀`)
                      • tkasasagi 🐻 on Twitter: "本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB"

                        本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB

                          tkasasagi 🐻 on Twitter: "本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります) https://t.co/00c6b4xJsZ Android… https://t.co/AhAV8h4bfB"
                        • AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai

                          SmallTrainサイトのトップ画面 株式会社Geek Guild(ギークギルド)は11月9日、商用AI(人工知能)サービスのための、高精度なAI学習済みモデルの開発に使えるディープラーニング(深層学習)フレームワーク「SmallTrain(スモールトレイン)ver.0.2.0」のソースコードを公開したと発表。オープンソースなので、無償で誰でも利用できる。 SmallTrainは、ライブラリ機能とラッパー機能を兼ね備えたオープンソースフレームワーク。Kerasのように使えるという。多様なデータを学習済みのAIモデルを起点に、転移学習をするだけで、工数をかけずにAIを構築できるとのこと。 SmallTrainを使うと、精度を損なわず、大量のデータを取得する労力もいらず、ディープニューラルネットワークをすぐに開発できるという。MITライセンスに準拠しており、商用利用も可能だ。 需要と供給にあ

                            AI学習済みモデルの開発に使える無償のフレームワーク「SmallTrain ver.0.2.0」商用利用可能 | Ledge.ai
                          • 「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目

                            by Peter Roan 日本の古典籍や古文書で用いられている「くずし字」を現代日本語の文字に変換する作業を「翻刻」と呼びます。多くの現代日本人はくずし字を読むことができないので、変換は誰にでもできるものではありません。そこで注目が集まっているのが、機械学習を利用して翻刻する試みです。モントリオール大学の博士課程で機械学習の研究を行うアレックス・ラム氏が、くずし字の活字化を取り巻く事情をまとめています。 How Machine Learning Can Help Unlock the World of Ancient Japan https://thegradient.pub/machine-learning-ancient-japan/ 過去の人々が残した膨大な書物や文書は、歴史や文化を考える上で非常に重要な資料となります。しかし、言語や記法は時間と共に変化していくものであり、古い文書

                              「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目
                            • AIくずし字認識アプリ「みを(miwo)」を使ってみた

                              現在使用されている平仮名は1種類のみですが、昔は何種類もの平仮名が存在しました。現在使用されていない平仮名は「変体仮名」と呼ばれており、さまざまな漢字が基となっています。この変体仮名を崩して書いた文字が「くずし字」で、くずし字は歴史的な文献などで多数使用されています。そんなくずし字を手軽に読めるようにするために開発されたのが、人工知能(AI)くずし字認識アプリの「みを(miwo)」です。 みを(miwo) - AIくずし字認識アプリ | ROIS-DS人文学オープンデータ共同利用センター(CODH) http://codh.rois.ac.jp/miwo/ 本日正午、AIくずし字認識アプリ「みを」をリリースしました!(パチパチパチパチ) iOS (リリースからアプリストアに出るまでちょっと時間かかります)https://t.co/00c6b4xJsZ Androidhttps://t.co

                                AIくずし字認識アプリ「みを(miwo)」を使ってみた
                              • AIくずし字認識アプリ「みを」開発者が語る開発経緯の取り組む姿勢に感動

                                tkasasagi 🐻 @tkasasagi PhD Japanese literature 早大文学博士 源氏古注専門 Research Scientist @SakanaAILabs Prev: @GoogleDeepMind Google Brain @rois_codh #miwoapp creator tkasasagi.github.io tkasasagi 🐻 @tkasasagi 私が院生(早大文学)のとき、研究室ではくずし字を読めない人はいませんでした。博士課程の入試もくずし字資料に線が引かれて「この文章の状況を説明しなさい」でした。 2022-07-31 23:09:38

                                  AIくずし字認識アプリ「みを」開発者が語る開発経緯の取り組む姿勢に感動
                                • KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター

                                  本サービスは無料ですが、利用状況の把握と過度な利用の防止のために、ログインを必須としています。ログインサービスの実装には、Google社のFirebase認証を活用しており、Google、Facebook、Twitterのアカウントと連携するか、電子メールアドレスを入力することで、ログインが可能となります。 「KuroNetくずし認識ビューア」と「ダッシュボード」は、両方とも同じアカウントでログインする必要がありますのでご注意下さい。ログイン機能は、いずれの場合も画面の右上にあります。なお、アカウント連携はログイン機能の実現のみに利用し、取得した情報はそれ以外の目的には活用いたしません。 「KuroNetくずし認識ビューア」に、認識したい本のIIIFマニフェストをドラッグ&ドロップしてください(注意:IIIFの利用)。そして、ページ移動やサムネイル表示などを用いて、認識したい画像を表示して

                                    KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター
                                  • 【書籍メモ】『Software Design 2021年11月号』Kaggleで知る機械学習(技術評論社) - u++の備忘録

                                    Kaggle特集に惹かれ、今月の『Software Design』を購入しました。 gihyo.jp 特集の目次は、以下のとおりです。 第1特集 Kaggleで知る機械学習 前処理から学習モデルの構築,スコアの上げ方までわかる 第1章:Kaggleにエントリーしよう 登録からSubmitまでブラウザ上で完結 第2章:自然言語処理のコンペに挑戦① データの前処理・学習・推論の流れ 第3章:自然言語処理のコンペに挑戦② モデル変更でスコアを底上げする 第4章:くずし字認識のコンペに挑戦① パラメータチューニングの奥深さに触れる 第5章:くずし字認識のコンペに挑戦② さらなるスコアアップのためにKagglerがやっていること まずは、広くソフトウェアエンジニア向けの雑誌にKaggleの特集が掲載されたのが印象的でした。その中で第1章では、Kaggleの概要や機能をスクリーンショットと共に紹介して

                                      【書籍メモ】『Software Design 2021年11月号』Kaggleで知る機械学習(技術評論社) - u++の備忘録
                                    • 「ナイスステップな研究者2022」に精鋭10人、多彩な分野で成果

                                      文部科学省科学技術・学術政策研究所(NISTEP、ナイステップ)は、科学技術イノベーションのさまざまな分野で活躍している研究者10人を「ナイスステップな研究者2022」に選定した。現代の課題に密接に関わる研究など多岐にわたる分野で、社会に成果を広く還元している人物を選んだという。 「ナイスステップな研究者2022」に選ばれた吉田慎哉氏の研究から。試作した「飲む体温計」と動作原理(吉田氏提供) 活躍が期待される若手研究者を中心に、AI(人工知能)技術の人文科学への応用研究、地熱資源の基礎研究や地域との関わり、噴火による津波の発生メカニズムの解明といった分野から選ばれている。 専門家約1700人への調査などにより、最近の活躍が注目される約250人の候補を抽出。研究実績に加え、人文・社会科学との融合などの新興・融合領域を含めた最先端の画期的な研究内容、産学連携・イノベーション、国際的な研究活動の

                                        「ナイスステップな研究者2022」に精鋭10人、多彩な分野で成果
                                      • 便利すぎるこれ!古文書や浮世絵のくずし字を自動解読してくれる無料の「AIくずし字認識」が素晴らしい! : Japaaan

                                        大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)と大学共同利用機関法人 人間文化研究機構 国文学研究資料館(国文研)がすごいデータを無償公開しました!11月17日に公開… この「日本古典籍くずし字データセット」を活用して、古文書や浮世絵などに書かれたくずし字を自動で解読してくれるサービス「AIくずし字認識」が素晴らしく便利なのです! 「AIくずし字認識」は、古文書や浮世絵などの画像の中からくずし字を一文字指定すると、そのくずし字を解読してくれるのです。しかもこの作業をブラウザ上で即座に行ってくれます。 使い方の流れを紹介しますね。 1、古文書や浮世絵などの画像URLを指定 まず必要なのは、画像配信形式「IIIF (International Image Interoperability Framework)」に対応した画像URLです。Japaaanでよく紹介している

                                          便利すぎるこれ!古文書や浮世絵のくずし字を自動解読してくれる無料の「AIくずし字認識」が素晴らしい! : Japaaan
                                        • 松尾豊さん「AI研究は米中がトップ」日本は……? | Ledge.ai

                                          日本ディープラーニング協会(JDLA)は9月18日、「第1回全国高等専門学校ディープラーニングコンテスト2020(DCON2020)」の一環として、東京大学大学院工学系研究科 教授で、同協会の理事長も務める松尾豊さんによる、最優秀賞受賞の東京工業高等専門学校(東京高専)への表敬訪問を実施した。 その際に、松尾豊さんに日本におけるAI(人工知能)教育やAI活用の状況についてどう考えているか、少しだけお話を聞く機会を得た。松尾豊さんは『人工知能は人間を超えるか』(KADOKAWA)などの著書でも知られる、AI研究の第一人者である。 AI研究は「米中の両国がトップ」日本は?まずは「現在の日本のAI研究はアメリカや中国と比較して、どのように位置にあると考えているか?」聞くと、松尾豊さんは学術面について「米中の両国がトップで、その後にイギリス、カナダ、ドイツ、シンガポールなどが続き、日本はまだその下

                                            松尾豊さん「AI研究は米中がトップ」日本は……? | Ledge.ai
                                          • くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」

                                            ロバート キャンベル @rcampbelltokyo 数億点規模という世界でも稀な量の古典籍・古文書を有しながら「くずし字」で書かれているため読める人が殆どいない現代日本。全世界のデータサイエンティストにAIを活用した認識モデルを募り、今日、その結果発表と授賞式が行われます。新時代に古典知の扉をみんなで開こうと #Kaggle #NIJL #NII pic.twitter.com/ba8jSygCrQ 2019-11-11 10:01:34

                                              くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」
                                            • AIで“くずし字”を解読するスマホアプリが無料公開 コンペ1位の認識モデル採用

                                              人文学オープンデータ共同利用センター(CODH)は8月30日、古文書に書かれた「くずし字」をAIで解読するスマートフォン(iOS/Android)向け無料アプリ「みを」を公開した。元のくずし字と変換後の文字を比較でき、古文書に慣れてない人の理解を手助けするという。 変換したい資料の写真や、ネットからダウンロードした画像などをアプリで読み込むと、くずし字を変換して元の文章の上に表示する。同じ文字を強調表示する機能や変換後の文章をメモ帳などにコピー&ペーストできる機能などを備える。 AIの学習には、国文学研究資料館の日本古典籍くずし字データセットを基に、CODHが開発したくずし字認識モデル「KuroNet」(クロネット)と、機械学習の精度を競い合うプラットフォーム「Kaggle」(カグル)のくずし字認識コンペティションで1位になったtascj氏の認識モデルを活用している。くずし字は江戸時代のデ

                                                AIで“くずし字”を解読するスマホアプリが無料公開 コンペ1位の認識モデル採用
                                              • Center for Open Data in the Humanities (CODH) on Twitter: "以下の記事がバズってますが、重大な間違いがありますので、訂正します。 - くずし字認識の開発にGoogleは関わっていません。今回Googleイベントで発表しただけです。 - 「翻訳」ではなく「翻刻」です。 - くずし字データセッ… https://t.co/esxVaQDP0v"

                                                以下の記事がバズってますが、重大な間違いがありますので、訂正します。 - くずし字認識の開発にGoogleは関わっていません。今回Googleイベントで発表しただけです。 - 「翻訳」ではなく「翻刻」です。 - くずし字データセッ… https://t.co/esxVaQDP0v

                                                  Center for Open Data in the Humanities (CODH) on Twitter: "以下の記事がバズってますが、重大な間違いがありますので、訂正します。 - くずし字認識の開発にGoogleは関わっていません。今回Googleイベントで発表しただけです。 - 「翻訳」ではなく「翻刻」です。 - くずし字データセッ… https://t.co/esxVaQDP0v"
                                                • KuroNetくずし字認識サービス(AI OCR)

                                                  ディープラーニング(AI)を用いた多文字のくずし字OCRサービスを提供します。 なお、スマホアプリについては、みを(miwo) - AIくずし字認識アプリをご利用下さい。 KuroNetくずし字認識サービス KuroNetくずし字認識サービス KuroNetくずし字認識サービスは、IIIF (International Image Interoperability Framework)に準拠した画像を対象に、RURIを利用した多文字くずし字OCR機能を提供します。無料サービスですが、ログインが必要です。具体的な利用方法につきましては、リンク先をご覧下さい。 KuroNetくずし字認識ビューア KuroNetくずし字認識ビューア KuroNetくずし字認識ビューアは、KuroNetくずし字認識サービスを利用するための入口となります。ビューアにIIIF (International Image

                                                    KuroNetくずし字認識サービス(AI OCR)
                                                  • 「Kaggle Days Tokyo」参加録 - u++の備忘録

                                                    ※ 「Kaggle Advent Calendar 2019」*1の12日目の記事です。 2019年12月11、12日に開催された「Kaggle Days Tokyo」*2に参加しました。1日目はワークショップとプレゼンテーション、2日目はオフラインコンペティションが開催されました。 資料や動画は恐らく公式から公開されると思うので、本記事では私の聴講した内容を基に、個人的な所感を述べます。なお1日目の内容はGunosyブログの記事*3やWantedlyブログの記事*4、twitterまとめ*5に詳しく記載されています。 1日目 Leveling-up Kaggle Competitions Ben Hamner, Kaggle CTO KaggleのCTOを務めるBenさんから、Kaggleの遍歴や今後の展望についてのお話でした 深層学習の大躍進以前からKaggleを開催している歴史や、強

                                                      「Kaggle Days Tokyo」参加録 - u++の備忘録
                                                    • AIはくずし字が読めるのか?古今集十本による可読率ランキング|燈露

                                                      これは十本の『古今和歌集』仮名序の冒頭をくずし字OCRにかけて、どの程度読めているのかをランキング形式で確認したものです。 近年はAIの技術も進んでいるので、巷では、くずし字を読む時代が終わるとも言われています。聞くところによると、くずし字AIの可読率は95%とのことで、凄そうですよね。 ○2021年度日本近世文学会春季大会シンポジウム「デジタル時代の和本リテラシー 古典文学研究と教育の未来」2021年6月12日(土) https://youtu.be/X03CMIV5SW8 しかし、実際はどうなのでしょうか。95%とはどのぐらい読めているのでしょうか。AIが人間の代わりにくずし字を読んでくれて、古写本の全文検索ができる日を夢見てみたりするわけですが、数字だけだと具体的なことがわかりません。 具体的にどうなのか、検討しているものを見つけられなかったので、実際に自分でやってみようというわけで

                                                        AIはくずし字が読めるのか?古今集十本による可読率ランキング|燈露
                                                      • Welcome to tkasasagi’s website

                                                        Welcome to tkasasagi’s website My name is Tarin Clanuwat. I am a research scientist at Sakana AI in Tokyo. I got my PhD in Classical Japanese Literature (文学) from Waseda University, Graduate School of Arts Letters and Science. I specialized in the Tale of Genji’s commentary books from Kamakura and Nambokucho period. Previously I was a senior research scientist at Google Research, Brain team, Googl

                                                        • 日本文化とAIシンポジウム2019 〜AIがくずし字を読む時代がやってきた〜

                                                          日本では、古典籍・古文書・古記録などの過去の資料(史料)が千年以上も大切に受け継がれており、数億点規模という、世界でも稀にみる大量の資料が現存しています。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが喫緊の重要な課題となっています。そこで本シンポジウムは、AI(人工知能)を活用してくずし字を読み解く研究の、過去・現在から未来までを議論し、世界に広がるくずし字研究の最前線をご紹介します。 Kaggleコンペティション:くずし字認識 基本情報

                                                            日本文化とAIシンポジウム2019 〜AIがくずし字を読む時代がやってきた〜
                                                          • 2021年の自分のブックマークを振り返る - ごった煮イマジネーション

                                                            この記事ははてなブックマーク Advent Calendar2021の12日目です。 adventar.org id:wuzuki さんが作ってくださったアドベントカレンダーを知り、 ブコメで2021年を振り返ってみようと思いました。 もらった星の数ランキングとかで抽出できれば良かったのですが、 あいにくそんなツールを作るスキルが無いため、 はてブの自分のブックマークしたページを1月から延々とさかのぼって、 星の多寡にかかわらず、振り返りたいブコメやブックマークを羅列していきます。 妻が統合失調症になった 書いてくれてありがとうございます。いつ、身近な人が発症してもおかしくない病気だよね。 先日Twitterで統合失調症を患ったエッセイ漫画が投稿されていたのでシェア↓ <a href="https://twitter.com/m_hytk09/status/1339583162255437

                                                              2021年の自分のブックマークを振り返る - ごった煮イマジネーション
                                                            • 近藤泰弘「AIくずし字認識について―過大評価と過小評価のその先へ―」

                                                              文学通信|多様な情報をつなげ、多くの「問い」を世に生み出す出版社 日本語・日本文学の研究書を中心に、人文学書全般を刊行する出版社、文学通信のブログ。 文学だけにこだわらず周辺領域も含め、意欲的に刊行していきます。 出版活動と同様に、webでも積極的に活動することで、多様な情報をつなげ、多くの「問い」を世に生み出していきたいと思います。 〒113-0022 東京都文京区千駄木2-31-3 サンウッド文京千駄木フラッツ1階101 電話03-5939-9027 FAX03-5939-9094 info@bungaku-report.com インボイス登録番号:T4011501023591 AIによるくずし字認識アプリがリリースされたのにあわせ、その技術をどう考えていけばいいのか、みなさんと考えていきたいと思い、近藤泰弘氏にご寄稿いただきました。ぜひご一読ください。(文学通信編集部) *****

                                                                近藤泰弘「AIくずし字認識について―過大評価と過小評価のその先へ―」
                                                              • みを(miwo):AIくずし字認識アプリ

                                                                アプリのインストール Android: Google Play - 「みを」で検索 iOS: App Store - 「みを」で検索 2021年8月30日、Android版とiOS版のアプリを正式公開しました。アプリの利用は無料です。くずし字資料をカメラで写真撮影し、認識ボタンを押すだけで、AIがくずし字を現代文字に変換してくれます。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。 [もっと詳しく..] 「みを」アプリに関する情報をシェアする際には、ハッシュタグ「#miwoapp」をお使いください。 X (Twitter) - #miwoapp 主な機能 ご利用にあたって 「みを」のご利用にあたっては、プライバシーポリシー/利用規約や、注意事項をお読みください。 「みを」のAIくずし字認識は決して完璧ではありません。くずし字認

                                                                  みを(miwo):AIくずし字認識アプリ
                                                                • くずし字判読ひとりまなび|静大生錦画深読み

                                                                  独習用教材を公開します。 補足情報を随時下に追加します。 若干情報を補足します。(最新:20230618) 前口上 2021年1月13日付、日経新聞に「東大など、東アジア最大の漢字字形データベース公開」という記事が出て、少し話題になりました。ニュース記事なのでいずれリンクが切れてしまうかも知れませんので、最初と最後だけ引用します。 木簡や版本などの歴史資料に書かれたくずし字をはじめとする漢字を「史的文字」という。中国では王朝の変遷とともに漢字の形が変化し、様々な異体字も存在する。東京大学史料編纂所など国内外の6つの研究機関はこうした多様な来歴のある漢字を一括検索できる「史的文字データベース連携システム」を開発、このほどインターネット上に公開した。 +++++++++++++++++++ データベースは「IIIF」と呼ばれる国際規格に沿って制作した。史料編纂所の山田太造氏は「IIIFは世界中

                                                                    くずし字判読ひとりまなび|静大生錦画深読み
                                                                  • 第21回図書館総合展が開催 ~ 展示会場フォトレポート | HON.jp News Blog

                                                                    《この記事は約 5 分で読めます(1分で600字計算)》 図書館総合展運営委員会は11月12日から14日まで、パシフィコ横浜(神奈川県横浜市)で「第21回図書館総合展」を開催した。企画・運営は株式会社カルチャー・ジャパン(JCC)。本稿では展示会の様子を電子図書館関係を中心に写真でレポートする。 メディアドゥ/OverDrive,inc.のブース。電子図書館サービス「Rakuten OverDrive」などを展示。取り扱いコンテンツは外国書が約180万点、国内書が約4万3000点(うち青空文庫1万1000点)。世界では4万3000館に導入されている同サービスは、日本では公共図書館14自治体、大学図書館2校、学校図書館5校、企業図書館3企業、合計24館にまで拡大した。 図書館流通センターのブースでは、電子図書館サービス「LibrariE」「TRC-DL」などを展示。LibrariEは、大学図

                                                                      第21回図書館総合展が開催 ~ 展示会場フォトレポート | HON.jp News Blog
                                                                    • E2179 – AI技術を取り入れた「くずし字翻刻学習・指導システム」

                                                                      AI技術を取り入れた「くずし字翻刻学習・指導システム」 立命館大学アート・リサーチセンター・赤間亮(あかまりょう) ●概要 立命館大学アート・リサーチセンター(以下「立命館ARC」)では,様々なデジタルアーカイブを構築しており,その中の浮世絵と古典籍のポータルデータベースに凸版印刷株式会社の開発による人工知能(AI)技術を組み込んだ「くずし字翻刻学習・指導システム」が2019年1月に導入された。学習・研究用のプロジェクトベースによる活用が可能となっており,古典籍の翻刻本文アーカイブの進展も期待できる。 ●背景 文化財のデジタル画像によるウェブ公開が加速化している。立命館ARCでは,国内外の浮世絵や古典籍のデジタルアーカイブ構築を進めてきた。とくに,欧米の博物館等を対象としたデジタル化プロジェクトは,独自のデジタル化技術を使ったプロジェクトとして海外でも知られている。国内の古典籍については,

                                                                        E2179 – AI技術を取り入れた「くずし字翻刻学習・指導システム」
                                                                      • 提言:オープンサイエンスの深化と推進に向けて

                                                                        提言 オープンサイエンスの深化と推進に向けて 令和2年(2020年)5月28日 日 本 学 術 会 議 オープンサイエンスの深化と推進に関する検討委員会 i この提言は、日本学術会議オープンサイエンスの深化と推進に関する検討委員会の審議 結果を取りまとめ公表するものである。 日本学術会議オープンサイエンスの深化と推進に関する検討委員会 委員長 喜連川 優 (連携会員) 情報・システム研究機構国立情報学研究所所長 東京大学生産技術研究所教授 副委員長 引原 隆士 (特任連携会員) 京都大学図書館機構長 附属図書館館長 教授 幹 事 安達 淳 (連携会員) 情報・システム研究機構国立情報学研究所 副所長・特任教授 幹 事 村山 泰啓 (連携会員) 国立研究開発法人情報通信研究機構ソーシャル イノベーションユニット戦略的プログラムオフ ィス研究統括 久留島 典子 (第一部会員) 東京大学史料編纂

                                                                        • ‎miwo

                                                                          くずし字資料を読みたい!でも読めない!「みを」はそんな人を手助けするアプリです。カメラで資料を撮影し、ボタンを押せば、AIがくずし字を現代の文字に変換してくれます。くずし字資料の世界へようこそ。 ROIS-DS人文学オープンデータ共同利用センター(CODH)では、画像に含まれるくずし字を現代の文字に変換する(翻刻する)機能を備えたAIくずし字認識技術を開発しました。この技術が誰でも気軽に使えることを目指して開発したのが、AIくずし字認識スマホアプリ「みを(miwo)」です。 「みを」は『源氏物語』第14帖「みをつくし」にちなんだ名前です。「みをつくし」が人々の水先案内となるように、「みを」アプリがくずし字資料の海を旅する案内となることを目指しています。 【こんな方にオススメ】 ●手元にあるくずし字資料を読みたい方 ●くずし字資料の内容を素早く確認したい方 ●くずし字を勉強したい方 ●くずし

                                                                            ‎miwo
                                                                          • 「KuroNetくずし字認識サービス」の使い方(@yhkondo 氏のレクチャー)【IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できる!】

                                                                            Center for Open Data in the Humanities (CODH) @rois_codh 【サービス公開】 日本古典籍くずし字データセットを用いたAIくずし字OCRサービスとして、「KuroNetくずし字認識サービス」を公開しました。 IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できます。 mp.ex.nii.ac.jp/kuronet/ 2019-11-12 12:33:46 yhkondo @yhkondo 国文研等主催のシンポジウムでくずし字AI関係の発表がたくさんあったので、さっそく、クラウドのAIくずし字解読のKuroNetを試してみた。ちょっと最初がわかりにくので解説します。まず、下のURLに行き、ダッシュボードとビューアーを一つずつ

                                                                              「KuroNetくずし字認識サービス」の使い方(@yhkondo 氏のレクチャー)【IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できる!】
                                                                            • ニュース | 人文学オープンデータ共同利用センター

                                                                              2024年 | 2023年 | 2022年 | 2021年 | 2020年 | 2019年 | 2018年 | 2017年 | 2016年 2024年 2024-05-02 edomi ルートにも「れきちず」を導入しました。 2024-05-01 江戸マップ「れきちず」データセットを公開しました。また、edomi マップおよびedomi 災害に「れきちず」を導入し、現代デザインの歴史地図上で、edomiの歴史ビッグデータが閲覧できるようになりました。 2024-04-26 HIMIKOプロジェクトから、HIMIKO Editor for Text(β版)を公開しました。 2024-04-04 HIMIKOプロジェクトから、HIMIKO Editor for Image(β版)を公開しました。 また、Linked Pasts Japanの最初のイベント、Linked Pasts Japan

                                                                                ニュース | 人文学オープンデータ共同利用センター
                                                                              • CA1989 – 動向レビュー:IIIFの概要と主要APIバージョン3.0の公開 / 永崎研宣

                                                                                IIIFの概要と主要APIバージョン3.0の公開 一般財団法人人文情報学研究所:永崎研宣(ながさききよのり) 1. IIIFとはどういうものか 文化資料をデジタル化してウェブに公開し、知の公共化をより広く進めることで社会に貢献したい。いわゆる「デジタルアーカイブ」の構築・公開に関わる人なら国内外を問わず多かれ少なかれ共有している気持ちだろう。しかし、それに触れようとすると、サイトごとに様々に異なる使い方を覚え、アクセスするたびにウェブサイトを切り替え、どこにあるかわからない資料を探すべく色々なウェブサイトを検索して回る、といった状況があった。このことは、ユーザにとって不便であるというだけでなく、文化資料を活用してもらいたい公開機関の側にとっても、本来の目標達成の障害になってしまっているという捉え方がなされるようになっていた。一方で、個々の機関が別々に専用のウェブシステムを発注して開発作業や

                                                                                  CA1989 – 動向レビュー:IIIFの概要と主要APIバージョン3.0の公開 / 永崎研宣
                                                                                • 「AI美空ひばり」どこまでがAIでどこまでが人なのか | Ledge.ai

                                                                                  画像は本イベントでも話題になった「AI美空ひばり」(ニュースリリースより) 東京大学 次世代知能科学研究センター 教授の松原仁氏、東京工業大学 リベラルアーツ研究教育院 教授の中島岳志氏、東京大学 未来ビジョン研究センター 特任講師の江間有沙氏(左から順に) 日本科学未来館は8月23日、オンラインイベント「AIを使って、亡くなった大切な人に会いたいですか?」をニコニコ生放送で開催した。本イベントは、故人の生前の言動を再現する技術の賛否について取り扱うもの。テーマがテーマだけに、メディアで大々的に報じられた「AI美空ひばり」に関する話題が多かった。 ゲストスピーカーは東京大学 未来ビジョン研究センター 特任講師の江間有沙氏、東京大学 次世代知能科学研究センター 教授で、AIを使って故手塚治虫氏の新作マンガを作り出すプロジェクト「TEZUKA 2020」に参加する松原仁氏、東京工業大学 リベラ

                                                                                    「AI美空ひばり」どこまでがAIでどこまでが人なのか | Ledge.ai