並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 7 件 / 7件

新着順 人気順

旧字旧仮名遣いの検索結果1 - 7 件 / 7件

  • AI-OCRで国立国会図書館の資料をテキスト化 約1300万文字のデータセットから開発 その舞台裏に迫る

    明治期以降の書籍や雑誌といった「近代活字資料」のテキストデータを生成するために、AIを活用したOCR(光学的文字認識)を新たに開発する――こんな取り組みを国立国会図書館(NDL)が発表した。OCRはデジタル画像を解析し、画像内の文字をテキストデータに変換する技術だ。近代活字資料は書体が現代とは異なるうえ、旧字旧仮名遣いが中心なのでテキストデータ化は容易ではない。 国立国会図書館からの委託を受けてこの試みに挑戦したのが、AIを使った画像処理技術を開発しているモルフォAIソリューションズ(千代田区)だ。「かなり大変な開発作業になると感じました。しかしAIなら可能かもしれない、実現できれば国立国会図書館ユーザーの利便性を高められると確信していました」――こんな声がAI-OCR開発に携わったメンバーの口から出た。 そこで開発の舞台裏について、モルフォAIソリューションズのエンジニアたちを取材した。

      AI-OCRで国立国会図書館の資料をテキスト化 約1300万文字のデータセットから開発 その舞台裏に迫る
    • 地球ごと埋め尽くしたる落ち葉かな 〜教育実習生担当日誌⑶ ~俳句tweetより~ - 森の奥へ

      教育実習日誌に書いたわたし(指導教官)側の文章を、備忘録として、そして40年ほど前に教育実習生だったわたし自身への応援メッセージとして書き残しています。 教育実習は2週間(10日間)。7日目からの記録です。 1日目から6日目はこちらに書きました。→捨て猫の小さき肉球いわし雲 〜教育実習生担当日誌(1) - 森の奥へ 秋深けてまだ生きてをり螽斯 〜教育実習生担当日誌(2) - 森の奥へ 7日目 (教育実習の先生は実習期間中に一度、他の先生方にも参観してもらって授業を見てもらう機会を持たないといけないことになっています。この日はその研究授業の日でした) 研究授業お疲れ様でした。授業については反省会でお話しした通りです。今回はコミュニケーションが取れる生徒たちとの授業でしたが、特別支援学校の肢体不自由部門ではコミュニケーションをとるのが難しい生徒の方が多数です。本校での実習はあと数日となりました

        地球ごと埋め尽くしたる落ち葉かな 〜教育実習生担当日誌⑶ ~俳句tweetより~ - 森の奥へ
      • 三大ネット上のあーヤバいなーこの人には近づきたくないなーって人

        執拗に旧字と旧仮名遣いにこだわる「旧字旧仮名遣い」 文末に必ず同じ顔文字付ける「語尾が顔文字」 Twitterとかはてぶとか特定のサービスに依存してない感じであと1つ無いかな

          三大ネット上のあーヤバいなーこの人には近づきたくないなーって人
        • 明治から昭和初期の文書を解読するサービス、凸版印刷が提供へ くずし字対応AI-OCRで

          凸版印刷は11月11日、明治期から昭和初期(以下、近代)の手書き文字に対応したAI-OCRを開発したと発表した。同社提供の江戸時代のくずし字を対象にした古文書解読サービス「ふみのは」のAI-OCRを近代の多様な筆跡の手書き文字にまで対応範囲を拡張させたもの。11月から実証実験を行い、2023年4月から正式サービスを開始する予定。 凸版印刷によると、近代の手書き文字は、書き手によるくずし方のバラつきが大きいという。原因は筆記用具の多様化や片仮名語の混在、旧字旧仮名遣い表記などがあるためで、解読は非常に困難としている。今回開発したAI-OCRではこれに対応するため、さまざまなパターンの文字をAIに学習させ、文字の解読精度を向上させた。

            明治から昭和初期の文書を解読するサービス、凸版印刷が提供へ くずし字対応AI-OCRで
          • 果たし得ていない約束―私の中の二十五年 - Wikipedia

            『果たし得ていない約束―私の中の二十五年』(はたしえていないやくそく わたしのなかのにじゅうごねん)は、三島由紀夫の評論・随筆。初出の旧仮名遣いでは『果たし得てゐない約束…』となる。実質的な三島の遺書、決別状としての意味合いを持ち、三島の死後、様々な誌面や三島論で『檄』とならび、引用されることの多い評論である。三島の吐露する〈空虚〉の考察だけでなく、戦後民主主義と三島文学の相関関係を探るためにも重要な文章である[1]。 1970年(昭和45年)、『サンケイ新聞』(夕刊)7月7日号に掲載され、翌1971年(昭和46年)5月6日に新潮社より刊行された『蘭陵王――三島由紀夫 1967.1 - 1970.11』に収録された。 三島の死後、自宅書斎の机上から、本文が掲載されたサンケイ新聞夕刊の切抜きと共に、「限りある命ならば永遠に生きたい. 三島由紀夫」と記した書置きが発見されている[2][注釈 1

            • 青空文庫収録ファイルの朗読配信について

              ただいま朗読利用や朗読配信についてのお問い合わせを数多く受けておりますが、青空文庫は限られたボランティアで運営しているため、現状なかなかひとつひとつに丁寧なお返事を差し上げることができません。 そこで、恐縮ながらこのページのお知らせをもって回答に代えさせていただきます。 Q:青空文庫にある作品を朗読したいのですが…… A:「青空文庫収録ファイルの取り扱い規準」(https://www.aozora.gr.jp/guide/kijyunn.html)に従って、どうぞご活用ください。 「青空文庫FAQ」(https://www.aozora.gr.jp/guide/aozora_bunko_faq.html#midashi1060)より 青空文庫に収録されている著作権保護期間満了した作品については、事前の許諾なく、有償無償を問わずご利用いただけます。著作権保護期間中の作品であっても、広く自由利

              • 日本初 明治期から昭和初期の手書き文字を解読する AI-OCRを凸版印刷が開発

                このAIニュースのポイント 近代のくずし字を多く含む解読難易度の高い文書に対応したもの 江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させた 様々なパターンの文字をAIに学習させ、難読文字の解読も可能 凸版印刷株式会社は、明治期から昭和初期の手書き文字に対応したAI-OCRを開発しました。 近代に作成されたくずし字を多く含む手書きの資料は、全国に大量に残存しています。その中には公文書、企業経営文書、業務日誌、書簡のような貴重な情報が記された資料が数多く含まれています。また、手書きの謄本類を取り扱う業務においては、近代の手書き資料の解読が日常的に行われていますが、これら資料の解読は、専門家にとっても難易度が高く手間のかかる作業であり、実用レベルのOCR技術もこれまで開発されていませんでした。 凸版印刷は、そのような課題を解決するため、神

                  日本初 明治期から昭和初期の手書き文字を解読する AI-OCRを凸版印刷が開発
                1