エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
全国遺跡報告総覧:類義語およびOCR誤認識用語検索機能の公開 - なぶんけんブログ
以下の2つの機能を公開しました。より網羅的なテキスト全文検索を目指します。 キーワード検索時に類義... 以下の2つの機能を公開しました。より網羅的なテキスト全文検索を目指します。 キーワード検索時に類義語およびOCR誤認識用語(表記ゆれ)の登録がある用語の場合、検索結果にチェックボックスが表示されます。 〇類義語を含めた検索 専門用語の使い方は、専門家の認識や研究史に基づきます。ただし研究成果を社会に普及する観点からは検索性を確保する必要があります。そこで用語の類義関係を整理し、内部にシソーラスを構築することで、類義語も含めて検索できるようにしました。 〇OCR処理の誤認識用語を含めた検索 印刷物からスキャンした報告書データは、OCR処理によってテキストデータ化されています。しかし、似ている漢字については誤認識される場合があります。 例) 石と右、文と丈 その場合、全文検索で検索結果に漏れが生じることになります。 そこで誤認識されやすい漢字をとりまとめ、専門用語と突合することによって、表記ゆ
2020/02/17 リンク