タグ

2020年2月17日のブックマーク (6件)

  • 全国遺跡報告総覧:類義語およびOCR誤認識用語検索機能の公開 - なぶんけんブログ

    以下の2つの機能を公開しました。より網羅的なテキスト全文検索を目指します。 キーワード検索時に類義語およびOCR誤認識用語(表記ゆれ)の登録がある用語の場合、検索結果にチェックボックスが表示されます。 〇類義語を含めた検索 専門用語の使い方は、専門家の認識や研究史に基づきます。ただし研究成果を社会に普及する観点からは検索性を確保する必要があります。そこで用語の類義関係を整理し、内部にシソーラスを構築することで、類義語も含めて検索できるようにしました。 〇OCR処理の誤認識用語を含めた検索 印刷物からスキャンした報告書データは、OCR処理によってテキストデータ化されています。しかし、似ている漢字については誤認識される場合があります。 例) 石と右、文と丈 その場合、全文検索で検索結果に漏れが生じることになります。 そこで誤認識されやすい漢字をとりまとめ、専門用語と突合することによって、表記ゆ

    consigliere
    consigliere 2020/02/17
    すげえな、どんどん便利になっていくな
  • 「ミカンはお母さんが買うもの」フェミニスト学者牟田和恵氏の女性蔑視のステレオタイプ発言

    牟田和恵 @peureka ホントそうですよね。だいたい、ミカンのアピールになぜあの絵なのかフシギ。赤十字の宇崎ちゃんもひどかったがまだあれは若い男性層に献血の呼びかけを、という意図は理解できた。でもなんでミカンで?家族向け、料品の買い物するお母さん向けに考えないのはなぜ?オタクがミカン箱買いするとでも? twitter.com/gohstofcain/st…

    「ミカンはお母さんが買うもの」フェミニスト学者牟田和恵氏の女性蔑視のステレオタイプ発言
  • 『続・人類と感染症の歴史』の第9章「SARSとMERS」を公開します。 - 丸善出版 理工・医学・人文社会科学の専門書出版社

    トップ > ニュース一覧 > 『続・人類と感染症の歴史』の第9章「SARSとMERS」を公開します。 『続・人類と感染症の歴史』の第9章「SARSとMERS」を公開します。 2019年末より中国湖北省武漢市でコロナウイルスによる新型肺炎の感染が確認されました。2020年には日国内でも感染が確認され、現在もその影響の拡大が報道されています。それを受けて小社では同じコロナウイルスが原因とされる感染症である、SARSとMERSに関する知見をより多くの方に提供することが、恐れ過ぎず、冷静な対応ができる一助になると考え、著者である加藤茂孝先生のご厚意により、2018年に刊行した『続・人類と感染症の歴史-新たな恐怖に備える』より「第9章 SARSとMERS-コロナウイルスによる重症呼吸器疾患」を公開いたします。 権利の関係で一部の画像を非公開にしております。2020年7月までの公開を予定していますが

    『続・人類と感染症の歴史』の第9章「SARSとMERS」を公開します。 - 丸善出版 理工・医学・人文社会科学の専門書出版社
  • Exquisite patterns: Japanese Textile Design Books

    Exquisite patterns: Japanese Textile Design Books, a new exhibition of images from the British Library’s Japanese collection, runs from 14 February to 17 May 2020 in the Library’s Second Floor Gallery. In the first of a series of blog posts, curator Hamish Todd introduces the exhibition and some of the highlights. Furuya Kōrin 古谷紅麟, Shasei sōka moyō 写生草花模様. Unsōdō, Kyoto, 1907. British Library, OR

    Exquisite patterns: Japanese Textile Design Books
  • 自動見出し生成API:朝日新聞社メディア研究開発センター 人工知能研究の取り組み

    お知らせ 2022/11/11をもって試用APIキー提供を終了しました。すでに試用APIキーをお持ちの方は引き続きご利用いただけます。 かんたんにAPIの機能をお試しいただける「朝日新聞Playground」をリリースしました。ぜひご活用ください。 概要 自動要約生成API TSUNA(Text SUmmarizatioN Application)は、入力された記事文を機械学習を用いて要約し、見出しや要約文を生成するものです。 朝日新聞が大量に保有している過去30年分の記事データを、効率よく処理させるために前処理・フィルタリングをした上で、ディープラーニングの機構を用いて学習させています。 APIは出力する見出しや要約文の長さをコントロールできるのが特徴です。これは、掲載するメディアによって文字数制限がある場合が多いため、実用上必要な技術として注目しています。さらに、利用する状況に合

  • 論文の読み方&論文レビューマトリクス|しんしん

    スリニバサン・ケシャブ,「論文の読み方」(Keshav, S. 2016. “How to Read a Paper.”)を翻訳したので公開します。 合わせて、私が作成した「論文レビューマトリクス」も公開します。記事の末尾にPDFのリンクがあります。印刷してお使いください。 解説ケシャブが提案しているのは、「スリーパス」という三つの手順に分けて論文を読むというものです。 第一のパス:5分ほどで要約・節見出し・結論・参考文献を読んで、重要そうか判断する。 第二のパス:1時間ほどで、論文の各部分を読み内容を理解する。詳細には立ち入らない。 第三のパス:2時間以上かかる。論文の細部まで読み、その論文の長所と短所を見極める。 スリーパスというのは非常に単純な方略です。しかし、日々たくさんの論文を読まなければならない研究者にとって、読むかどうか、読むとしたらどれくらい時間をかけるかは重大な問題です。

    論文の読み方&論文レビューマトリクス|しんしん