タグ

2017年10月31日のブックマーク (2件)

  • Encoder-Decoder でレシピの材料名を正規化する - クックパッド開発者ブログ

    研究開発部の原島です。部のマネージメントのかたわら、自然言語処理関連の開発に従事しています。エントリでは、最近社内で開発した自然言語処理システムを紹介します。 ■ 「しょうゆ」のバリエーションは 100 種類以上 クックパッドで以前から解決したかった課題の一つに材料の名前(以下、材料名)の正規化があります。 クックパッドレシピは複数の材料から構成され、各材料は名前と分量から構成されています。例えば、上のレシピの一つ目の材料は「豚薄切り肉」が名前で、「200g」が分量です。 さて、この材料名はこのレシピでは「豚薄切り肉」という表現でした。しかし、他のレシピでは「豚うす切り肉」という表現かもしれません。「豚うすぎり肉」や「ぶた薄切り肉」、「豚薄ぎり肉」等の表現もありえますね。 これは異表記同義(いわゆる表記揺れ)の問題ですが、同様の問題は他にも沢山あります。例えば、以下のようなものです。

    Encoder-Decoder でレシピの材料名を正規化する - クックパッド開発者ブログ
    YAA
    YAA 2017/10/31
  • 情報201 論文「蝦夷の首長アテルイと枚方市」

    『史敏』(大阪大学大学院文学研究科日史研究室)2006春号(通巻3号)に掲載されている馬部隆弘氏(大阪大学大学院生)の論文。副題には「官民一体となった史蹟の捏造」とある。枚方市牧野阪の牧野公園内に存在するアテルイの「首塚」とされるものについて、「そのような伝承があった形跡は全く認められない」とし、なぜこのような「突飛な説が定着」しつつあるのかの分析を興味深い資料の紹介とともに進めている。馬部氏はまず、「明治以降アテルイ処刑地を宇山とする説がある一方で、地元では一切その伝承がなく、反面一九八○年前後になってアテルイの「首塚」と称されるものが、宇山(近世宇山村)内ではなく隣接する牧野阪(近世坂村)に突如として生まれた」ことから、これは「現代に創造された史蹟由緒といってよい」とする。そして、その経緯を示すものとして、枚方市の市史編纂室担当者であった田宮久史氏による1990.5.25付けのメモ「

    情報201 論文「蝦夷の首長アテルイと枚方市」
    YAA
    YAA 2017/10/31
    >副題には「官民一体となった史蹟の捏造」