タグ

自然言語処理に関するxenomaのブックマーク (2)

  • キーフレーズ抽出API の紹介

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、日語処理技術部の阿久津剛之です。 Yahoo!デベロッパーネットワークにて、キーフレーズ抽出APIを公開しましたので紹介します。 キーフレーズ抽出APIとは、与えられた文章から、その文章を特徴づける重要な部分(キーフレーズ)を抽出し、独自の算出方法により点数付けを行って返すAPIです。 例えば、「東京ミッドタウンから青山一丁目駅まで歩いて15分かかります」という文章をキーフレーズ抽出APIに与えると、 「東京ミッドタウン」「青山一丁目駅」「15分」 という結果が返ってきます。 ここで、「青山一丁目駅」に注目してみましょう。 「青山一丁目駅」は、日形態素解析APIを用いて解析すると、 青山 / 一 / 丁目 / 駅

    キーフレーズ抽出API の紹介
  • asahi.com(朝日新聞社):疑惑の論文200本発見 米大が盗作探知プログラム開発 - サイエンス

    米テキサス大のチームが盗作が疑われる医学論文約200を見つけ出し、著者や編集者に見解を問いただした。「盗作された側」は「露骨な盗作」とあきれかえるが、「盗作した側」は、「先に論文が出ていたとは知らなかった」と言い訳が目立った。こうした盗作の実態が明らかになるのは珍しい。  6日付の米科学誌サイエンスが掲載する。  チームは、米国立医学図書館が運営する医学・生命科学の論文データベースを対象に独自開発のプログラムを使って表現の相似性を調べ、著者が異なっていた約9千を抽出。実際に論文を読んで212を「盗作の可能性がある」と判断した。著者や掲載紙の編集者と連絡のとれた163について電子メールでアンケートを行った。  「盗作された側」の著者からは「こんな露骨な盗作は初めて」「科学者として受け入れたくない」など厳しい反応が多い。一方、「盗作した側」は「データ借用の許可をとらなかったことは謝罪し

  • 1