2020年9月28日のブックマーク (7件)

  • 機械翻訳は海外貿易にどのような影響を与えているのか?

    機械学習を取り入れた機械翻訳は、無料のものでも高い精度を持つサービスがいくつも提供されており、海外の論文やウェブサイトを読んだりの異国の人と交流したりするときなど、さまざまな面で役立っています。機械翻訳は経済においても重要な役割を果たしており、インターネットオークションサイトeBayが機械翻訳を導入したことでどのくらい売り上げに変化があったかを全米経済研究所の調査チームが報告しています。 Does Machine Translation Affect International Trade? Evidence from a Large Digital Platform (PDFファイル)https://www.nber.org/papers/w24917.pdf eBay独自の機械学習システムを搭載した機械翻訳「eMT」は、購入者の母国語で記載されていないアイテムの特徴をわかりやすく翻訳す

    機械翻訳は海外貿易にどのような影響を与えているのか?
  • 言語処理でビジネスと医療の分野にアプローチ – 新型コロナウイルス感染症の研究にも着手 | AI専門ニュースメディア AINOW

    こんにちは、AINOW編集部のゆーどーです。 2020年6月から、新型コロナウイルスの感染拡大の影響で、各地でAI人工知能)を搭載した検温システムが導入されています。しかし、コロナウイルス感染拡大下において、AI人工知能)は検温システム以外にも創薬研究などの分野で活躍を見せています。 今回は、創薬の研究やその他にも幅広い分野でAIソリューションを開発するFRONTEOの山氏にインタビューしました。 山 麻理:広告代理店に入社後、リスクマネジメント会社に在籍。メンタルヘルスケア事業を立上げ、事業計画、商品開発、マーケティング、営業戦略を実行し業界トップシェアへと導く。2014年に同社取締役に就任し、2017年に東証一部上場を実現。2018年12月よりFRONTEOに参画、2019年6月より執行役員として社長室およびライフサイエンスAI事業を牽引。2020年6月に取締役に就任し、AI

    言語処理でビジネスと医療の分野にアプローチ – 新型コロナウイルス感染症の研究にも着手 | AI専門ニュースメディア AINOW
  • 「コンピューター」と「コンピュータ」どちらで書いてもよいのでしょうか - ことばの疑問 - ことば研究館

    「コンピューター」と「コンピュータ」と両方の表記を見掛けますが、どちらで書いてもよいのでしょうか。 ※ この記事の初出は『新「ことば」シリーズ』19号(2006、国立国語研究所)です。当時の雰囲気を感じられる「ことばのタイムカプセル」として、若干の修正を加えた上で公開します。 外来語の表記のよりどころ 法令・公用文や報道など、一般の社会生活における外来語表記のよりどころとして「外来語の表記」(1991年、内閣告示・内閣訓令)があります。「外来語の表記」は、外来語を書き表すのに用いる仮名・符号の表(第1表と第2表)と留意事項、付録の用例集から成ります。二つの表のうち、第1表は一般的に外来語を書き表すのに用いる仮名の表で、第2表は原音・原つづりになるべく近く書き表す場合に用いる仮名の表です。第2表には「ウィ」「トゥ」「ヴァ」などが示されています。なお「外来語の表記」では、第2表の仮名を用いる必

    「コンピューター」と「コンピュータ」どちらで書いてもよいのでしょうか - ことばの疑問 - ことば研究館
  • 形態素解析のための現代国文法入門(002) 分かち書きを持つ語と持たない語 | raspiworks.tokyo

  • アレン研究所、AI言語モデルに蔓延する毒性を発見

    アレン人工知能研究所の研究者は、AI言語モデルから人種差別的、性差別的、またはその他の有害な反応を引き出すためのデータセット「RealToxicityPrompts」を作成し、モデルがこれらの反応を好むかどうかを測定する方法として試みた。実験では、現在の機械学習技術では有毒な出力を十分に防ぐことができず、より良いトレーニングセットとモデルアーキテクチャの必要性が強調されていることがわかったと主張している。 arXivに投稿された論文によると、モデルが訓練されたデータのバイアスを増幅することはよく知られている。データの一部は、性別、人種、宗教的な偏見が蔓延しているコミュニティからのものであることが多いため、これは言語領域では問題となる。AI研究会社OpenAIは、これが「いたずら」や「吸われた」などの単語を女性の代名詞の近くに置いたり、「イスラム教」を「テロリズム」のような単語の近くに置いた

    アレン研究所、AI言語モデルに蔓延する毒性を発見
  • キーワードに縛られないすばやい文書検索! 「Kaidoku SmartFind」提供開始

    社内のナレッジシェアには社内データの共有が欠かせない。しかし、膨大な文書データから自分が必要とするデータを検索するには結構な時間がかかる。それは、一見便利なキーワード検索という方法が実は非効率な面を持っているからかもしれない。 そんなキーワード検索の非効率さに着目したのが最先端のAI技術を開発・提供する株式会社Cogent Labs。このたび、従来とは違う方法でより迅速に必要とするデータにたどり着くサービス「Kaidoku SmartFind」を開発、2020年9月24日よりβ版を公開した。 自然文からも検索できる 「Kaidoku SmartFind」は、同社が提供中の自然言語処理エンジンプラットフォーム「Kaidoku」を活用した企業内データ検索サービスだ。 同サービスは、自然言語処理アルゴリズムを活用することで「自然文」から該当する文書を瞬時に提示することが可能。もちろんこのとき、キ

    キーワードに縛られないすばやい文書検索! 「Kaidoku SmartFind」提供開始
  • 【初心者向け】自然言語処理界隈を盛り上げるアルゴリズム・モデルまとめ - Qiita

    はじめに 最近の自然言語処理界の発展スピードがあまりにも早い。 Deep Learningの汎用化に伴い、自然言語処理界にもAIの波が押し寄せている。 直近で最も世間を騒がせたのはおそらくBERTという研究だと思われる。 ・【図解】BERTとは?Googleの新自然言語処理がどう影響するのか ・Googleの検索エンジンに「過去5年で最大の飛躍」。新たな言語処理モデル「BERT」の秘密 論文発表でもBERTを使ってこんなことができました、あんなことをやってみましたという内容が多いように思う。 しかし、すでにBERTを超える研究結果が報告されているのも事実で、BERTに負けるなと、世界中で盛んに研究が進んでいるようだ。 数多くの技術がでてきているが、一覧として紹介されている記事はあまり見られなかったので、ここに残す。 BERT[2018年10月発表] 2018年にブレイクスルーをおこした最も

    【初心者向け】自然言語処理界隈を盛り上げるアルゴリズム・モデルまとめ - Qiita
    gengohouse
    gengohouse 2020/09/28
    BERT/Transformer-XL/XLNet/RoBERTa/ALBERT/T5/ERNIE/Reformerの一言紹介と、論文、GitHub、参考記事へのリンク