機械学習を取り入れた機械翻訳は、無料のものでも高い精度を持つサービスがいくつも提供されており、海外の論文やウェブサイトを読んだりの異国の人と交流したりするときなど、さまざまな面で役立っています。機械翻訳は経済においても重要な役割を果たしており、インターネットオークションサイトeBayが機械翻訳を導入したことでどのくらい売り上げに変化があったかを全米経済研究所の調査チームが報告しています。 Does Machine Translation Affect International Trade? Evidence from a Large Digital Platform (PDFファイル)https://www.nber.org/papers/w24917.pdf eBay独自の機械学習システムを搭載した機械翻訳「eMT」は、購入者の母国語で記載されていないアイテムの特徴をわかりやすく翻訳す
TOP > プレスリリース一覧 > 「その他IT・インターネット (企業向け)」のプレスリリース > 機械翻訳エンジン開発の老舗企業、高電社が 法人向けAI翻訳サービス 「kode-AI翻訳... 株式会社高電社(本社:東京都千代田区、代表取締役社長:高 京徹)は、2020年10月2日(金)、ニューラルネットワークを利用した高精度のAI翻訳サービス「kode-AI翻訳 Officeクラウド」(読み方:コードエーアイホンヤク オフィスクラウド)を発売します。1980年代から多言語IMEやルールベース(※1)に基づく手法で翻訳エンジンを開発してきた高電社が、自信を持ってリリースする42言語(※2)対応の法人向け・年額制のクラウド翻訳サービスです。 画面イメージ_テキスト翻訳 <高速・高精度の英日、日中翻訳> あらゆる分野の対訳データを10億ペア相当の単位で学習させることにより、汎用でありながら
NLPのコンペティションなどで、データの水増し(Data Augmentation)のために、逆翻訳をPythonでしたい時ありませんか? 例えば、Kaggleの「Toxic Comment Classification Challenge」では 1st place solution にこの手法が用いられていたりします。 https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge/discussion/52557 この記事では、Pythonで機械翻訳を用いて、簡単に逆翻訳をする方法について説明します。 機械翻訳による逆翻訳の例 引用: https://amitness.com/2020/05/data-augmentation-for-nlp/ 概要 googletrans を使えば、APIキーなど不要で、簡
Googleが自然言語モデル「BERT」における高精度な多言語埋め込みを可能にする「Language-agnostic BERT sentence embedding model(LaBSE)」を発表しました。LaBSEは109もの言語を事前学習しており、学習データにない言語でも高精度な処理を行うことが可能です。 Google AI Blog: Language-Agnostic BERT Sentence Embedding https://ai.googleblog.com/2020/08/language-agnostic-bert-sentence.html 自然言語モデルにおいては、文章をベクトル空間に展開する「埋め込み」を行う必要があり、多言語を扱う言語モデルでは、異なる言語による文章を同じベクトル空間に埋め込む必要があります。FacebookのLASERやm~USEといった多
改変履歴 '21/1/26 DeepLのテキストエリアのCSSセレクタが変更になったようなので、関数の方も修正。 `21/5/18 またまたCSSセレクタが変更になったようなので、修正 やりたいこと とりあえず、Science Directから書誌情報+アブストをゲットした。次は、これをDeepLに流し込んで翻訳させていく、っていう処理をしたい。有料プランに契約すれば、ファイルを一気に翻訳させることが可能になるけど、まあ、ものは試しということでselenimuとchromedriverでやってみようということでチャレンジ。 準備 とりあえずCSVファイルをpythonに読み込む。 import pandas as pd df = pd.read_csv("DB.csv",header=None, delimiter=",", quoting=1) print(df.at[0,1]) # タ
【Python】英文PDF(に限らないけど)をDeepLやGoogle翻訳で自動で翻訳させてテキストファイルにしてしまおう。PythonSeleniumPDF翻訳 8/6追記 出力結果を見やすくする改良を加えました 続【Python】英文PDF(に限らないけど)をDeepLやGoogle翻訳で自動で翻訳させてテキストファイル、いやHTMLにしてしまおう。 はじめに 英語論文、読むのしんどいですよね。翻訳してもらいましょう、見通しがグッと良くなりますよ。 ※文中ではPDF用のように書いていますが要はクリップボードに翻訳したい文をコピーできれば使えます。 方法 PDFを翻訳する際に問題となるのがPDFファイルの扱いにくさです。 ライブラリに頼って自動で文字を抽出せようにも上手く行かなかったり、文の順番がめちゃくちゃになったりします。 そこで今回はクリップボード経由で翻訳したいと思います。 流れ
(CNN Business) 日本でロボット製作を進めていたベンチャー企業が、その技術を応用して新型コロナウイルス感染のパンデミック(世界的大流行)に対応した「スマートマスク」を開発し、話題を呼んでいる。 ドーナッツ・ロボティクス社の小野泰助CEO(最高経営責任者)によると、スマートマスク「C―FACE」は通常のマスクの上に装着し、スマートフォンのアプリと連携させて使う。 素材はプラスチックとシリコン。内蔵マイクと自分のスマホを近距離無線通信「ブルートゥース」でつなぎ、音声を文字で表示したり増幅したり、翻訳したりすることができる。 翻訳機能は日本語と英語のほか中国、韓国、ベトナム、インドネシア、スペイン、フランスの各言語に対応。スマホとの距離は最大10メートルまであけられる。 同社は2014年、小野氏とチーフ・エンジニアの岡部崇史氏が福岡県北九州市内のガレージで創業。羽田空港の翻訳ロボット
大手ネット企業が「予測力」の改善に力を入れている。かつては「まったく使えない」と揶揄されていた「グーグル翻訳」はどんどん精度を上げているほか、アマゾンは顧客の購入に基づいて、将来的には顧客が注文する前に「欲しがっていることが予測される」商品を配送するサービスを思案している。 アマゾンの予測的中率は現在5%程度 企業の幹部から私たちが最も頻繁に受ける質問をひとつ挙げるなら、「AIはわれわれのビジネス戦略にどのような影響を与えるのだろうか」という質問だろう。それに答えるため、ここで思考実験を行ってみよう。 ほとんどの人たちは、アマゾンでの買い物に慣れている。そしてたいていのオンライン小売業者を相手にする場合と同じく、あなたはアマゾンのウェブサイトを訪れ、目指す商品を買い求め、カートに入れる。支払い手続きを済ますと、アマゾンから商品が送られてくる。現在、アマゾンはこの「ショッピング・ゼン・シッピ
米Googleは8月4日、昨年10月の「Made by Google」イベントで発表し、米国では4月に発売した無線イヤフォン「Pixel Buds」を日本でも発売すると発表した。価格は2万800円(税込)で、8月20日にオンラインのGoogle Store他、ソフトバンクとau、主な量販店で発売する。 スマートフォン(AndroidおよびiOS)やPCとBluetoothで接続し、Pixel Budsのマイクに「Hey Google」と発声するか、パッドを長押しすることで「Googleアシスタント」を起動して様々な操作を行える。 PixelシリーズあるいはAndroid 6.0以降搭載のスマートフォンとの組み合わせでは、リアルタイム翻訳機能を利用できる。現在、日本語、英語を含む40カ国語に対応する(対応言語一覧)。 パッドでの操作はGoogleアシスタントの起動の他、1回のタップで再生中の
グローバルSIM付きポータブル音声翻訳機が便利そう。早く海外旅行行きたい…2020.07.27 13:00 塚本直樹 使用時間にお気をつけを。 海外旅行の際に心強い味方となってくれる、翻訳デバイス。そんな翻訳デバイスに2年間のグローバルSIMが付属した「2YSIM KAZUNA eTalk5」が、ECサイトにて販売されています。 2YSIM KAZUNA eTalk5は、英語や中国語、韓国語など73言語に対応した翻訳デバイス。オンラインだけでなくオフライン翻訳にも対応し、翻訳履歴をCSVで出力することもできます。 本体には3.5インチディスプレイを搭載し、翻訳結果を見やすく表示。またタップすることで音声が流れます。ボタンを押しての音声翻訳だけでなく、カメラで撮影した文字の翻訳も可能。レストランで活躍しそうな機能です。 通信機能としては各国のモバイル通信サービスが利用でき、テザリングによる周
概要 Google翻訳APIをPythonで実行するでは、四苦八苦しながらも、Google翻訳APIにより、テキストファイルに書かれた英文を日本語に翻訳するPythonスクリプトを書いた。 元々の動機は論文の翻訳する際に、ちまちまGoogle翻訳にコピペするのが面倒くさいということであった。 そこで今回は、Pythonスクリプトを拡張し、PDFの論文を一気に翻訳するようにしたので共有したい。 そもそもなんで日本語に翻訳して論文を読むの? もちろん、細かい内容は原文を精読する必要がある。そりゃそうだ。 日本語で読む理由はなんといっても、論文の内容を俯瞰的に把握できるということに尽きる。 俯瞰的に把握できることで、以下のメリットがある。 俯瞰的に把握した上で原文を読むことになるため、より早く理解することができる。 俯瞰的に把握できるため、原文を読む前に、自分にとって読む必要がある論文かどうかか
独ベンチャー企業発の「DeepL翻訳」が、グーグル翻訳より高評価を受けている。AERA 2020年7月27日号は、その実力を検証した。 【表】グーグル、が堂々の1位!「辞めたけど良かった企業」ランキング100はこちら! * * * 「もう、単に英語ができるだけの翻訳者は生き残れません。(インターネット上で文章を翻訳できる)翻訳エンジンでかなりのレベルの訳ができる時代になってしまい、専門分野を持っているか、ネイティブと同程度の知識がないと仕事ができなくなると感じています」 こう話すのは、英語翻訳も手がけるフリーランスの男性(34)だ。男性の元にはここ数年、日本語をゼロから訳すのではなく、クライアントが翻訳エンジンで訳したとみられる英文を校正する仕事が舞い込むようになった。「そこそこ正確」なものが多く、当然ながら仕事の単価は下がる。以前は時折あった「意味さえ通じればいいから早く」というオー
伊賀市東条の府中小学校(藪中俊典校長)で、保護者と教職員で組織する「親師会」(PTA)から寄贈された自動翻訳機が活躍している。学校を取り巻く「言葉の壁」を乗り越えるための一つの手段として、注目されつつある。【寄贈した自動翻訳機を手にする森喜会長(右)と藪中校長=伊賀市東条で】 同小は佐那具町、千歳など府中地区の児童200人が通う中規模校。うち外国にルーツがある児童が全体の13%に当たる26人(ブラジル24人、ペルー2人)。これは上野西、上野東に次いで3番目の多さで、児童数に占める割合は最も高い。 そのうち22人は日本生まれで、友だちとの会話に不自由はないというが、各家庭では親とポルトガル語やスペイン語で会話している児童がほとんど。藪中校長は「授業の学習言語を理解したり、自分の考えを発表したり、文章に表したりすることには難しさを感じている」と話す。 こうしたなか、親師会が「子どもたちの学習や
Googleが古代エジプトの象形文字を翻訳するツール「FABRICIUS」を発表2020.07.22 07:0017,822 岡本玄介 象形文字はSNS時代の絵文字と同じということも理解できます。 GoogleのArts & Cultureに、機械学習を利用し、古代エジプトのヒエログリフを翻訳するツール「FABRICIUS」が登場しました。 人類で早い段階、紀元前3200年頃~400年頃に生み出されたという古代エジプトの象形文字。エジプト学者たちは、ロゼッタ・ストーン発見を皮切りに200年間も同じ方法で、それを翻訳し続けてきた歴史を持っています。ですが今は機械学習のおかげで、作業時間を大幅に短縮できるようになったのです。 Video: Google Arts & Culture/YouTube遊びながら学べる「FABRICIUS」 のサイトでは、ユーザーは「LEARN」「PLAY」「WOR
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く