Terminology extraction (also known as term extraction, glossary extraction, term recognition, or terminology mining) is a subtask of information extraction. The goal of terminology extraction is to automatically extract relevant terms from a given corpus.[1] In the semantic web era, a growing number of communities and networked enterprises started to access and interoperate through the internet. M
大漢和辞典⇔UCS対応表 本データ(dkw2ucs.txt)は、大漢和辞典(諸橋大漢和・大修館)の番号(大漢和番号)とUCS/Unicode漢字・注音文字の対応を示します。
『Google』が提供しているサービス『Google翻訳』で面白い珍翻訳を発見したので紹介したい。面白いというより少し下品な翻訳の内容は和英訳によるもので、日本語の「尺八」を英語に翻訳すると「Blow job」と訳されて表示される。 「Blow job」の意味に関しては様々な事情によりここでは説明できないので、『Google』で調べてほしい。遠回しに説明するとアダルト的な用語。何故か「尺八」から翻訳できてしまうのだ。もちろん日本でも同じ意味で使われていたりするのだが……。 Google翻訳は以前から誤訳や珍訳があり、例えば「Mary has a guitar.(メアリーはギターを持っています)」という文章が「メアリーはギターをしています」という文章に翻訳されてしまったり、さらには「miku」と英和翻訳すると「初音ミク」になったりと高性能なのか低性能なのかわからない柔軟性を持っている。翻訳結
今年は機械翻訳をやりたいというD1の人が1人、M2の人が1人、M1の人が2人いるので、研究室内で機械翻訳勉強会が盛り上がりそうな雰囲気を受けるのだが、自分も大学院に来たときは機械翻訳を研究しようと思っていたので、研究グループができるのは嬉しいことである。 自分が入試のときに書いた小論文にも、機械翻訳がやりたい、と書いてある(公開していて恥をさらしているのだが、他の人がどういうのを書いているのか見るのも参考になる人もいるだろうし、公開し続けている)。松本先生からは入試の面接のとき「機械翻訳を研究テーマにするのは難しいかもしれないけど、入学したらおいおい分かってくるだろうから、これだけしかやりたくない、と思わず柔軟に考えて来てください」というようなことを言われたのを覚えている。 実際、機械翻訳を大学院でのメイン研究テーマにするのは難しく、自分はいろいろ模索した末、NTT 研究所の永田さんが「統
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く