タグ

2017年8月4日のブックマーク (4件)

  • LogoVista

    翻訳ソフトの要とも言える「翻訳エンジン」はどのような仕組みで動いているのでしょうか。 お客さま方からのご要望にお応えして、翻訳エンジンの内部をご紹介いたします。 2000年に弊社創設10周年を記念して作成いたしました「コリャ英和!解体新書」より、ロコヴィスタ翻訳ソフト「翻訳エンジン」開発の技術顧問、ハーバード大学言語学科 久野教授(当時)に解説していただきました。 翻訳エンジンの仕組みが分かれば、翻訳された文章をわかりやすく自分なりに解釈する方法が見えてきます。 より翻訳ソフトを有効に活用いただく手がかりとしていただければ幸いです。 ※最新版公開いたしました(20110907) 1.辞書引き では、機械翻訳の核である「構文解析」を、実例を用い、図解を交えながら追跡していってみましょう。 まず、辞書引きで、文中の単語に、品詞情報が割り当てられます。ここでは説明を簡単にするため、それぞれの単語

  • 計算機処理のための韓国語言語体系と形態素処理

    韓国語の言語処理, 特に韓国語を原言語もしくは目的言語とする機械翻訳における, 韓国語の言語体系と形態素処理手法を提案する. 論文の韓国語体系の特徴は, 機械処理を考慮した体系であるという点にある. すなわち, 形態素解析の解析精度や機械翻訳における品詞設定の必要性に応じて, 韓国語各品詞に対して仕様の検討を行ない, 設計を行なった. また分かち書きや音韻縮約といった韓国語の特徴をどのように機械処理すべきかについても述べる. 韓国形態素解析では, 品詞と単語の混合n-gramによる統計的手法を基としながら, 韓国語固有の問題に対しては残留文字などの概念を導入するなどして独自の対応を施した. 以上の品詞体系と形態素解析エンジンによって, 単語再現率99.1%, 単語適合率98.9%, 文正解率92T6%という良好な解析精度が得られた. また韓国語生成処理では, 特に分かち書き処理につい

  • 情報学広場:情報処理学会電子図書館

    ※ユーザ登録は無料です. 電子図書館のご利用にあたっては「情報処理学会電子図書館利用規約」をご遵守下さい。 情報学広場に掲載されているコンテンツには有料のものも含まれています。 有料コンテンツをご購入いただいた場合はクレジットカード決済のみとなります。 複写および転載をされる方へ一般社団法人情報処理学会では複写複製および転載複製に係る著作権を学術著作権協会に委託しています。当該利用をご希望の方は、学術著作権協会が提供している複製利用許諾システムもしくは転載許諾システムを通じて申請ください。 尚、会会員(賛助会員含む)および著者が転載利用の申請をされる場合については、学術目的利用に限り、無償で転載利用いただくことが可能です。ただし、利用の際には予め申請いただくようお願い致します。

  • Ckylark | Yusuke Oda

    Ckylark - An Latent Annotated PCFG Parser 概要 Ckylark (すかいらーく) は自然言語のための構文解析器です。 Latent Annotated PCFG (LAPCFG) というモデルを使用して高精度に文の構造を推定します。 インストール方法 必要なツール・ライブラリ Ckylark のインストールには以下のツール・ライブラリが必要です。 GCC-C++ 4.7 かそれ以降 Boost C++ Libraries 1.49 かそれ以降 autotools (configure の生成に使用) Python 3.2 かそれ以降 手順 Github 上の最新版 を入手します。 以下のコマンドを実行します。 $ cd /path/to/Ckylark $ autoreconf -i $ ./configure $ make $ (sudo) ma