タグ

ブックマーク / blog.livedoor.jp/tak_tak0 (2)

  • 機械翻訳に関するサーベイ : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 自然言語処理における統合的研究です。 まず、基礎知識として、後の機械翻訳へと受け継がれる研究は100年以上の昔から行われていました。 電子計算機が形作られる以前、 チューリングマシンよりずっと以前から、自動的に言語を他言語に翻訳するための研究は行われていました。 そういうことは大昔から世界中で考えられていたのです。 しかしながら、現在でも計算機による翻訳生成はまだまだ使えないように思われています。 その認識は完全に間違いです。 人間の翻訳の方がずっといい加減であり、機械翻訳の方が圧倒的に高性能であることは間違いないの

    機械翻訳に関するサーベイ : 研究開発
  • 日本語形態素解析器の作り方 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 日形態素解析(のルール作成方法)には、大別して2手法あるそうです。 ○手動で作成した規則による手法 文法、自然言語自体を規則化したものですが、基的には自然言語には例外が数多く存在し、ルール自体が非常に複雑になりがちです。 JUMANはこの方法です。 ○品詞タグ付きコーパスから学習された確率パラメータによる方法 コーパスの統計値から、 人手による形態素解析ルールの生成 を自動化したものです。 どちらの場合も、コストの与え方が違うだけで 分割した形態素と、形態素の接続とにコストを割り当て、そのコストが最小の分割を解

  • 1