タグ

algorithmとlinguaに関するyuguiのブックマーク (7)

  • エブログ マルコフ連鎖で文章生成(JavaScript)

    マルコフ連鎖で文章生成(JavaScript) マルコフ連鎖による文章生成。マルコフ連鎖と言っていいのかあまり自信はないのだが、とりあえず文章を作ってはいる感じ。 テキストエリアに入力された文章を解析して、その中の単語を使って、自動生成します。文章生成ボタンを何度か押すと文章が変わっていくと思います。 意味不明であったり、そのままの文、同じ文が続けて出たりはしてしまいますが。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛を吹き、羊と遊んで暮して来た。けれども邪悪に対しては、人一倍に敏感であった。きょう未明メロスは村を出発し、野を越え山越え、十里はなれた此(こ)のシラクスの市にやって来た。 ここに文章が作成されます。 posted by knit at 19:45 | Comment(9)

    エブログ マルコフ連鎖で文章生成(JavaScript)
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
    yugui
    yugui 2006/07/10
    azzy: Javaプラットフォーム用の新型スペル・チェッカーAPI
  • 統計的確率論で言語を解析--Sematicsが世界初の日本語解析エンジンを開発

    語意味解析エンジンを開発するSematicsは6月15日、統計的確率論を用いた言語解析エンジン「Perceptron Engine」を開発したと発表した。統計的確率論を用いた日語解析エンジンは「世界初」(同社)という。 Perceptron Engineは「形態素解析」、「構文解析」、「文脈解析」、「意味解析」の4つの解析処理によって構成される。従来の言語解析技術は、辞書によるデータのマッチングにより処理されていたため、データ容量が膨大で、その処理に多大な時間を要した。一方、Perceptron Enginesは大規模な辞書を用いないため、少ないメモリやディスク容量でも高速処理が可能で、500文を1秒で解析できるという。 形態素解析とは、文章を形態素と呼ばれる、意味を持つ語句の最小単位まで分割して解析するもの。各語句を品詞単位、動詞や形容詞といった活用語句の場合はその活用形ごとに解析

    統計的確率論で言語を解析--Sematicsが世界初の日本語解析エンジンを開発
  • 辞書を使わずに同義語を解析する言語解析エンジン,Sematicsが発表

    Sematicsは6月15日,言語解析エンジンの最新版「Perceptron Engine」を発表した。語句の辞書データを使わずに解析するため高速という。同社の従来エンジン「Automaton Parser」で実現していた形態素解析と構文解析に加え,文脈解析と意味解析の機能を備えた。 同社の言語解析エンジンの特徴は,語句の辞書データを用いずに解析を行うこと。辞書が必要ないため,高速に処理できるほか,フット・プリントをコンパクトにできる。「(パソコンを使って)1センテンスを1000分の2秒で解析できる。500センテンスの解析は1秒で済む」(代表取締役の吹谷和雄氏)という。 同社が開発した第1号のエンジンであるAutomaton Parserは,統計的確率論によって,形態素解析と構文解析を実行するソフトである。語句を分割した最小単位である形態素ごとに分けて品詞を付与し,文節の係り受けを解析する

    辞書を使わずに同義語を解析する言語解析エンジン,Sematicsが発表
    yugui
    yugui 2006/06/15
    語句の類似性をベクトル空間上の距離でなく、位相幾何的に判断。
  • シソーラス(類語)検索

  • OBB vs AABB - Radium Software Development

    This domain may be for sale!

  • チョムスキー階層 - Wikipedia

    チョムスキー階層(チョムスキーかいそう、Chomsky hierarchy)は、形式言語を生成する形式文法の包含階層(形式言語の階層)で、句構造文法(phrase structure grammar)の階層」などともいう。1956年にノーム・チョムスキーが発表した。 形式文法の構成要素は、終端記号(terminal symbol)の有限集合(形式言語の単語で使われる文字)、非終端記号(nonterminal symbol)の有限集合、生成規則(production rule)の有限集合(各生成規則は右側と左側に記号列で構成される単語を含む)、開始記号(start symbol)から構成される。生成規則はある単語に適用され、規則の左側にある単語を右側にある記号列で置換する。導出は一連の規則適用過程である。このような文法で開始記号から始めて生成規則を適用していくことで、終端記号のみから構成され

    yugui
    yugui 2006/04/18
    type-0 帰納的可算言語 - type-3 正規言語
  • 1