ATOKの方が賢いとか言われてるけど、それってホント? めんどくさいので以下ATOK 2007はATOK、MS Office IME 2007はIMEと表記。 文節区切り間違い 昔から、一発で正解を出す確率というのは両者ともあまり変わらないけれども、ATOKの方は文節区切り間違いが多くて単語間違いは少ない、IMEの方は文節区切り間違いは少ないが単語間違いが多い、という風に言われていたが、それは2007になっても同じようである。 ただ、語彙数はATOKの方がかなり多いらしい。(参考) ATOKの方が文節区切り間違いが多いというのは、変換アルゴリズムの違いに起因していると考えられる。 両者の方式はそれぞれATOKの方が最長文節一致法、IMEの方はコスト最小法がベースである。 最長文節一致法というのは、文節(名詞・動詞等+付属語)の長さが最も長くなる文節区切りが正解となるもので、コスト最小法とい
特集 こ こま で 語処理 然言 自 きた 6 コーパスに基づく 言語処理の限界と展望 matsu@is.aist-nara.ac.jp 松本 裕治 徳永 健伸 take@cl.cs.titech.ac.jp 奈良先端科学技術大学院大学情報科学研究科 東京工業大学大学院情報理工学研究科 1990 年代に入って盛んになった「コーパスに基づ く言語処理」の研究は,過去 10 年で処理のほとんど あらゆる分野に浸透した.現在では,コーパスに基づ く手法は,重要な方法論として言語処理の一大分野 をなしているといえる. 本稿では,まずその背景,適用範囲,現状につい て概観する.その後,コーパスに基づく言語処理の得 失と評価における問題点について述べ,今後の展望 について論じる. 模のテキストデータや電子化辞書が今では廉価なパ ーソナルコンピュータでも簡単に扱うことができる. 3
2008年07月01日03:27 31年前の加藤智大 秋葉原通り魔事件の加藤智大容疑者はトヨタの工員で、彼女ができないからああいうことをやったと自供してるということなんで、1977年のこの事件が引き合いに出されるかと思っていたのですが、どうもあんまり取り上げられていないみたいなので記しておきます。 昭和52年(1977).5.30〔23歳がモテないのでむしゃくしゃして連続通り魔殺人〕 大阪府寝屋川市の路上で、トヨタオート大阪のセールスマン(23)が、通行中の男性(48)の胸をいきなり包丁で刺し、倒れたところを馬乗りになって全身9ヶ所をめった刺しにして殺害した。6.1に大阪市の路上で、通行中の主婦(28)の胸をいきなり包丁で刺し、倒れたところを馬乗りになって4ヶ所をめった刺しにして殺害して逃走、すぐに逮捕された。 京都産業大学外国語学部を卒業して4月から自動車セールスマンになったが一台も売れ
首尾一貫性に基づく作者の意図の擁護、を論駁する(『文学をめぐる理論と常識』について) - kugyoを埋葬する 上記の記事について、id:optical_frogさんより、論証に問題点があるとの鋭いご指摘をいただきました。以下の記事です: kugyoさんへの提案:文/発話および現実/虚構の意図を区別すると便利です(多分) - left over junk 今回はこのoptical_frogさんの「提案」について、応答させていただきたいと思います。optical_frogさんの「提案」とは、次のようなものです: 「反駁(2)」での例が言語ではなくて似顔絵なので,主張が十分に支持されない→“言語を例に議論しよう” 一般に文の成立に話し手の意図は不要 発話に関しては話し手とその意図を考えなくてはいけない→“文/発話を区別しよう” 場合により,発話の意図は虚構のものであってもかまわない→“現実の話
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く