タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

unnnaturallanguageprocessingに関するstardiverのブックマーク (5)

  • 第26回 ギャル文字や伏せ字などの自動判読技術の開発に 斬新なアイデアと豊富な言語処理技術の蓄積で成功 | すすめ! KDDI 研究所 | KDDI株式会社

    インターネットの普及により、一般の方がウェブの掲示板やブログ、ツイッターなどで情報を発信する機会が増えてきました。ただ、その中には健全な情報に紛れ、誹謗・中傷や犯罪予告などの違法・有害な書き込みも見受けられます。そこで注目されているのが、こうした情報を言語解析によって自動的に検出する技術です。また、ウェブの書き込みを解析して一般消費者の意見や動向をつかみ、商品開発やマーケティングに生かそうという評判解析も進められています。 ところが、こうした文には、「ヵゎぃぃ(=かわいい)」「ゎナ=∪は(=わたしは)」などのギャル文字、「困っちゃうなぁ~」といった口語、「KD●I研究所」のような伏せ字など、「くだけた表現」を含んでいることがあります。現在の言語解析技術は、新聞などの正しい表現で書かれた文なら正確に解析できます。ところが、くだけた表現には対応できず、600万文のブログを解析したところ、65万

  • LUULULU | Eiji ARAMAKI, Ph.D.

    Eiji ARAMAKI, Ph.D. Professor, NAIST, Japan B.S. Kyoto University, 2000. Ph.D. University of Tokyo, 2005. 荒牧英治 奈良先端科学技術大学院大学・ 先端科学技術研究科・ ソーシャル・コンピューティング研究室・教授 CREST「バイオDX」研究代表者 2000: 京都大学・総合人間学部・卒業. 2005: 東京大学大学院・情報理工学系研究科・修了;博士(情報理工学) natural language processing for medical medical applications of social media see ▶︎[RESEARCH page] (English). 電子カルテテキストの解析,医療コミュニケーション解析,ソーシャルメディアの医療応用など. 多くを学べる機会を

  • 圧縮新聞

    圧縮新聞はその日の最新ニュースをマルコフ連鎖でまとめて圧縮したものです。 ざっと眺めるだけでその日起こった事件が何となくわかる可能性がありますが保証はしません。 リロードするたび文章は変わります。 Twitter版もできました。 インタビュー特集や、映画『虹色デイズ』に出演する佐野玲於・中川大志・高杉真宙・横浜流星の座談会なども掲載。 詳しい観測が必要だと皮肉った。 長期間にわたり血糖値がコントロールできない状態が続くと、毛細血管がダメージを受けます。やがて目(網膜)や腎臓の毛細血管に障害が起き、網膜症や腎臓病などの合併症を発症することが理想だ。

  • luululu.com

  • 確かに“読めてしまう”コピペに2ch住人が「人間すげー」と驚く

    「なんだこりゃ」と思ってよく“読んで”みると「へー」と驚くコピペ文章が最近2ちゃんねるに登場し、スレッド(スレ)の題そっちのけでコピペに関する考察レスが交わされる……なんてことも起きている。 コピペ文はひらがなとカタカナだけで書かれており、一見すると2chでたまに見かけるうわごとにしか見えない。だがよくよく“読んで”みると、「確かに読める」と、ちょっと驚く。どうして「読める」のかは、コピペ文自体が説明してくれている。 「【ネット】「ウィキペディアが与える影響を調べるため」学生がもっともらしい嘘の書き込み 多数の欧米大手紙がだまされて引用」では、このコピペが2レス目に登場。「読めた」「人間の脳すげー」といったレスが相次ぎ、題へのレスと入り交じって何のスレなのか分からない状態になっていた。 コピペが登場したスレには、人の記憶と認識に仕組みについて考察や、読める人と読めない人の違い、現象学的

    確かに“読めてしまう”コピペに2ch住人が「人間すげー」と驚く
  • 1