国立大学法人 北陸先端科学技術大学院大学 〒923-1292 石川県能美市旭台1-1 (代表)0761-51-1111
国立大学法人 北陸先端科学技術大学院大学 〒923-1292 石川県能美市旭台1-1 (代表)0761-51-1111
データ解析やデータマイニングは定型化したデータを対象としている。データの定型化とは、研究対象の特徴を項目(変数)ごとに分け、表形式(あるいは配列形式)にまとめたものを指す。しかし、われわれの周辺の多くのデータは定型化されていない。 定型化されていないデータの最も典型的な例は、文章(あるいは文書)である。文章とは、何らかの文字列が一定の文法規則に基づいた文の集合体を指す。従って、日記、小説、新聞記事、メール、ブログ文、演説文などは文章と呼ぶが、メーリングリストのログ、遺伝子やウイルスの情報を記号列で表記したものを文章と呼ぶには違和感を持つ方も少なくないようである。そこで、本稿では、記号列が何らかの規則に従って並べられた集合体をテキストと呼ぶことにする。 情報システムの普及とあいまって、テキストデータが急速に増加している。対象を絞っても一つ一つ目を通して分析するのは時間と労力がかかり、効率的に
ミネルヴァ書房から大津由紀雄編著 『はじめて学ぶ言語学---ことばの世界を探る17章』 を出版しました。341ページで、2800円プラス税という価格です。まもなく、書店の店頭に並び始めるはずです。もちろん、アマゾンなどのネット書店からも購入可能です。 総論(大津由紀雄)、音韻論(...
追記(2020/12/28) 改訂版を書きました。解説・表現を見直し,少し読書案内を追加しました。 dlit.hatenadiary.com はじめに というわけで、宣言どおり「水からの伝言」に対する言語学的な視点からの反論を書いておくことにします。 これまでこのブログではこういう話題は全然取り上げてこなかったので突然に思われるかもしれません。web上でこの話題に出会ってからかなり多くの関連サイトをのぞいて勉強させていただきましたが、「言葉」の役割がかなり大きい問題であるにも関わらず、言語学的な問題に焦点を当てた反論というのは管見の限り見つかっていません(いや、色んなところでちょっとずつ触れられてはいて、それで議論はほとんど尽きてさえいるのですが…例えば”http://www.cm.kj.yamagata-u.ac.jp/blog/index.php?logid=3571”ではこのエントリ
2008 年 11 月 9 日に専修大学で行なわれたシンポジウム「生成文法の可能性」に参加し、いつもブログ上でお世話になっている id:dlit さんともお会いすることが出来ました。お会いした感想としては同じく、若け〜というのと、やっぱり言語学の方はきれるな〜という。シンポジウム後はお互い多忙で、ゆっくりお話も出来ませんでしたが、またお会いする機会はあると思いますので、今後ともよろしくお願いいたします。 レポートは dlit さんがこちら (シンポジウム「生成文法の可能性」レポ - 誰がログ) で丁寧にやってくださっているので、僕は、そこで挙げられている質問にお答えしたいと思います。ちなみにここでの回答はあくまで僕個人の見解でありまして、所属する研究室や共同研究者の意見とは関係があるかもしれませんし、ないかもしれません(笑)。 さて、dlit さんのご質問として ある刺激に対して言語能力に
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く