いずい 宮城〜北海道。何かがフィット感が悪いなどで収まりが悪く、落ち着かない状態 他にもある? 標準語に格上げしていこう。
いずい 宮城〜北海道。何かがフィット感が悪いなどで収まりが悪く、落ち着かない状態 他にもある? 標準語に格上げしていこう。
「大学には所属していないけれど言語学を勉強してみたい。どうしたらいいの?」という質問をよくいただきます。 たしかに本屋さんや図書館には「言語学入門」と銘打った本がたくさんありますが、なかなか独学するのは難しいですよね。 かといって、大学あるいは大学院に入学するというのも大変ですし、そもそも大学院に行くために言語学を勉強してみたいという方もいらっしゃるかもしれません。 そこで、今回は大学以外で言語学を勉強する方法を考えてみたいと思います。 いくつか方法があります。 大学以外で言語学を勉強する動機意外に思われるかもしれませんが、「大学には所属していないけれど言語学を勉強してみたい! どうしたらいいの?」という質問、さまざまな場所でよくいただきます。 たとえば、一般向け講演会などで質問なさる方がいます。「自分は社会人で大学には通えないが言語に興味がある。言語学を勉強してみたい」とよくおっしゃって
固有名が翻訳されないのは、普通名詞のようにその機能の意味が同一なものが各言語において見いだせないからです。そもそも各固有名は意味においてあるわけではないのです。
(補注:このアーティクルの論考は、『かけ算には順序があるのか』岩波科学ライブラリーの第3章で整理されました。) http://www.iwanami.co.jp/.BOOKS/02/2/0295800.html 子どものとき疑問だったこの問題は、塾で教えるようになってから、数教協の本(特に遠山啓の本)を読んで、分離量・連続量という考え方を知って、氷解しました。私にとっては、数教協で目からウロコシリーズのベストスリーに入るものでしょう。ところが、mixiで発言したところ、なかなか同意を得られなかった。それ自体が、私にとって、新たな目からウロコシリーズでもありました。 http://mixi.jp/view_bbs.pl?id=42139232&comment_count=306&comm_id=63370 233番発言以降。 さて、 A:「2時から5時までは3時間。」 B:「2日から5日まで
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日本語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日本語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
工事中のお知らせ 鈴木健次のホームページ「バベルへの周遊」をご愛読いただきありがとうございます。 このたび、都合によりホームページの収容サイトを変更する事になりました。 新しいURL番号は下記の通りですが、しばらく工事は続きますのでご注意下さい。 http://www.geocities.jp/kenji370120/home/home.htm お手数をおかけしますがお許し下さいますよう。
“Hello, Internet!” WebKit’s core JavaScript engine just got a new interpreter, code-named SquirrelFish. SquirrelFish is fast—much faster than WebKit’s previous interpreter. Check out the numbers. On the SunSpider JavaScript benchmark, SquirrelFish is 1.6 times faster than WebKit’s previous interpreter. What Is SquirrelFish? SquirrelFish is a register-based, direct-threaded, high-level bytecode eng
<< 2008/02/ 1 1. [言語] 「ハッカーと画家」の著者が新しいLisp系言語「Arc」を公開 | エンタープライズ | マイコミジャーナル 2. 「セキュリティ、なめんなよ!」 なめねこも一緒に情報セキュリティ強化宣言 | ネット | マイコミジャーナル 3. 「サイオステクノロジーはグルージェントの未来技術に期待し子会社化」:ITpro 2 1. [Ruby] Nimble Method: Garbage Collection is Why Ruby on Rails is Slow: Patches to Improve Performance 5x; Memory Profiling 2. [言語] LuaJIT roadmap 2008 3. [Ruby] What will Matz do? 4. [Ruby] EURUKO 2008 − European Ruby
第80回知識ベースシステム研究会を開催したが,二日間で58名の方々に参加して頂き,積極的に議論に加わって頂いた.この場を借りて,参加してくれた方々に感謝したい.大変遅くなった(爆)が,Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を,このブログで報告しておきたい.工藤氏の専門分野は統計的自然言語処理と機械学習であるが,日本語形態素解析エンジンMeCabの開発者であり,他にも自然言語処理関連の有益なツールや,Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど,時代をリードする研究開発者の一人である.彼の活動に興味があれば,彼のブログ「きまぐれ日記」は必見だろう. なお,当日は弊社側の不手際で,予定していた工藤氏の重要なデモをおこなうことができなかった.弊社はネットワーク会社であるにもかかわらず,ネットワーク
百度で仕事をしていると、中国側のスタッフとも頻繁にメールのやりとりが発生します。すると、中国語のメールを受け取ることも多いです(日本語・中国語両方わかるスタッフが、僕にCCして中国語でメールを出す場合など)。ThunderBirdは別に中国語だって表示できるし問題ないのですが、中国語(簡体字)の文字コード(GB2312)の場合は、ちょっと見慣れないフォントになります。Windowsだと「MingLiU」というフォントです。そこまではいいのですが、中国にも日本語ができるスタッフが何人もいて、彼らとメールでやりとりをしていると、そのフォントで、なおかつ日本語で書かれたメールが来るときがあります。時には、中国語と日本語が両方書かれていることもある。UTF-8なのか?と思ったけど、その場合はフォントが変わるし、文字コードを調べてもGB2312になっているのに、日本語が表示されていて、なんでだろう、
講義資料 † 注: 直したつもりではありますが去年からの更新のし忘れで,python.logos.ic.i.u-tokyo.ac.jp というサーバ名が,ときどき marten.logos.ic.i.u-tokyo.ac.jp となっていることが有るかもしれません(もうないつもり).marten はすべからく pythonと読み替えてください ここには、講義のスライドや配布資料がアップされます。 ↑ テストデータ, reference情報など † 10/30 mini-Python文法 grammar.txt 10/30 字句解析器テストデータ tokenizer_test.tar.gz 11/14 構文木ヘッダsyntree.h.txt 11/14 構文木Cソースの一部syntree.c.txt 11/14 構文解析木ヘッダparser.h.txt 11/14 構文解析木Cソース一部al
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル
結城浩 (ゆうき ひろし) Java,Perlなどの書籍でおなじみの著者。 最新刊は「数学ガール」。 このイラストは結城浩さん書き下ろしのもの。 http://www.hyuki.com/ 日経ソフトウエア2007年8月号,特集のテーマはプログラミング言語のRubyです。「Ruby大作戦」と題した本特集の中で,Ruby作者のまつもとゆきひろ氏と,JavaやPerlの書籍や本誌連載の執筆,Web上での活動で著名な結城浩氏の対談を設けました。以下は,日経ソフトウエア2007年8月号に掲載した対談の全内容です。ぜひお楽しみください。なお,この対談では,お二人のファンで日経ソフトウエア特集「Ruby大作戦」のPart5にも寄稿いただいた松岡浩平氏にも同席していただきました。この対談でRubyに興味を持たれた方は,ぜひ日経ソフトウエア2007年8月号をお読みください。 はじめてのRuby ――結城さ
http://developer.yahoo.co.jp/jlp/ http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html なんかよさげなAPIがリリースされたようで。 Yahoo!の日本語形態素解析エンジンAPIを公開 - ITmedia NEWS http://codezine.jp/a/article/aid/1461.aspx http://japan.internet.com/webtech/20070618/3.html ヤフー、形態素解析のWebサービスを公開 − @IT おもしろそうなのでちょっと触ってみた。 んで、適当にモジュールをでっち上げてCPANにあげといた。 http://search.cpan.org/dist/WebService-YahooJapan-WebMA/ 使ってみたところ、レスポンスも結構速
For full functionality of this site it is necessary to enable JavaScript. Here are the instructions how to enable JavaScript in your web browser.
音素は発音上・音声上の単位で,書記素は文字の単位です。 音素は単独で発音できる最小の弁別的単位で,書記素はこれを文字に応用したもので,表記上の最小の弁別的単位です。 もちろん,文字は音声を表記するためのものですから,時として混同されてしまうのも無理はありません。 たとえば「さ」。 発音上はこれをさらに分解できます。 五十音表で「さ」「す」「せ」「そ」が同じ列に並んでいることは, /s/+/a,u,e,o/ と分解できることを表しています。 つまり発音する上で,さらに小さく分解できる以上,「さ」は音素ではありません。 しかし,文字表記の上でこれをさらに小さくはできません。たとえば横棒だけとりだしても,何の意味も音も持ちませんから。したがって,「さ」は書記素であるといえます。 アルファベットでは音素と書記素が一致するのが理想ですが,実際にはなかなかうまくいきません。英語の th とか,フランス
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く