[B! language] taloのブックマーク

talo id:talo

languageに関するtaloのブックマーク (64)

対応する標準語がない方言教えて
いずい宮城〜北海道。何かがフィット感が悪いなどで収まりが悪く、落ち着かない状態他にもある？標準語に格上げしていこう。
talo 2023/12/20
腸感冒

language

nippon

folk

nihongo
リンク
大学以外で言語学を勉強する方法｜長屋尚典
「大学には所属していないけれど言語学を勉強してみたい。どうしたらいいの?」という質問をよくいただきます。たしかに本屋さんや図書館には「言語学入門」と銘打った本がたくさんありますが、なかなか独学するのは難しいですよね。かといって、大学あるいは大学院に入学するというのも大変ですし、そもそも大学院に行くために言語学を勉強してみたいという方もいらっしゃるかもしれません。そこで、今回は大学以外で言語学を勉強する方法を考えてみたいと思います。いくつか方法があります。大学以外で言語学を勉強する動機意外に思われるかもしれませんが、「大学には所属していないけれど言語学を勉強してみたい! どうしたらいいの?」という質問、さまざまな場所でよくいただきます。たとえば、一般向け講演会などで質問なさる方がいます。「自分は社会人で大学には通えないが言語に興味がある。言語学を勉強してみたい」とよくおっしゃって
talo 2022/09/10
language

study

education
リンク
Shapecatcher: Draw the Unicode character you want!
You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.
talo 2011/11/14
tool

search

language
リンク
第１３章　固有名の本質的意味　目次
固有名が翻訳されないのは、普通名詞のようにその機能の意味が同一なものが各言語において見いだせないからです。そもそも各固有名は意味においてあるわけではないのです。
talo 2011/03/27
language

logic
リンク
Gestures as a language not a technology – Jeffrey Sambells
talo 2009/11/04
language

usability
リンク
『なぜ２時から５時までは３時間で、２日から５日までは４日間なのか？』
（補注：このアーティクルの論考は、『かけ算には順序があるのか』岩波科学ライブラリーの第3章で整理されました。） http://www.iwanami.co.jp/.BOOKS/02/2/0295800.html 子どものとき疑問だったこの問題は、塾で教えるようになってから、数教協の本（特に遠山啓の本）を読んで、分離量・連続量という考え方を知って、氷解しました。私にとっては、数教協で目からウロコシリーズのベストスリーに入るものでしょう。ところが、mixiで発言したところ、なかなか同意を得られなかった。それ自体が、私にとって、新たな目からウロコシリーズでもありました。 http://mixi.jp/view_bbs.pl?id=42139232&comment_count=306&comm_id=63370 233番発言以降。さて、Ａ：「２時から５時までは３時間。」Ｂ：「２日から５日まで
talo 2009/06/02
culture

language

math
リンク
Religion and Language
talo 2009/05/24
religion

language

brain
リンク
日本語 WordNet (wn-ja)
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに着想をえて、日本語のワードネットを構築し、オープンで公開します。独立行政法人情報通信研究機構（NICT）では、自然言語処理研究をサポートする一環として、2006年に日本語ワードネットの開発を開始しました。最初の版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
talo 2009/03/30
とりあえずブクマ

language

dictionary

nihongo
リンク
鈴木健次「バベル」への周遊－日本語から人類祖語へ
工事中のお知らせ鈴木健次のホームページ「バベルへの周遊」をご愛読いただきありがとうございます。このたび、都合によりホームページの収容サイトを変更する事になりました。新しいＵＲＬ番号は下記の通りですが、しばらく工事は続きますのでご注意下さい。 http://www.geocities.jp/kenji370120/home/home.htm お手数をおかけしますがお許し下さいますよう。
talo 2008/12/05
nihongo

language

history

later
リンク
Announcing SquirrelFish
“Hello, Internet!” WebKit’s core JavaScript engine just got a new interpreter, code-named SquirrelFish. SquirrelFish is fast—much faster than WebKit’s previous interpreter. Check out the numbers. On the SunSpider JavaScript benchmark, SquirrelFish is 1.6 times faster than WebKit’s previous interpreter. What Is SquirrelFish? SquirrelFish is a register-based, direct-threaded, high-level bytecode eng
talo 2008/06/18
javascript

language
リンク
Matzにっき(2008-02-12)
<< 2008/02/ 1 1. [言語] 「ハッカーと画家」の著者が新しいLisp系言語「Arc」を公開 | エンタープライズ | マイコミジャーナル 2. 「セキュリティ、なめんなよ!」なめねこも一緒に情報セキュリティ強化宣言 | ネット | マイコミジャーナル 3. 「サイオステクノロジーはグルージェントの未来技術に期待し子会社化」：ITpro 2 1. [Ruby] Nim ble Method: Garbage Collection is Why Ruby on Rails is Slow: Patches to Improve Performance 5x; Memory Profiling 2. [言語] LuaJIT roadmap 2008 3. [Ruby] What will Matz do? 4. [Ruby] EURUKO 2008 − European Ruby
talo 2008/02/17
ruby

language
リンク
大規模テキスト処理を支える形態素解析技術（工藤拓氏・Google） - Cafe Babe
第80回知識ベースシステム研究会を開催したが，二日間で58名の方々に参加して頂き，積極的に議論に加わって頂いた．この場を借りて，参加してくれた方々に感謝したい．大変遅くなった（爆）が，Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を，このブログで報告しておきたい．工藤氏の専門分野は統計的自然言語処理と機械学習であるが，日本語形態素解析エンジンMeCabの開発者であり，他にも自然言語処理関連の有益なツールや，Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど，時代をリードする研究開発者の一人である．彼の活動に興味があれば，彼のブログ「きまぐれ日記」は必見だろう．なお，当日は弊社側の不手際で，予定していた工藤氏の重要なデモをおこなうことができなかった．弊社はネットワーク会社であるにもかかわらず，ネットワーク
talo 2008/02/15
language

nihongo

library

google
リンク
中国語の文字コード - mizuno_takaakiの日記
百度で仕事をしていると、中国側のスタッフとも頻繁にメールのやりとりが発生します。すると、中国語のメールを受け取ることも多いです（日本語・中国語両方わかるスタッフが、僕にCCして中国語でメールを出す場合など）。ThunderBirdは別に中国語だって表示できるし問題ないのですが、中国語（簡体字）の文字コード（GB2312）の場合は、ちょっと見慣れないフォントになります。Windowsだと「MingLiU」というフォントです。そこまではいいのですが、中国にも日本語ができるスタッフが何人もいて、彼らとメールでやりとりをしていると、そのフォントで、なおかつ日本語で書かれたメールが来るときがあります。時には、中国語と日本語が両方書かれていることもある。UTF-8なのか？と思ったけど、その場合はフォントが変わるし、文字コードを調べてもGB2312になっているのに、日本語が表示されていて、なんでだろう、
talo 2008/02/06
language
リンク
講義資料 - PukiWiki
講義資料 † 注: 直したつもりではありますが去年からの更新のし忘れで，python.logos.ic.i.u-tokyo.ac.jp というサーバ名が，ときどき marten.logos.ic.i.u-tokyo.ac.jp となっていることが有るかもしれません(もうないつもり)．marten はすべからく pythonと読み替えてくださいここには、講義のスライドや配布資料がアップされます。 ↑ テストデータ, reference情報など † 10/30 mini-Python文法 grammar.txt 10/30 字句解析器テストデータ tokenizer_test.tar.gz 11/14 構文木ヘッダsyntree.h.txt 11/14 構文木Cソースの一部syntree.c.txt 11/14 構文解析木ヘッダparser.h.txt 11/14 構文解析木Cソース一部al
talo 2007/11/14
language

programming

study
リンク
Google Japan Blog: 大規模日本語 n-gram データの公開
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか？実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」と「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル
talo 2007/11/02
google

language

nihongo
リンク
HTML/XHTML Character Entities : HTML.SU
HTML/XHTML Character Entities : HTML.SU
talo 2007/09/04
html

language

まとめ

code
リンク
まつもとゆきひろ×結城浩，Rubyを語る - 特別対談：ITpro
結城浩（ゆうきひろし） Java，Perlなどの書籍でおなじみの著者。最新刊は「数学ガール」。このイラストは結城浩さん書き下ろしのもの。 http://www.hyuki.com/ 日経ソフトウエア2007年8月号，特集のテーマはプログラミング言語のRubyです。「Ruby大作戦」と題した本特集の中で，Ruby作者のまつもとゆきひろ氏と，JavaやPerlの書籍や本誌連載の執筆，Web上での活動で著名な結城浩氏の対談を設けました。以下は，日経ソフトウエア2007年8月号に掲載した対談の全内容です。ぜひお楽しみください。なお，この対談では，お二人のファンで日経ソフトウエア特集「Ruby大作戦」のPart5にも寄稿いただいた松岡浩平氏にも同席していただきました。この対談でRubyに興味を持たれた方は，ぜひ日経ソフトウエア2007年8月号をお読みください。はじめてのRuby ――結城さ
talo 2007/06/23
「21世紀のBASIC」

ruby

language
リンク
Yahoo! Japanの日本語形態素解析Webサービス使ってみた - spiritlooseのはてなダイアリー
http://developer.yahoo.co.jp/jlp/ http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html なんかよさげなAPIがリリースされたようで。 Yahoo！の日本語形態素解析エンジンAPIを公開 - ITmedia NEWS http://codezine.jp/a/article/aid/1461.aspx http://japan.internet.com/webtech/20070618/3.html ヤフー、形態素解析のWebサービスを公開 − ＠IT おもしろそうなのでちょっと触ってみた。んで、適当にモジュールをでっち上げてCPANにあげといた。 http://search.cpan.org/dist/WebService-YahooJapan-WebMA/ 使ってみたところ、レスポンスも結構速
talo 2007/06/20
yahoo

webservice

language

search

nihongo
リンク
http://www.moodindigo.org/blog/archives/000278.html
For full functionality of this site it is necessary to enable JavaScript. Here are the instructions how to enable JavaScript in your web browser.
talo 2007/06/10
ruby

conversion

language
リンク
書記素(grapheme)と音素(phoneme)の違い【OKWAVE】
音素は発音上・音声上の単位で，書記素は文字の単位です。音素は単独で発音できる最小の弁別的単位で，書記素はこれを文字に応用したもので，表記上の最小の弁別的単位です。もちろん，文字は音声を表記するためのものですから，時として混同されてしまうのも無理はありません。たとえば「さ」。発音上はこれをさらに分解できます。五十音表で「さ」「す」「せ」「そ」が同じ列に並んでいることは， /s/＋/a,u,e,o/ と分解できることを表しています。つまり発音する上で，さらに小さく分解できる以上，「さ」は音素ではありません。しかし，文字表記の上でこれをさらに小さくはできません。たとえば横棒だけとりだしても，何の意味も音も持ちませんから。したがって，「さ」は書記素であるといえます。アルファベットでは音素と書記素が一致するのが理想ですが，実際にはなかなかうまくいきません。英語の th とか，フランス
talo 2007/05/01
language

FAQ
リンク
1 2 3 4 次のページ