閉じる 記事へのアクセス数のほかフェイスブックやツイッターでのシェア回数、メールをもとにWSJ日本版で注目を集めている記事をランキングにまとめています
Inspired by http://anond.hatelabo.jp/20100125020240 Perlエンジニアを募集してる会社の採用面接を受けた時の話。 転職エージェントに作れと言われて作ったシートに、「興味のある技術/言語」という欄があったんです。 PSGI/Plackとか色々書いたけど、プログラミング言語の中で興味があるのはPHPだったので、 PHPと書いておいたのですが、それを見た髭面サスペンダーの面接官のリアクションが酷かった。 面接官「PHP・・・ふははっ!PHP!」 面接官「PHPやってるんですか?wwwww」 俺「(唖然)は、はい・・まだ参照を理解したぐらいですが。。」 面接官「PHP・・・ニヤニヤ」 その人はCPANコミッタで、当然Perlのコードを書いている人だったので、 Perlが「Improved PHP」と呼ばれている事を知らないワケが無いだろうと思って
そもそも、マルコフ連鎖とは何なのか?全く聞いたこともなかった。そして、文章を要約するのはとっても高度なことだと思っていて、自分のレベルではその方法を、今まで思い付きもしなかった。 しかし、以下のようなシンプルなRubyコードでそれが出来てしまうと知った時、目から鱗である...。一体、何がどうなっているのだ?コードを追いながら、マルコフ連鎖を利用するという発想の素晴らしさを知った! 作業環境 MacBook OSX 10.5.7 ruby 1.8.6 (2008-08-11 patchlevel 287) [universal-darwin9.0] mecab utf8環境でインストール済み マルコフ連鎖に出逢う rssを流し読みしていると、以下の日記に目が止まった。(素晴らしい情報に感謝です!) MeCabを使ってマルコフ連鎖 一体何が出来るコードなのか、日記を読んだだけではピンと来なかっ
アラビア語形態素解析デキターー!!!! Xが単語境界です。 setenv LANG ar_AE.utf8 で行けました。 嬉しい。 教師データなんてものは一切使っていません(Arabic gigawordの生テキストのみ) ので注意。完全ベイズです。 語彙を見ると, それなりに高頻度なものが出ている感じです。 問題はこれを読めないことです。(T_T) 内部で先月Talkをした時に, 渡辺さん が, C/C++でこういう文字タイプの判別を行うにはIBMの ICU を使うといいと教えてくれた。 ICUはUnicodeを扱うフリーソフトで, 基本的にUTF-16を扱うもののようなので, 内部表現がUTF-16になるglibcでは, そのまま wchar_t や wstring の要素を渡すこと ができるようです。 ICUには正規表現やcharacter iteratorなど様々な機能があるようで
もっと評価されるべき日本語の実力シリーズの第2回。今回は現代中国語が日本起源の和製漢語なしには成り立たないというお話。やや硬い内容なので興味のある方はどうぞ。 漢字の特徴の一つとして高い造語能力があげられる。ところが歴史を見てみると漢字の造語能力を存分に活用した事例は意外に少ない。伝統的中国語(漢文)においては漢字一文字で一つの概念や事柄を表すのが普通で、二文字以上の熟語は実はそれほど多くない。そのため中国では思想活動の活発だった春秋戦国時代(紀元前770-前221年)と仏教用語を翻訳するときに二文字以上の新語を多く造りだした程度である。漢字の高い造語能力は近代に至るまでかなり低レベルでしか活用されてこなかった。 ベトナムや韓国はもっぱら中国式の漢文を忠実に受け入れてその枠の外に出ることはほとんどなかった。韓国独自の造語もあることはあるのだがその数は少ない。 日本はまったくの例外である。漢
水村美苗さんの話題作『日本語が亡びるとき-英語の世紀の中で』を鹿児島への機内で読了。 まことに肺腑を抉られるような慨世の書である。 『街場の教育論』で論じた日本語教育についての考えと通じるところもあり、また今書いている『日本辺境論』の骨格である、日本はユーラシア大陸の辺境という地政学的に特権的な状況ゆえに「政治的・文化的鎖国」を享受しえた(これは慶賀すべきことである)という考え方にも深いところでは通じているように思う。 とりわけ、「あらまあ」と感動したのは、「アメリカの植民地になった日本」についての考察である。 明治維新のときに欧米帝国主義国家がクリミア戦争や南北戦争や普仏戦争で疲弊していなければ日本は欧米の植民地になっていただろうということを言うひとは少なくないが、「植民地になって150年後の日本」についてまで SF 的想像をめぐらせた人は水村さんをもって嚆矢とするのではないか。 「たと
「COBOLは現役バリバリだ。“COBOLは化石”などと口にするのはITとエンタープライズシステムが何たるかをわかっていない証拠」。東京海上日動システムズの稲葉茂 取締役 抜本改革推進第1本部長(写真)は“不当な”評価にさらされるCOBOLの評価をこう正した。稲葉取締役は2008年9月4,5日に開催した開発者向けセミナー「XDev2008」で「基幹系インフラを支え続けるCOBOL ~東京海上日動の抜本改革~」と題して講演した。 稲葉取締役がこうした熱いエールを送るのには理由がある。東京海上日動火災が25年ぶりに取り組むシステム全面再構築である「抜本改革」プロジェクトでは,開発言語を多面的に評価した結果,新システムでもCOBOLをビジネスロジックの開発言語として再び採用したためだ。2008年5月に,3年7カ月前に着手した第1次フェーズが終了し,自動車保険システムが新たに生まれ変わった。300
hituziのブログじゃがー - わかちがきは、発明されたものだ。 http://d.hatena.ne.jp/hituzinosanpo/20080704/1215165146 <言語音は、連続しているもので、アイとアムとアとステューデントの間に、音のきれめが くっきりあるわけではありません。けれども、文字で表記するときには、ことばの きれめにスペースを いれています。これを日本語では「わかちがき(分かち書き)」と いいます>。 <世界の言語のなかで、この わかちがきを しない言語は日本語と漢語(いわゆる中国語)ぐらいだと いわれています。もちろん、ほかにも いくつか あるはずですが、わかちがきを しない言語としては、日本語と漢語が代表格です>。 <英語は、スペースで くぎりながら表記するのが あたりまえだと おもっていませんか? もちろん、いまでは「あたりまえ」なのですが、これが発明さ
しかし、韓国語が英語の影響を受けなかったと言うのではありません。現代になって、英語的な表現、日本語的な表現がたくさん浸透しています。 韓国語には反語法という表現があります。辞書によると、「表現の効果を高くするために、実際の反対の意味の言葉を言うのこと。」irony 例えば、こどもが悪いことをしたとき、「とても、よくやった。」というように、逆にいうことです。 もうひとつ説擬法という表現もあります。辞書によると、[文学]すぐ判断できる事実を疑問の形式で表現して相手に自分で判断させる修辞法。 例えば、こどもが悪いことをしたとき、「許せれると思うのか。」というように、実際の意味は疑問では なく、「許されない。」という意味ですが、態は疑問の形式を 取っている場合だと思います。 たとえば、「What kind of man can do that?」は、 「誰にそれができるのか。 」、実際その人の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く