タグ

言語に関するdkonnoのブックマーク (5)

  • カタカナConfusion | 英語脳を刺激するWebマガジン A・can エイ・キャン

    「A・can」は英語力を気でアップさせたい方々に向けて創刊した英語脳を刺激するWebマガジンです。

  • 不完全にしておよそ正しくないプログラミング言語小史

    1801 – ジョセフ・マリー・ジャカールがパンチカードを使った織機によってタペストリーに"hello, world"と織り出す。しかしラッダイト (当時のRedditer) たちは、テールリカージョン、並行処理、大文字小文字の区別を欠いていたため、さほど感心しなかった。 1842 – エイダ・ラブレスが最初のプログラムを書く。彼女の努力は、プログラムを実行するコンピュータが実のところ存在しないというマイナーな問題のために頓挫した。後にエンタープライズアーキテクトたちはプログラムをUMLで書くために彼女のテクニックを再び学ぶことになる。 1936 – アラン・チューリングが存在しうるあらゆるプログラミング言語を発明するが、特許化する前に英国情報部員(後の007)によって抹殺される。 1936 – アロンゾ・チャーチも存在しうるあらゆる言語を発明しているが、より巧みに行った。チャーチのラムダ

  • きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる

    MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 現在公開している mecab-ipadic は、ipadicとRWCPコーパスという正解データを使っています。 ここから分かるとおり、少なくともMeCabを使う場合は、コスト値を丹念にチューニング するといった職人芸は要りません。形態素解析への入力文とそれに対応する(理想)出力 があればコスト値を機械学習的なアプローチで構築することができます。 さらに、正解データを人手で作る必要は必ずしもありません。 すなわち、Yahoo!形態素解析器の出力結果を「擬似正解」とみなして MeCabの学習プログラムを走らせれば、Yahoo!の出力を高い精度で再現できる MeCab用辞書を作成することが原理的に可能です。 ふだんはあま

  • げたにれの “日日是言語学”

    こちらは 「三斗小屋温泉と消えた街道」 の 2 でござる。 1 は↓ http://ameblo.jp/nirenoya/entry-10606645050.html 五十里ダム 【 道草 ── 葛老山と五十里村の語源 】 〓ここで、毎度おなじみ、道草であります。 〓日光大地震で崩壊した 「葛老山」。この山名の語源は、比較的わかりやすい、と言えましょう。 〓おそらく、 かづら (葛) + ふ (生) → かづらふ (葛生) ではないかと。 「生」 (ふ) という地名をつくる接尾辞については、先だって説明いたしました。 クズ (クズカズラ) 〓「かずら」 というのは、「くずかずら」、すなわち、「くず」 のことで、山里の人々にとっては重要な植物資源でした。ツルで行李 (こうり) を編んだり、その繊維で布を編んだり、あるいは、葛根 (カッコン) という根は薬用・用として使われました。 〓葛根は

  • 圧縮新聞

    圧縮新聞はその日の最新ニュースをマルコフ連鎖でまとめて圧縮したものです。 ざっと眺めるだけでその日起こった事件が何となくわかる可能性がありますが保証はしません。 リロードするたび文章は変わります。 Twitter版もできました。 インタビュー特集や、映画『虹色デイズ』に出演する佐野玲於・中川大志・高杉真宙・横浜流星の座談会なども掲載。 詳しい観測が必要だと皮肉った。 長期間にわたり血糖値がコントロールできない状態が続くと、毛細血管がダメージを受けます。やがて目(網膜)や腎臓の毛細血管に障害が起き、網膜症や腎臓病などの合併症を発症することが理想だ。

  • 1