タグ

言語に関するhoshiminのブックマーク (14)

  • Googleの分散データ処理言語Sawzallの統計ライブラリをC++, Ruby, Pythonから利用するライブラリSZaruを公開しました - llameradaの日記

    Googleで利用されている分散データ処理言語SawzallのOSS実装 szl が公開されました。 公開されたソースの中にはSawzallの実行環境の他に大規模データ向けの統計ライブラリが含まれています。この統計ライブラリには高度なアルゴリズムが実装されているので、これを他の言語からも利用できると便利だなと思い、C++, Ruby, Pythonから利用できるようにしました。 便利な統計アルゴリズムの1つに出現回数が上位のN件の要素の抽出(top-N)があります。 top-Nを求める具体例としては、自然言語処理でよく使う、出現回数上位の単語を求める処理があります。この処理の単純な実装では、まず全単語の出現回数を求めておき、次に各単語を出現回数の降順でソートして出現回数上位の単語を求めます。しかし、この実装ではユニークな単語数K(数十万から数百万)に比例したメモリと計算量が必要となります。

    Googleの分散データ処理言語Sawzallの統計ライブラリをC++, Ruby, Pythonから利用するライブラリSZaruを公開しました - llameradaの日記
  • 服飾|げたにれの “日日是言語学”

    げたのにれのやさんのブログテーマ、「服飾」の記事一覧ページです。

  • 【2ch】ニュー速クオリティ:間違った意味で使われやすい10の言葉 「世間ずれ」「失笑」「他力本願」など

    1 ばくだん(千葉県) 2010/01/22(金) 12:46:14.97 ID:vftASfX4 ?PLT(12084) ポイント特典 「世間ずれ」「失笑」「他力願」の正しい意味は? 間違った意味で使われやすい10の言葉 普段、何気なく使っている言葉。しかし、実は来の意味とは異なる間違った意味で使ってしまっている、ということも少なくないようです。そんなわけで今回は、意味を間違えて使われやすい言葉をピックアップしてみました。 ■役不足 "間違った意味で使われやすい言葉"の代表例がこの「役不足」ではないでしょうか。「この仕事、あいつでは役不足だ」という具合に、人の力量に対して役目が重すぎること、という意味で使われることが多いようです。でも、来の意味は 俳優などが割り当てられた役に不満を抱くこと。または、力量に比べて役目が不相応に軽いこと。 http://www.excit

  • はてなブログ | 無料ブログを作成しよう

    オマーン旅行 2024 2024年のゴールデンウィーク前半はオマーンの首都マスカットに旅行に行ってきたのでその旅の記録を書く。 GWにが子どもを実家に連れて帰るとのことで、5日間の自由時間が手に入ったので、ここぞとばかりに海外旅行行きを決めた。 なぜオマーン 5日しかなく、複数国を…

    はてなブログ | 無料ブログを作成しよう
  • Trivia : Reading Test

    Reading_Test.jpg これは確かにすごいトリビア。普通の英文を読む速度と同じ速さで読める不思議。というか、トリビアのネタ自体がこの文章に書いてあるところがまたすごい。 結論部分だけ意訳すると(ちょっと間違ってるかも)、 人間は文章を読む際、単語内のすべての文字を順番にそのまま読むのではなく、単語全体のまとまりとして読んでいる。重要なのは単語の最初と最後の一文字であって、この2文字さえきちんと書いてあれば、それ以外の文字の順番はめちゃくちゃであっても読解に支障は起きない。 で、上記の文章はそうやって書いてある。

    Trivia : Reading Test
  • 言語学的自然主義の誤謬 - 誰がログ

    以下のブクマコメントでちょっと言い足りないと思ったのでちょっとだけ補足…って思ってたけど結局長くなったorz はてなブックマーク - 柳瀬尚紀を読んでからニヤニヤしている国語学者(とその追従者たち)を見るととてもげんなりさせられる - ハックルベリーに会いに行く 自然主義の誤謬はとりあえずwikipediaでも貼っておきますか。少し詳しい、っていうか専門的過ぎるかな。なじみの無い方ははてなのキーワードも見てみてください。 自然主義的誤謬 - Wikipedia 言葉(日語)に関する「正しい/正しくない/乱れなんてない/...」論争は自分の狭い観測範囲の中では(さえ?)よく見かけますが、とりあえず国語学/日語学/言語学の知見や研究成果を持ち出してきて、ある言語表現の「正しさ/美しさ」への理由付けや正当化をしようとするのは、言葉に関する自然主義の誤謬の一種なんじゃないかなあ、って前から思っ

    言語学的自然主義の誤謬 - 誰がログ
  • 活字中毒R。どうして日本人には「亡命」する人がいないのか?

    『相手に「伝わる」話し方』(池上彰著・講談社現代新書)より。 【ニュースにはむずかしい言葉が数多く登場します。テレビを見ている人は、むずかしい言葉、意味のわからない言葉が出てくるたびに、そこから先へは理解が進まなくなります。その言葉がキーワードだったら、視聴者にはニュースに伝わらなくなります。 逆に言えば、キーワードをわかりやすく説明することができれば、見ている人は、「ああ、そういうことなんだ」と腑に落ちることでしょう。 むずかしい言葉の多くは、漢字の熟語です。幸いなことに、私たちが使っている漢字は、ひとつひとつの文字が意味を持っています。その漢字の意味をおさらいするだけで、むずかしい用語の説明ができ、ニュースのポイントも理解できることが多いのです。 たとえば、「亡命」という言葉です。 2002年5月、中国の瀋陽で発生した、北朝鮮からの越境者による「亡命」事件。自分の国にいては生きていけな

  • MSが長音付けルール変更、「ドライバ」を「ドライバー」に - @IT

    2008/07/25 「コンピュータ」「エクスプローラ」「プリンタ」は、今後は「コンピューター」「エクスプローラー」「プリンター」に――。外来語のカタカナ表記で“表記揺れ”が問題となる末尾の長音記号(音引き記号とも呼ぶ「ー」)の取り扱いについて、マイクロソフトがルールを変更する。 同社では従来から「2音の用語は長音符号を付け、3音以上の用語の場合は省くことを原則とする」としたJIS規格(JISZ 8301)に準じてきた。私企業として「何らかの外部のガイドラインに従う必要があった」(マイクロソフト 最高技術責任者 加治佐俊一氏)と、これまでJIS規格を参照してきた。ただ、この規格はJISの規格書作成時のガイドラインとして定められたもので、科学技術・工学系のドキュメントなど一部で用いられてきたルールに過ぎない。 新聞や雑誌などでは「長音あり」としたルールを採用するケースが多い。これは1991年

  • ふき出しのレトリック 〜マンガの修辞学〜

    2008/05/25 : サイトを移転(「いま」見ているのが、移転先のサイトです) 2008/10/04 : 「使う目的別のまとめページ」をバージョンアップ 2008/10/04 : 倒置反復に画像を追加して加筆 2008/09/26 : 脚韻のページにある内容を、かなりに変更 2008/09/20 : 島村瀧太郎(抱月)『新美辞学』のページを作成 2008/09/07 : 隠喩に画像を追加して、加筆 2008/08/30 : 設疑法を追加 2008/08/23 : 直喩に画像を追加して、加筆 2008/08/16 : 韻文を追加、押韻・頭韻・音数律に加筆 2008/07/19 : 祈願法を追加、緩叙法(付加)に画像をつけ足して加筆 2008/07/18 : カウンタが100,000を突破(祝) 2008/07/12 : 「使う目的別のまとめページ」というものをつくり

  • 「英語式語順は、自然な思考の順番に反する」研究結果 | WIRED VISION

    英語式語順は、自然な思考の順番に反する」研究結果 2008年7月 9日 サイエンス・テクノロジー コメント: トラックバック (1) Brandon Keim Photo: Paul Wicks あなたが話すときに従っている文法の規則は、あなたの思考の筋道を反映していないかもしれない。 6月30日(米国時間)に『米国科学アカデミー紀要』(PNAS)に発表された論文によると、主語(S)、動詞(V)、目的語(O)の順に文章が構成される(例えば「Bill eats cake(ビルが、べる、ケーキを)」)SVO型言語を話す人であっても、身ぶり手ぶりでコミュニケーションを取るよう求めると、主語、目的語、動詞の順番で意志を伝えたという。 英語も含めて、人間が使用する言語の約半分では、主語の後に動詞が続く。こうした言語を生まれたときから使用している人には、「Bill cake eats(ビルが、ケー

  • vue-chat

    hoshimin
    hoshimin 2008/05/26
    Ragel
  • (漢文の)文法構造の複雑さについて雑感 - 誰がログ

    発端はmb101boldさんのこのエントリ↓ コピーライターは言葉の専門家なのでしょうか。: ある広告人の告白(あるいは愚痴かもね) にyumizouさんと僕が↓のブクマコメントを付けたこと。 [B! ad] コピーライターは言葉の専門家なのでしょうか。: ある広告人の告白(あるいは愚痴かもね) 僕のは便乗コメントでほとんど中身無いですけどね(^^; で、それに対するmb101boldさんの補足エントリ↓ http://d.hatena.ne.jp/mb101bold/20080224#1203870311 お返事を考えている間にyumizouさんが分かりやすい応答エントリを書いてくれました↓ http://d.hatena.ne.jp/yumizou/20080225/1203922588 中心的な論点だった文法(構造)に対する考え方についてはほぼ同意なので、ここから先は僕の視点からの雑

    (漢文の)文法構造の複雑さについて雑感 - 誰がログ
  • 私は日本語を愛しています - 誰がログ

    語の弱点ってどこだと思う?:VIPPERな俺跡地 なんというかVIPのまとめに突っ込むのも野暮かなあ、と思ってぼーっと眺めてたんですけど、いつもなんとなく思うのは、特殊じゃないと愛せない(誇りを持てない)んですかね?日語*1。いやスレの主旨がそうではないことはわかるんですけど、こういう議論を見るとどうもプラスにしろマイナスにしろ日語はこの点で特殊なんだよ!っていう気持ちを読み取っちゃうんですよね。邪推かな。 あと、この手の議論によく「日語は論理的じゃないって言われるけど…」って出てくるんですけど、これって今時気でこんなこと主張する人っているんですかね。いや、中にはいるのかもしれないですけどそんなにメジャーな意見なのかな。 以前言語の複雑さを比較するのがいかに大変かということについてkillhiguchiさんとやりとりしたことがあるので興味のある方はどうぞ(コメ欄でのやりとり)↓

    私は日本語を愛しています - 誰がログ
  • 日本語の弱点とか言ってる奴

    これとそのブクマね。 幸い「日語は論理的でない」というトンデモさんが出てこない(日語が論理的でなかったら学術書の和訳ができるはずがないだろう)ので少し安心しているが、それでも「日語は情緒的」だとか「日語は曖昧」だとか「日語は回りくどい」言ってる人が多いので溜息。 そういうこと言ってるお前ら、どれだけ日語以外の言語知ってるのかと。 お前らが日語の「欠点」が見えやすいのは、お前らが日語をよく知っているからだけの話。実際は他言語でもそういう言い方はいくらでもある。 日語以外の言語で情緒的だったり曖昧だったり回りくどかったりする表現が可能なことは、ラカンだのなんだのの訳のわからん衒学的なポモ文が、明晰と言われるフランス語発祥であることからもすぐにわかるはずだ。「ソーカル事件」でぐぐるといい。あれはフランス語や英語における、言語の曖昧さを駆使したハッタリの実体をよく暴露したものだと

    日本語の弱点とか言ってる奴
  • 1