タグ

ことばに関するwackyのブックマーク (161)

  • スペル修正プログラムはどう書くか

    Peter Norvig / 青木靖 訳 先週、2人の友人(ディーンとビル)がそれぞれ別個にGoogleが極めて早く正確にスペル修正できるのには驚くばかりだと私に言った。たとえば speling のような語でGoogleを検索すると、0.1秒くらいで答えが返ってきて、もしかして: spelling じゃないかと言ってくる(YahooMicrosoftのものにも同様の機能がある)。ディーンとビルが高い実績を持ったエンジニアであり数学者であることを思えば、スペル修正のような統計的言語処理についてもっと知っていて良さそうなものなのにと私は驚いた。しかし彼らは知らなかった。よく考えてみれば、 別に彼らが知っているべき理由はないのだった。 間違っていたのは彼らの知識ではなく、私の仮定の方だ。 このことについてちゃんとした説明を書いておけば、彼らばかりでなく多くの人に有益かもしれない。Google

    wacky
    wacky 2007/04/28
    統計的言語処理によるスペル修正プログラムの書き方。ベイズの定理。Pythonによる簡潔なサンプルコードあり。
  • Tim O'Reilly氏が「Web 3.0」を語らない理由

    「Web 2.0」の提唱者であるTim O'Reilly氏に「Web 3.0はどうなりますか?」と聞く人は後を絶たない。4月15日から18日まで米国サンフランシスコで開催された「Web 2.0 Expo」でのO'Reilly氏の記者会見でも,そう聞く米国人プレスの姿が見られた。しかしO'Reilly氏が「Web 3.0」を語ることはない。O'Reilly氏がWeb 3.0を語らない理由は,そもそも彼が「Web 2.0」という言葉を用い出した動機にあるようだ。 O'Reilly氏はWeb 2.0 Expoの基調講演で,2004年後半に「Web 2.0」という言葉を使い始めたころの心境を「2001年にドットコム・バブルが弾けたことで『Webはもう終わった』とする考え方に対する反発があった」と語る。Webの世界にはまだまだテクノロジの進歩が必要とされているし,実際にテクノロジは進歩し続けている。

    Tim O'Reilly氏が「Web 3.0」を語らない理由
    wacky
    wacky 2007/04/25
    「Web 2.0」の提唱者であるTim O'Reilly氏が「Web 3.0」を語らない理由。
  • [infony] - キーワードを抽出して意味をしらべます

    infonyはWebページで使用されている言葉の意味をワンクリックで調べる無料のWebサービスです【レビュー】infony登場 (1) infonyとは | エンタープライズ | マイコミジャーナル 2007-07-14処理を高速化しました2007-07-14Yahoo!形態素解析APIを導入しました2007-06-04キーワード調査結果をリスト表示するようにしました2007-04-06マイコミジャーナルで紹介していただきました2007-04-05infony公開しました 最近のキーワード調査対象Webページ[As] - (MeCab)【文のみ】『Reviews from Epinions』に含まれるキーワードと意味[head][FRP][Structure] - (MeCab)【文のみ】『International Play Company - Softplay, Indoor Pl

    wacky
    wacky 2007/04/07
    日本語対応のキーワード解析サービス。指定URLからキーワードを抽出し、タグクラウドと各キーワードの意味を表示する。形態素解析にMeCabを使用。
  • mimitako.net [15]

    wacky
    wacky 2007/04/01
    テキスト形態素解析のWebサービス「MECAPI」のソースコード。『無償・無保証・著作権放棄』で提供。(→ 公開: http://chalow.net/2007-04-01-1.html
  • プログラムって危ねぇんだなぁ:ぁゃιぃ(*゚ー゚)NEWS 2nd

    http://human6.2ch.net/test/read.cgi/tomorrow/1171593519/ 300 名前:おさかなくわえた名無しさん[] 投稿日:04/06/29 16:40 ID:xj0YLdJi どなたかバッファオーバーフローとスタックオーバーフローを 前スレの「スクリプトはパートのおばちゃん」レベルで説明してくれませんか? 307 名前:おさかなくわえた名無しさん[sage] 投稿日:04/06/29 17:01 ID:g5tFNI4l >>300 もうためとけません もうつんどけません 309 名前:おさかなくわえた名無しさん[sage] 投稿日:04/06/29 17:20 ID:xj0YLdJi >>307 もう少し詳しくお願いします(´・ω・`) 313 名前:おさかなくわえた名無しさん[sage] 投稿日:04/06/29 17:46 ID:nIzcu

    wacky
    wacky 2007/03/30
    「バッファオーバーフロー」と「スタックオーバーフロー」についてのわかりやすい例え。
  • Expired

    Expired:掲載期限切れです この記事は,ロイター・ジャパンとの契約の掲載期限(30日間)を過ぎましたのでサーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。

    wacky
    wacky 2007/03/30
    Gogleの翻訳サービスは「統計的機械翻訳」を採用。文法ルールや辞書はあらかじめ持たない。翻訳前・翻訳後の文書を大量にインプットして翻訳パターンを認識させる。
  • 川内康範先生の想い出(2): たけくまメモ

    ←インタビュー中、赤田祐一編集長が撮影した川内先生(QJ創刊2号) QJ川内インタビューのある意味での白眉は、戦時中先生が徴兵されて海軍に入ったあたりの話ですが、ここで先生は決定的な体験をします。そこは最近「森進一が怯える川内康範の知られざる履歴書」という記事を載せた「週刊新潮」ですら遠慮して書かなかった部分で、先生の秘書から「私も初めて聞きました」とまで言われた重要な話なのですが、先生が戦後、玉砕した英霊たちの遺骨収集活動に邁進され「憂国の士」となったきっかけとして、非常に納得できる話でした。 ずるいようですが、詳細はこの秋再刊される文庫にゆずります。まあごく簡単に書くなら、先生には「病気除隊」して自分だけが生き残り、多くの戦友が死んだことに対する後ろめたさというか、贖罪意識があるわけです。その話をされたとき、先生は声をつまらせ、ふりしぼるように「俺は卑怯者だ!」と慟哭されたことが昨日

    wacky
    wacky 2007/03/24
    『正義の味方』という言葉を作ったのは川内康範。月光仮面が初出。
  • Language Identifier Polyglot 3000 :: Likasoft

    Polyglot 3000 is an automatic language identifier that quickly recognizes the language of any text, phrase or even single words. It is available for Windows 95/98/NT/ME/2000/XP/2003/Vista/2008/7/8. Features Polyglot 3000 features: Recognizes more than 400 languages (see list below). Supports Unicode texts. Convenient user interface. True-Coloured icons in menu and toolbar. Quick and correct langua

    wacky
    wacky 2007/03/18
    入力したテキストがどの言語で書かれているか認識してくれるソフト。432もの言語に対応。
  • 木走日記 - どうして日本語には緑の形容詞は無いんだ?? さあ、どうしてだ?

    日は与太話です。息抜いて笑って読み流してくださいませ。 昨晩は久しぶりにデブのスティーブ氏とビールを飲みのみ雑談しました。 当ブログでは何回か登場してきたスティーブ氏ですが、あらためて簡単に紹介しておきますと、奥さんはとっても美人の日人で来日13年の知日派でありITコンサル業を生業としている私の同業者であり飲み仲間の中年白人デブ親父(苦笑)であります。 とっても短気ですぐ真っ赤になって興奮しますが目の前を美人が通ったりすれば次の瞬間ニコニコ顔になってしまうという、まあ典型的なわがままヤンキーなのであります。 でこのスティーブ氏でありますが不思議なほどいっこうに日語が上手になりません。 いつまでも教科書日語の域(ですます調)を出ないのであります。 だから私と飲むときも基的には英語オンリーであります。 スティーブ「しかし、日語ってやつは当に扱いづらい低級な言語だな。まったくやにな

    木走日記 - どうして日本語には緑の形容詞は無いんだ?? さあ、どうしてだ?
    wacky
    wacky 2007/02/23
    外国人から指摘されて気付く日本語の形容詞の不思議さ、面白さ。
  • ポン酢の「ポン」とポンジュースの「ポン」の違い - memo.xight.org

    wacky
    wacky 2007/02/14
    ポン酢とポンジュースの「ポン」は、それぞれ全く異なる意味。
  • http://d.hatena.ne.jp/Yuichirou/20070104

    wacky
    wacky 2007/01/04
    はてなセリフで書初め。
  • 想定外の誤訳になってしまった企業スローガン13 | POP*POP

    これは笑えるような笑えないお話・・・(なお、このネタはサイボウズ・ラボの秋元さんに教えてもらいました。ありがとうございます!)。 さてそのお話、「企業スローガンの誤訳ワースト13」というもの。グローバル企業が世界進出する際にやっちゃった失敗の数々です。気をつけていないと現実に起こりうるだけに反面教師として是非ご覧ください・・・。 » Moronland.netTop 13 Worst Slogan Translations Ever 詳しくは以下。1位の誤訳は有名なあの企業ですよ。では13位からどうぞ! 【13位】 Parker Parkerが、メキシコのボールペン市場で使った広告の話。 「このペンはポケットの中でインクが漏れてあなたを困らせるようなことがありません(It won’t leak in your pocket and embarrass you.)」とするつもりが、「e

    想定外の誤訳になってしまった企業スローガン13 | POP*POP
    wacky
    wacky 2006/12/19
    グローバル企業が世界進出する際にやっちゃったスローガン、キャッチコピー、商品名の誤訳。
  • http://retropc.net/archives/2006/11/post_132.html

    wacky
    wacky 2006/11/26
    イース(Ys)とフランスの深い関係。
  • geoGreeting!

    geoGreeting!
    wacky
    wacky 2006/11/14
    Google Mapsの衛星写真からアルファベットに見える地形を集めてメッセージを作れるグリーティングサービス。
  • 吹風日記 - 「ぱふぱふ」はなぜ消えたのか、聞こえない音、エロい日本のドラクエ

    ドラゴンクエストがアメリカに移植されたとき、さまざまな修正が行われました。それをつぶさに調べていくと、ドラクエというゲームに隠れた「日的なもの」の姿が浮かび上がってきます。今日は、我々を包囲する見えない文化について考えます。 だが、コンピュータやインターネットの発達が、全体として人間にどんな影響を与えるかという命題に的確に答えられる人はいないだろう。ファミコンについても、それをずっと続けて育った子供がどうなるか、まだはっきりとわかっていない。 主人公がいろいろな冒険をしたり、戦闘するRPG(ロール・プレイング・ゲーム)はたしかにおもしろい。出はじめたときは私も徹夜でやったものだが、一ついえることは、ゲームの構成そのもののなかに、また場面、場面のやり取りのなかに間違いなく文化的な要素が入っている。そして、それが必ずしも日社会の伝統的倫理観ではないことである。子供は与えられたものを当たり前

    吹風日記 - 「ぱふぱふ」はなぜ消えたのか、聞こえない音、エロい日本のドラクエ
    wacky
    wacky 2006/11/10
    面白そう。後で読む。
  • 仮面ライダー剣 - Wikipedia

    『仮面ライダー剣』(かめんライダーブレイド、欧文表記:MASKED RIDER BLADE)[注釈 1]は、2004年1月25日から2005年1月23日までテレビ朝日系列で毎週日曜8時から8時30分(JST)に全49話が放映された、東映制作の特撮テレビドラマ作品。字幕放送。「平成仮面ライダーシリーズ」の第5作目に当たる。キャッチコピーは「今、その力が全開する。」「運命の切札をつかみ取れ!」。 概要 作品における仮面ライダーは「ライダーシステム」と総称されるシステムを用い、トランプをモチーフとする「ラウズカード」に封印されたアンデッドの能力を引き出すことによって、仮面ライダーへの変身と特殊技の発動を行う存在として位置付けられている。同じくカードを駆使して戦うスタイルであった『仮面ライダー龍騎』との差別化が制作上の課題となっており[1]、結果としてポーカーのように一度に特定の複数枚のカードを

    wacky
    wacky 2006/11/06
    懐かしすぎ。オンドゥルルラギッタンディスカー!! / ウゾダドンドコドーン!!
  • 続・呼び名で分かる:「人体」編 「ものもらい」、250種以上…嫌悪感・親近感も−家庭:MSN毎日インタラクティブ

    「フォールス・クリーク」カナダ, ブリティッシュコロンビア州, バンクーバー -- Rudy Sulgan/Corbis

    wacky
    wacky 2006/11/02
    「ものもらい」や「鳥肌」などの各地での呼び名。
  • サイレントマジョリティを考慮にいれるガイドライン

    1 :水先案名無い人:2006/10/31(火) 10:12:55 ID:DYPPjGJl0 ?BRZ(5000) 中国韓国と仲良くした方がいい?しなくてもいい? ◇ふー、びっくりした うーん、今回は簡単だとぼくは思っていた。 だって、中国韓国はおとなりの国だものね。これからもずっとつきあっていかなければなら ないのだ。この質問のこたえなんて考えるまでもない。けれど、最近の東アジア情勢を、みん ながどんなふうに感じているのか、それが探りたくてこのテーマにしたのだ。 するとあらら、不思議。寄せられたのは厳しい反韓国・反中国のメールばかりだった。なぜな のかしらん? というわけで、今回は多数を占める「しなくていい」派からいってみよう。 「近隣国と友好関係をつくるのは『望ましい』ことであって、『なすべき』ことではない」(住所不明・匿名さん)。 「都合のよいときだけ、新時代にむけて新しい関係を

    wacky
    wacky 2006/10/31
    さっそくガイドラインスレも立ってるのかw (実はニュー速+より先に立ってたらしい)
  • 【毎日新聞】「中韓と"仲良くしなくていい"が圧倒的だが、サイレントマジョリティを考慮して"したほうがいい"に決定」…石田衣良氏 : 痛いニュース(ノ∀`)

    【毎日新聞】「中韓と"仲良くしなくていい"が圧倒的だが、サイレントマジョリティを考慮して"したほうがいい"に決定」…石田衣良氏 1 名前:ままかりφ ★ 投稿日:2006/10/31(火) 10:12:56 ID:???0 うーん、今回は簡単だとぼくは思っていた。だって、中国韓国はおとなりの国だものね。これからもずっとつきあっていかなければならないのだ。この質問のこたえなんて考えるまでもない。けれど、最近の東アジア情勢を、みんながどんなふうに感じているのか、それが探りたくてこのテーマにしたのだ。するとあらら、不思議。寄せられたのは厳しい反韓国・反中国のメールばかりだった。なぜなのかしらん? というわけで、今回は多数を占める「しなくていい」派からいってみよう。 「近隣国と友好関係をつくるのは『望ましい』ことであって、『なすべき』ことではない」(住所不明・匿名さん)。「都合のよいときだけ、新

    wacky
    wacky 2006/10/31
    アンケート結果を無視するためのメソッド。『数字の上では○○派が圧倒的だったけれど、応募しなかった多数のサイレントマジョリティを考慮にいれて××に決定』
  • [徳力] 最初に、CGMと呼ばずにソーシャルメディアと呼ぶべきだったのかもしれない

    CGMの時代は終わった – webdogを読んで。 かなり前の記事になりますが、ジェットさんが「コンシューマーがジェネレートしたメディアなんて長持ちするはずがない」とばっさり切ったこの記事を読んで、ずっと引っかかっていたことがありました。 ブログやSNSが流行ったことで、CGMという言葉もセットになって使われるようになりましたが、実は個人的にも身の回りで起きている出来事にCGMという言葉がどうもしっくり来ていませんでした。 Consumer Generated Media=「消費者」が生成していくメディア。 この言葉の影響もあってか、「今後は素人が作成したコンテンツがプロをしのぐのか」とか、「素人もプロになれる道が開ける」とか、消費者(素人)と、これまでの情報発信者(プロ)を対比したものが多かったような印象があります。 でも、実際には人気ブロガーの中には職のライターさんや物書き職の人が多

    [徳力] 最初に、CGMと呼ばずにソーシャルメディアと呼ぶべきだったのかもしれない
    wacky
    wacky 2006/10/27
    消費者が発信源であることより、「ソーシャルなコミュニケーションを生み出すメディア」であることが重要。なるほど、分かりやすい。