タグ

wikipediaに関するohnishiakiraのブックマーク (6)

  • 英語"を"勉強するのではなく英語"で"勉強するオススメの最初の一歩 - とある夢追い人の日常〜毎日がアドベンチャー〜

    学FACEBOOKなんかではポロッとしゃべったりはしているのだけど、今週久々にTOEICを受けるyoshikです。「海外仕事やりまっせ!」という上で、別に「TOEICなんて関係ない!TOEICで900 overでもビジネスできるとは限らない」というスタンスですし、それは今でも変わらないけど、そういうことは900 over超えてから言うもんだと思っているので、「英語"を"勉強する」という点ではキレイにピリオドを打ちたいと思っております。では「英語"を"勉強する」から「英語"で"勉強する」という上での第一歩を進む前に紹介しておきたい。まぁ最近話題のTEDを見るってのもいいんだけど、意外に聞いただけで満足する人もいそうなのが所感。というわけで、「英語"で"勉強」の最初の一歩を以下にご紹介。簡単に言うと、「英語で入門書を(無料で)自作!」※ 自炊ではない!◆準備・Wikipedia:http:/

  • Hadoopを使わずにWikipediaのテキスト処理を400倍高速化 - tsubosakaの日記

    タイトルは釣りです。id:mamorukさんの書いたHadoop で Wikipedia のテキスト処理を900倍高速化 - 武蔵野日記を読んで、そもそも1G程度のデータの単語頻度を数えるのに858分もかかるんだっけと思い、id:nokunoさんの資料を読んでみると単語頻度を求める際に a b a aみたいなデータを a 3 b 1に変形するのにsortしたファイルをuniq -cで処理するということをやっていた。これはあまり効率のよい方法ではなくて行数をNとしたときにO(N log N)の計算時間となる(文字列比較はO(1)でやれることにする)。 これに対して、単語の頻度をハッシュ表で保存すると理想的な条件の元ではO(N)の計算時間で頻度を求めることが出来、より高速に計算することが可能となることが期待される。 また、単語数をWとしたとき、C++mapのような二分探索木を使ってもO(N

    Hadoopを使わずにWikipediaのテキスト処理を400倍高速化 - tsubosakaの日記
  • これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」

    Wikipediaといえば世界で第5位の訪問者数を誇る巨大サイトですが、システム運営に携わる人間は世界でわずか6人、しかもこれはボランティア込みという恐るべき少人数で、第4位のFacebookのサーバ数が3万台を超えているのに対して、Wikipediaはわずか350台で運用している……などというような感じで、知られざる今のWikipediaの実態が「KOF2010」にて日行われた講演「Wikipedia / MediaWiki におけるシステム運用」で明かされました。 登壇したのはWikipediaを運営するWikimedia財団のエンジニアであるRyan Lane氏で、100席ある座席は満席になり、隣の中継の部屋まで人があふれているほどの盛況っぷりで、語られる内容もなかなか参考になることが多く、今後のGIGAZINEサーバにも活かせそうな内容でした。 というわけで、「Wikipedia

    これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」
  • Wikipedia:珍項目 - Wikipedia

    0 - 9[編集] 0ルピー紙幣 インドの模造紙幣。役人からの贈賄要求に抗議するため、市民団体が作成した。 1に等しい数? 0.999... 循環小数 0.999...によって表される実数は、寸分違わずちょうど 1 に等しい。その証明と、そこから広がる数学の世界。 100年電球 1901年から点灯し続けている消防署の電球。 1956年メルボルンオリンピックのニセ聖火リレー事件 ナチズムに起源を持つとして聖火リレーに抗議した学生のイタズラ。 300ページのiPhone請求書 AT&Tモビリティから送られた、300ページにも及ぶiPhone使用料金の請求書。 4千年紀以降 まず誰もその目で確認できないであろう遠い遠い未来の予想。 4分33秒 ジョン・ケージの前衛音楽。「第1楽章:休み。第2楽章:休み。第3楽章:休み」。 5秒ルール 落としたべ物がもったいない! というときの奥の手。世界規模で

  • 10年前に僕が作成した鉄道未成線資料400件がそのままWikipediaにパクられた話 - とれいん工房の汽車旅12ヶ月

    ちょっと呆れています。怒るというより、わびしいというか悲しいというか。 相手は、あのフリー百科事典「Wikipedia」。さっきネットで調べ物しようとしたら、10年前に僕が作成した資料400〜500件がそのままWikipediaにパクられていたのに気付きました。あまりにも堂々と資料がそのままコピーされていたんで、いろんな意味で驚いていますし、と共に寂しい気持ちになっています。 「鉄道未成線を歩く」取材と資料調査の日々 僕は今の仕事に就く前、1年半ほどヒマにしているときがあって、その間、JTBさんから話をいただいて未成線についての話をにまとめたことがあります。 鉄道未成線を歩く (私鉄編) JTBキャンブックス 鉄道未成線を歩く (国鉄編) JTBキャンブックス の2冊。 こうした未成線というのは、鉄道会社などが計画しただけで実現しなかった鉄道線についてのことを指します。 京阪電気鉄道が梅

    10年前に僕が作成した鉄道未成線資料400件がそのままWikipediaにパクられた話 - とれいん工房の汽車旅12ヶ月
  • Wikimediaのオフラインブラウザ·Okawix MOONGIFT

    オンラインの百科事典であるWikipediaやフリーなニュースを提供するウィキニュース、引用集のウィキクォートなどWikimedia財団では様々なコンテンツフリーなサービスが提供されている。Wikipediaについては言うに及ばず、誰しもが一度は利用したことがあるだろう。 オフラインでWikipediaなどのコンテンツを閲覧 そんなWikimediaのコンテンツは自由にダウンロードができる形式で提供されている。それをダウンロードし、オフラインで閲覧できるようにするのがOkawixだ。 今回紹介するオープンソース・ソフトウェアはOkawix、Wikimediaオフラインブラウザだ。 OkawixはWikimediaが対応する253の言語と、提供する7つのサービスだ。教科書や解説書のウィキブックスをはじめ、ウィキニュース、Wikipedia、ウィキクォート、ウィキソース、ウィキバーシティ、ウィ

    Wikimediaのオフラインブラウザ·Okawix MOONGIFT
  • 1