タグ

wikipediaに関するtorutoのブックマーク (59)

  • 解析概論 - Wikisource

    削除提案中 現在、この項目の一部の版または全体について、削除の手続きに従って、削除が提案されています。 削除についての議論は削除依頼の該当のセクションで行われています(このページのノートも参照して下さい)。削除の議論中はこのお知らせを除去しないで下さい。 この項目の執筆者の方々へ: まだ削除は行われていません。削除に対する議論に参加し、削除の方針に該当するかをどうか検討して下さい。 著作権侵害のおそれこの項目は著作権侵害が指摘され、現在審議中です。 審議の結果、該当する投稿以降の版全てもしくはこの項目自体が履歴も含めて削除される可能性があります。編集は極力控えてください。著作権上問題のない自分の投稿内容が削除される可能性のある方は、早めに控えを取っておいてください。 該当する投稿をされた方へ: ウィキソースでは、著作権上問題のない投稿のみを受け付けることになっています。他人の著作物を使うと

    toruto
    toruto 2011/01/04
    高木貞治. 著作権切れ
  • Wikipediaから作成したN-gramデータを公開しました - nokunoの日記

    id:toilet_lunch さんに先を越された感がありますが、Wikipediaから作成したN-gramデータを公開しました。Downloads - nokuno - Project Hosting on Google Code処理方法については先日の日記を御覧下さい。Wikipediaによるテキストマイニング入門 - nokunoの日記

  • 2010-05-22

    データ http://dl.dropbox.com/u/2996612/idf.txt.bz2 集計条件 品詞は細分類を無視 文書数はタイトルの行数とし、空の文書*1でもカウントを行っている*2 定義式 : 単語のIDF値 : 総文書数 : 単語が出現する文書の総数 文書数、異なり単語数 総ドキュメント数 123,7429 単語異なり数 216,9308 データ形式と例 タブ区切り データ例 形態素 品詞 idf値 あいぞう 名詞 6.09252 あいぞめ 名詞 5.01334 あいた 感動詞 4.58737 あいたい 名詞 4.46927 あいだ 名詞 2.82231 *1:WP2TXTの変換によって文がなくなる場合がある *2:めんどくさかったので・・・ データ 1-gram http://dl.dropbox.com/u/2996612/1gram.bz2 2-gram http:

    2010-05-22
  • Hadoop で Wikipedia のテキスト処理を900倍高速化 - 武蔵野日記

    今月中に実験の実装が終わるくらいでないと来月の投稿〆切に間に合わないので、今週から研究室のサーバに Hadoop をインストールしている。 研究室にはサーバが20台弱あるのだが、そのうち10台強を使うことにして設定。これくらいの規模だと「大規模」と言うのは憚られるかもしれないが(Yahoo!Google と比べて、という意味で。)、中規模、くらいには言ってもいいだろうし、たぶん、多くの大学や企業で使える台数もこれくらいだと思うし、大企業にいないとできない研究をするのも大変価値があるが、他の人たちがやる気になれば真似できる研究をするのも(データやインフラ勝負ではなくアイデア勝負になるので苦しくはあるのだが)重要だと考えている。 たとえば、数台でも分散環境の恩恵が受けられる、というのはPFI が出した Hadoop の解析資料で知っていたので、初めて導入したときは参考になったし、こういう

    Hadoop で Wikipedia のテキスト処理を900倍高速化 - 武蔵野日記
  • Wikipediaによるテキストマイニング入門

    Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. Datamining04 textmining - Presentation Transcript Wikipediaによるテキストマイニング入門 @nokuno #TokyoWebmining 2010/05/16 アジェンダ 1. はじめに 2. テキストマイニング入門 3. Wikipediaデータの解析 4. まとめ 2 1. はじめに 3 自己紹介  Twitter: @nokuno  はてな:id:nokuno  Social IME開発者  自然言語処理とか  RとかP

  • ティモシー・リアリー - Wikipedia

    ティモシー・フランシス・リアリー(Timothy Francis Leary, 1920年10月22日 - 1996年5月31日)は、アメリカの心理学者である。集団精神療法の研究で評価され[1]、ハーバード大学で教授となる。ハーバード大学では、シロシビンやLSD(リゼルグ酸ジエチルアミド)といった幻覚剤による人格変容の研究を行った。幻覚剤によって刷り込みを誘発できると主張し、意識の自由を訴えた。しかし、マリファナ所持で投獄される。囚人生活中に宇宙移住計画の構想をまとめた。晩年は、宇宙移住をサイバースペースへの移住へと置き換え[2]、コンピューター技術に携わった。コンピュータを1990年代のLSDに見立て[3]、コンピュータを使って自分の脳を再プログラミングすることを提唱した[4]。 生涯[編集] 心理学者の道へ[編集] ティモシー・リアリーは、1920年10月22日にマサチューセッツ州スプ

    ティモシー・リアリー - Wikipedia
  • Mining Meaning from Wikipedia

    Wikipedia is a goldmine of information; not just for its many readers, but also for the growing community of researchers who recognize it as a resource of exceptional scale and utility. It represents a vast investment of manual effort and judgment: a huge, constantly evolving tapestry of concepts and relations that is being applied to a host of tasks. This article provides a comprehensive descript

  • 上位下位関係抽出ツール: Hypornymy extraction tool

    上位下位関係抽出ツールとは 上位下位関係抽出ツールは,Wikipediaダンプデータ(XMLファイル)から機械学習を使って上位下位関係の候補となる表現ペアを抽出します. 以下の3種類を情報源としています. hierarchy :箇条書きなどの階層構造から上位下位関係の候補を抽出 definition :最初の文(定義文)から上位下位関係の候補を抽出(「~とは,….」などを利用) category :category tagにある単語から上位下位関係の候補を抽出 目次 新着情報 注意事項 ダウンロード 動作環境 実行 オプション引数 ディレクトリ構成 実行コマンド入力例 Copyright 新着情報 2009-04 上位下位関係抽出ツールv0.80 リリース 注意事項 Wikipediaのデータを利用するため,処理及び処理結果の利用に際しては,Wikipediaの著作権を熟読の上

  • RNA Biology誌、論文投稿に合わせてWikipediaへの記事作成を義務化

    生化学系学術雑誌の“RNA Biology”誌が、原稿投稿に際してWikipediaに関連する記事を投稿することを義務化すると、同誌の「著者ガイドライン」で明らかにしました。 論文とともに作成されたWikipediaの記事は、Wikipedia上の論文執筆者の「利用者」ページ、またはWikipediaの公開ページ上に掲載して、論文と一緒に査読をおこない、必要に応じて改訂を要求するとのことです。またサマリー上に、Wikipedia記事へのリンクを明示しなければならないとしています。 guidelines for authors(RNA Biology) http://www.landesbioscience.com/journals/rnabiology/guidelines Journal authors must also post to Wikipedia http://www.tim

    RNA Biology誌、論文投稿に合わせてWikipediaへの記事作成を義務化
    toruto
    toruto 2009/02/02
    知らなかった
  • ロスチャイルド家 - Wikipedia

    ロスチャイルド家(ロスチャイルドけ、Rothschild、「ロスチャイルド」は英語読み。ドイツ語読みは「ロートシルト」。フランス語読みは「ロチルド」[1])は、フランクフルト出身のユダヤ人富豪で、神聖ローマ帝国フランクフルト自由都市のヘッセン=カッセル方伯領の宮廷ユダヤ人であったマイアー・アムシェル・ロートシルト(1744-1812)が1760年代に銀行業を確立したことで隆盛を極めた[2]。それまでの宮廷関係者とは異なり、ロスチャイルドは富を遺すことに成功し、ロンドン、パリ、フランクフルト、ウィーン、ナポリに事業を設立した5人の息子[3]を通じて国際的な銀行家を確立した。一族は神聖ローマ帝国やイギリスの貴族階級にまで昇格した[4][5]。ロスチャイルド家の歴史は16世紀のフランクフルトに始まり、その名は1567年にイサク・エルチャナン・バカラックがフランクフルトに建てた家「ロスチャイルド」

    ロスチャイルド家 - Wikipedia
  • 椿事件 - Wikipedia

    椿事件(つばきじけん)は、1993年(平成5年)に発生した全国朝日放送(愛称および現社名:テレビ朝日)による放送法違反(政治的な偏向報道)が疑われた事件である。当時、テレビ朝日の取締役報道局長であった椿貞良の日民間放送連盟(民放連)会合での発言に端を発したことからこの名で呼ばれる。 経緯[編集] 1993年6月の衆議院解散(嘘つき解散)後、7月18日に第40回衆議院議員総選挙が行われ、与党自由民主党が解散前の議席数を維持したものの過半数を割り、非自民で構成される細川連立政権が誕生。自民党は結党以来初めて野党に転落した。 9月21日、日民間放送連盟の第6回放送番組調査会の会合が開かれ、そのなかで椿は「『ニュースステーション』に圧力をかけ続けてきた自民党守旧派は許せない[注 1]」と語り、選挙時の局の報道姿勢に関して、 「小沢一郎氏のけじめをことさらに追及する必要はない。今は自民党政権の存

    toruto
    toruto 2009/01/17
    一方で放送法で禁止されている偏向報道を行った事実は認めた。
  • mmap - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "Mmap" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2024年6月) mmap() は、UNIXのシステムコールのひとつで、ファイルやデバイスなどのオペレーティングシステム (OS) 上のリソース(計算資源)の一部または全部を連続した仮想アドレス空間にマッピングする関数である。 ファイルシステム上のリソースに対するアクセス方法として、ストリームI/Oを行うシステムコールとの比較で、ユーザー空間とカーネル空間の間で読み書きされるデータのブロック転送が多くのアーキテクチャ上では発生しないことから、好まれる場合がある。 デバイスでは、io

  • 構造化プログラミング - Wikipedia

    構造化プログラミング(こうぞうかプログラミング、(英: structured programming)は、コンピュータプログラムの処理手順の明瞭化、平易化、判読性向上を目的にしたプログラミング手法である。一般的には順接、分岐、反復の三種の制御構造(control structures)によって処理の流れを記述することと認識されている[1][2]。制御構造は制御構文、構造化文(structured statement)、制御フロー文(control flow statement)とも呼ばれる。また、プログラムを任意に分割した部分プログラム(サブルーチンとコードブロック)の階層的な組み合わせによるプログラムの構造化も指している。 このプログラミング手法の普及に貢献したのは、1968年の計算機科学者エドガー・ダイクストラによるACM機関紙への投書「Go To Statement Consider

    構造化プログラミング - Wikipedia
  • 江渡浩一郎氏の論文『Wikiの起源と進化』 - YAMDAS現更新履歴

    Twitter で書いていたので紹介してよいと思うが、江渡浩一郎氏が情報処理学会ヒューマンコンピュータインタラクション(HCI)研究会で「Wikiの起源と進化」(PDF)という論文を発表されている。 論文内容は「Mobile Society Review 未来心理」に発表されたものと近く、結局 Wiki は何なのだという疑問から出発してパタン・ランゲージにさかのぼり、HyperCard を経た Wiki の誕生を辿り、そしてデザイン・パターン、エクストリーム・プログラミングにつなげている。 参考文献に『Wiki Way』が出てこないのは少し残念(笑)

    江渡浩一郎氏の論文『Wikiの起源と進化』 - YAMDAS現更新履歴
  • クレジット・デフォルト・スワップ - Wikipedia

    ヨーロッパ各国のソブリン債CDS(2010-2011年) クレジット・デフォルト・スワップ(英語: Credit default swap, CDS)は、デリバティブ、特にクレジットデリバティブ(=信用リスクの移転を目的とする)の一種。特定の会社等が倒産したとき等に、一方の当事者から他方の当事者に、あらかじめ定められた範囲の金額が支払われる。 銀行の自己資比率を高める手法の一つとしても利用される。 一般向けの説明では保険とされているが、CDSは金融商品であり保険関連の法律に該当しないとの認識である。 仕組み[編集] クレジット・デフォルト・スワップの一つの取引(契約)は、2当事者の合意により成立(約定)する。これらの当事者の一方は「プロテクションの買い手」、もう一方は「プロテクションの売り手」という呼び名の役割を担う。 ここでまずはCDSの一般的な用途に基づいたケースを考える。 ある者A

    クレジット・デフォルト・スワップ - Wikipedia
  • New Traditionalists - Wikipedia

    "Love Without Anger" Released: August 26, 1981 "Through Being Cool" Released: September 18, 1981 "Beautiful World" Released: October 14, 1981 New Traditionalists is the fourth studio album by the American new wave band Devo, released in 1981 by Warner Bros. Records. The album was recorded over a period of four months between December 1980 and April 1981 at the Power Station in Manhattan, New York

    New Traditionalists - Wikipedia
  • 「ウィキペディア」に書かれた自分を検証する :: デイリーポータルZ

    メディアリテラシーが叫ばれがちなこの昨今、 メディアから発せられる情報や言葉に対して、 それを受信する側においても 十分な意識や姿勢が必要となってきております。 で、とりあえずこのネットというメディアにおいて、 我々がつい情報ソースとして頼っちゃうツールとして ネット百科事典「ウィキペディア」 っていうのがありますよね。 ネットのみんなで情報を出し合い知識を蓄積していく この「ウィキペディア」、 各項目について極めて詳細な情報が書き込まれていて、 ここに描かれていることは つい真実だと信じてしまいがちなものです。 ではそこで今回は! このウィキペディアを題材として ネットにおける情報の信憑性について ジャーナリスティックに検証してみたいと思います!! いつのまにか 「ウィキペディア」の項目として 書かれていた 自分の場合で。 (ヨシダプロ) ってことで「ウィキペディア」というのは ある項目

    toruto
    toruto 2008/11/16
    早慶の世界史の正誤問題ではこの辺について問うてくることもありますからね。
  • モンティ・ホール問題 - Wikipedia

    モンティ・ホール問題 閉まった3つのドアのうち、当たりは1つ。プレーヤーが1つのドアを選択したあと、例示のように外れのドアが1つ開放される。残り2枚の当たりの確率は直感的にはそれぞれ 1/2(50%)になるように思えるが、はたしてそれは正しいだろうか。 モンティ・ホール問題(モンティ・ホールもんだい、英: Monty Hall problem)とは、確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題の一つとなっている。モンティ・ホール(英語版)(Monty Hall, 名:Monte Halperin)が司会者を務めるアメリカゲームショー番組、「Let's make a deal(英語版)[注釈 1]」の中で行われたゲームに関する論争に由来する。一種の心理トリックになっており、確率論から導かれる結果を説明されても、なお納得しない者が少なくないことから、モンティ・ホール

    モンティ・ホール問題 - Wikipedia
  • 新自由主義 - Wikipedia

    新自由主義(しんじゆうしゅぎ)とは、政治や経済の分野で「新しい自由主義」を意味する思想や概念。なお日では以下の複数の用語の日語訳として使われている[1]。 「ネオリベラリズム」(en:neoliberalism)。1930年以降、社会的市場経済に対して個人の自由や市場原理を再評価し、政府による個人や市場への介入を最低限とすべきと提唱する経済学上の思想。1970年以降の日では主にこの意味で使用される場合が多い。 「ニューリベラリズム」(en:social liberalism)。初期の個人主義的で自由放任主義的な古典的自由主義に対して、より社会的公正を重視し、自由な個人や市場の実現のためには政府による介入も必要と考え、社会保障などを提唱する[2]。詳細は社会自由主義および社会的市場経済を参照。 当記事ではネオリベラリズムの意味を記述する。 1929年の世界恐慌による不況時、主にケインズ

    新自由主義 - Wikipedia
  • バグルス - Wikipedia

    バグルス(The Buggles)は、イングランド出身の音楽ユニット。楽曲「ラジオ・スターの悲劇」のヒットで知られる、ニュー・ウェイヴ期の代表的グループ。 概要[編集] 黎明期(1970年代 - 1978年)[編集] 1970年代にトレヴァー・ホーン(ベース)、ジェフ(ジェフリー)・ダウンズ(キーボード)、ブルース・ウーリー(英語版)(ギター)の3人は、イギリスのシンガー、ティナ・チャールズ(英語版)のバック・バンドとしてキャリアをスタートさせている。 1977年、ホーン、ダウンズ、ウーリーによりバグルスを結成。トレヴァー・ホーンは当初よりプロデューサー志向であり、3人で多くのCM関係の音楽を制作している。後にハリウッドで映画音楽作曲家として活躍するハンス・ジマーも裏方として参加しており、ホーンとジマーは後に映画『トイズ』で共作もしている。 以降、ウーリーは自身のグループ、ザ・カメラ・クラ

    バグルス - Wikipedia