タグ

ブックマーク / ja.wikipedia.org (33)

  • ロジスティック回帰 - Wikipedia

    ロジスティック回帰(ロジスティックかいき、英: Logistic regression)は、ベルヌーイ分布に従う変数の統計的回帰モデルの一種である。連結関数としてロジットを使用する一般化線形モデル (GLM) の一種でもある。1958年にデイヴィッド・コックス(英語版)が発表した[1]。確率の回帰であり、統計学の分類に主に使われる。医学や社会科学でもよく使われる[要出典]。 モデルは同じく1958年に発表された単純パーセプトロンと等価であるが、scikit-learnなどでは、パラメータを決める最適化問題で確率的勾配降下法を使用する物をパーセプトロンと呼び、座標降下法や準ニュートン法などを使用する物をロジスティック回帰と呼んでいる。 概要[編集] ロジスティック回帰モデルは以下のような形式である。x が入力で、pが確率(出力)、αとβがパラメータ。

    ロジスティック回帰 - Wikipedia
  • クイックソート - Wikipedia

    クイックソート(英: quicksort)は、1960年にアントニー・ホーアが開発したソートのアルゴリズム。分割統治法の一種。 個のデータをソートする際の最良計算量および平均計算量は (ランダウの記号)である。他のソート法と比べて一般的に最も高速だと言われている[2]が、対象のデータの並びやデータの数によっては必ずしも速いわけではなく、最悪の計算量はである。安定ソートではない。 クイックソートは以下の手順で行われる。 ピボットの選択:適当な値(ピボット(英語版)という)を境界値として選択する 配列の分割:ピボット未満の要素を配列の先頭側に集め、ピボット未満の要素のみを含む区間とそれ以外に分割する 再帰:分割された区間に対し、再びピボットの選択と分割を行う ソート終了:分割区間が整列済みなら再帰を打ち切る 配列の分割方法の一例として、以下のようなものが考えられる: 配列要素からピボット P

    クイックソート - Wikipedia
  • 乱択アルゴリズム - Wikipedia

    乱択アルゴリズム(らんたくアルゴリズム)、ランダム・アルゴリズム(英: randomized algorithm)または確率的アルゴリズム(かくりつてきアルゴリズム、(英: probabilistic algorithm)は、その論理の一部に無作為性を導入したアルゴリズムである。通常のアルゴリズムでは自然数を順番にあてはめるような決定的な部分で、乱数による非決定的な選択を入れることで、「平均的に」よい性能を実現することを目的とすることがある。形式的には、乱択アルゴリズムの性能はランダムビット列で決定される確率変数となる。その期待値を期待実行時間[1]と呼ぶ。最悪の場合に関して「無視できる」ほどに低い確率であることが、一般に、この類のアルゴリズムが効果的である要件となる。 乱択アルゴリズムが使われる背景[編集] n 個の要素からなる配列から「a」という要素を探す問題を考える。この配列の各要素

  • 転置インデックス - Wikipedia

    転置インデックス(てんちインデックス、Inverted index)とは、全文検索を行う対象となる文書群から単語の位置情報を格納するための索引構造をいう。転置索引、転置ファイル、逆引き索引などとも呼ばれる。 情報処理テクノロジにおける転置インデックスとは、単語や数字といった内容から、それが含まれているデータベースやドキュメント群へのマッピングを保持するという、インデックス型データ構造である。ドキュメント群へのマッピングの場合、検索エンジンが実現される。転置インデックスファイルは、インデックスというよりはデータベースと呼んだほうがふさわしい場合もある。また、検索キーが単語(文字列)であり、連想配列の値が位置情報である場合、ハッシュテーブルの形態を取ることもある。 転置インデックスには大きく分けて2通りの手法がある。レコード単位転置インデックス(record level inverted in

  • MySQL - Wikipedia

    MySQL(マイ・エスキューエル、海外では俗にマイ・シークェルとも)は、オープンソースのリレーショナルデータベース管理システム (RDBMS) である。その名前は、共同設立者のミカエル・ウィデニウスの娘の名前である「My」と、Structured Query Languageの略称である「SQL」を組み合わせたものである。 MySQLは、GNU General Public Licenseの条件に基づいたフリーでオープンソースのソフトウェアであり、さまざまなプロプライエタリライセンスでも利用可能である。MySQLは、サン・マイクロシステムズ(現在のオラクル)に買収されたスウェーデンの企業MySQL ABが所有、出資していた。2010年にオラクルがサンを買収したとき、ウィデニウスはオープンソースのMySQLプロジェクトをフォークしてMariaDBを作った。 MySQLは、LAMP Webアプ

    MySQL - Wikipedia
    inouetakuya
    inouetakuya 2011/09/17
    以前はMyISAMの方が高速であると言われることが多かったが、InnoDBの性能改善が進んだことから、高速性を求めるためにMyISAMを利用するということも減ってきている。
  • 佐藤健太郎 (実業家) - Wikipedia

    佐藤 健太郎(さとう けんたろう、1981年1月10日 - )は、日の実業家であり、GMOペパボ株式会社代表取締役社長。鹿児島県鹿児島市出身。愛称は「ケンタロさん」。 略歴[編集] 大学生時代に互いのホームページを通し、合資会社マダメ企画を経営していた家入一真と出会い、掲示板を通して交流を深める[1]。事業を継承する有限会社paperboy&co.を家入が設立した際に、手伝わないかと声を掛けられ東和大学卒業を機に入社する。入社後は、ロリポップ!のサービスサポートやマーケティングなどを担当し、経営企画室長として上場準備にも携わる[2]。 2009年3月25日、代表取締役社長の家入一真(当時)の退任に伴う人事異動により、代表取締役社長に就任する。 2003年1月 - 有限会社paperboy&co.に入社 2004年3月2日 - 有限会社paperboy&co.が株式会社に組織変更。 200

  • Apache Lucene - Wikipedia

    Apache Lucene(アパッチ ルシーン)は、Doug Cuttingによって開発された、Java製のFLOSSの検索ライブラリである。Luceneは、強力な文書インデキシング及び検索機能、スペルチェック、ハイライト、テキスト解析機能を提供する。Apacheのトップレベルプロジェクトの1つである。 概要[編集] Luceneは、Apache Solr、Elasticsearch等の検索プラットフォームで利用される検索ライブラリである。以前はLucene.NET、Mahout、Tika、Nutchといったサブプロジェクトが存在したが、現在はすべて独立したApacheのトップレベルプロジェクトとなっている。2010年3月から、Apache SolrがLuceneのサブプロジェクトとして開発コミュニティがマージされた。 Luceneで日語のテキスト解析を利用するためには、Kuromoji

  • 全文検索 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "全文検索" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2018年2月) 全文検索(ぜんぶんけんさく、英: Full text search)とは、コンピュータにおいて、複数の文書(ファイル)から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。 全文検索技術[編集] grep型[編集] 順次走査検索、逐次検索ともいう。「grep」とはUNIXにおける文字列検索コマンドであり、複数のテキストファイルの内容を順次走査し

    全文検索 - Wikipedia
  • 形態素解析 - Wikipedia

    語の代表的な形態素解析の手法[編集] 英語の場合と異なり、文節を得るのが目的となることが多い。大まかに言えば文から切り出した単語が属する品詞を辞書(自然言語処理用の)を用いて調べていき、結果得られた並びから正しく文節が構成される並びであるものを正解であるとするといったような方法を取る。 日語文法では、たとえば動詞のあとに格助詞がくることはできない(「ドアを開けるを」などは不可)といったように、ほとんどの付属語について「このようなものの後には付く」「このようなものの後には付かない」という規則性があり、また動詞の活用はその後に来る品詞を制限することがある(たとえば連体形の後は名詞)。このような性質を利用することによって単語の境界の判別を行う。具体的にこの性質を利用する方法には以下の2つがある: 規則による方法 確率的言語モデルをもちいる方法 規則による形態素解析[編集] 長尾真らの197

    形態素解析 - Wikipedia
  • Senna - Wikipedia

    Senna(せな、Senna: An Embeddable Fulltext Search Engine)は、未来検索ブラジルによって開発されているオープンソースの全文検索エンジンである。検索速度が高速なことから、「音速の貴公子」と呼ばれたアイルトン・セナにちなんで名づけられた。 概要[編集] MeCabによる形態素解析の結果を用いた単語ベースのインデックスと、N-gramによるトークン抽出を用いたインデックスの両方を作成することができる。 ライセンスはLGPL。UNIX系OS及びWindowsで動作する。 バグフィックスを除いた新たな開発は事実上終了しており、開発元の未来検索ブラジルでは、後継となる検索エンジンとして『groonga』(ぐるんが)の開発を進めている。 特徴[編集] 高速なインデックスの更新 一般的に、作成済みの全文検索インデックスに対する新たなレコードの追加は負荷がかかる

    inouetakuya
    inouetakuya 2011/08/12
    MySQLの全文検索機能は、バージョン5.1までは日本語に対応していないが、Sennaを利用することによって、高速な日本語検索が可能となる。
  • Apache Solr - Wikipedia

    Solr(ソーラー)は、オープンソースの全文検索システム。Apacheソフトウェア財団のLuceneプロジェクトのサブプロジェクトとして開発されている。 概要[編集] 全文検索エンジンライブラリLuceneをベースに、管理画面やキャッシュ機構を取り入れたアプリケーション。 機能上の特徴は、検索結果にファセットと呼ばれる検索結果を特定の軸でクラスタリング、それぞれの件数情報を付加することができること。商用の検索エンジンでもこの機能があるものは少ない。 構造上の特徴は、内部はいくつかのコンポーネントに分かれ、各所にプラグイン機構を持っているため拡張性に優れる、また、さまざまなキャッシュを持つことからより多くの検索クエリを捌けるようになっていること。 なお、v1.3になって追加されたDataImportHandler (DIH) という追加機能(contribに収録)を使うと、Oracleをはじ

    Apache Solr - Wikipedia
  • コンパクトシティ - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "コンパクトシティ" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2019年9月) この記事には独自研究が含まれているおそれがあります。問題箇所を検証し出典を追加して、記事の改善にご協力ください。議論はノートを参照してください。(2019年9月) コンパクトシティ(英: compact city)とは、都市的土地利用の郊外への拡大を抑制すると同時に中心市街地の活性化が図られた、生活に必要な諸機能が近接した効率的で持続可能な都市、もしくはそれを目指した都市政策のことである[1]。 富山市内の複数箇所に設置されたレンタサイクルステーション 概

    コンパクトシティ - Wikipedia
  • 室伏広治 - Wikipedia

    室伏 広治(むろふし こうじ、Koji Murofushi、1974年〈昭和49年〉10月8日 - )は、日のハンマー投選手、スポーツ科学者、陸上競技指導者。スポーツ庁長官(第2代)、東京医科歯科大学非常勤講師[2]。 2004年アテネオリンピック ハンマー投の金メダリスト。陸上・投擲種目で金メダルを獲得したのはアジア人史上初の快挙。ハンマー投のアジア記録・日記録保持者。日選手権で前人未到の20連覇を達成している。父親の室伏重信もアジア大会5連覇、日選手権10連覇している。 1984年に室伏重信がハンマー投の日記録をマークして以来、重信から広治へと室伏親子が日記録を保持し続けている(重信は広治に次ぐ日歴代2位の75m96)。そして、広治の妹の室伏由佳も女子ハンマー投の日記録保持者であるため、室伏兄妹がそれぞれ男子・女子ハンマー投の日記録保持者となっている。 愛知県豊田市出

    室伏広治 - Wikipedia
  • Python - Wikipedia

    Pythonは1991年にグイド・ヴァン・ロッサムにより開発されたプログラミング言語である。 最初にリリースされたPythonの設計哲学は、ホワイトスペース(オフサイドルール)の顕著な使用によってコードの可読性を重視している。その言語構成とオブジェクト指向のアプローチは、プログラマが小規模なプロジェクトから大規模なプロジェクトまで、明確で論理的なコードを書くのを支援することを目的としている。 Pythonは動的に型付けされていて、ガベージコレクションされている。構造化(特に手続き型)、オブジェクト指向、関数型プログラミングを含む複数のプログラミングパラダイムをサポートしている。Pythonは、その包括的な標準ライブラリのため、しばしば「バッテリーを含む」言語と表現されている[† 1]。 Pythonのインタプリタは多くのOSに対応している。プログラマーのグローバルコミュニティは、自由かつオ

  • .info - Wikipedia

    .infoはジェネリックトップレベルドメイン(gTLD)の一つである。情報サイトの使用を意図しているが、特に用途の規制はない。このことは、2000年後半に7つの新しいgTLDが公表されたときに、ICANNが明言している。なお、このgTLD追加は1980年代、DNSが開発されて以来初めての大規模な追加だと宣伝された。これら180以上の提案から選ばれた、7つの新しいgTLDは、過密だった.comドメインからの解放をある程度意識したものであった。 .infoはこれら新しい7つの新しいgTLDのなかで最も成功したドメイン名で、2006年中頃で300万以上の登録がされている。それに加え、160万の.infoドメインのサイトは生きている。例えば、アメリカ同時多発テロ事件の余波で、ニューヨーク州都市交通局は覚えやすいドメイン名(mta.info)に切り替えた。Chomsky.infoは政治活動家のノーム

    .info - Wikipedia
  • .biz - Wikipedia

    .biz(ビズ、ドットビズ)は、ジェネリックトップレベルドメイン(gTLD)の一つで、ビジネス全般に使われることを想定している。.bizの由来は"business"の音節の最初の部分である。このドメインは、既に別の企業などに.comドメインを登録されてしまった企業に代わりのものを提供するために作られた。 概要[編集] .bizドメインには登録に必要な条件は特にない。ただし、きちんとした会社か商用でない(例:個人使用、演説用、転売目的)場合は除く。また、ドメインを商標権を持たない者にとられて、商標権を侵害された者を救済する措置もある。 このドメインは、1990年代のインターネットの流行を受けてICANNが2001年に認めた新しいgTLDの一つである。このドメインはNeulevelによって管理されている。 .infoのサービス開始時とは対照的に、.bizでは商標保持者に優先登録権が与えられなか

    .biz - Wikipedia
  • Secure Shell - Wikipedia

    Secure Shell(セキュア シェル、SSH)は、暗号や認証技術を利用して、安全にリモートコンピュータと通信するためのプロトコル。パスワードなどの認証を含むすべてのネットワーク上の通信が暗号化される。 概要[編集] 従来からTelnet、rsh、rloginなどリモートホストのシェルを利用するためのプロトコルは存在した。しかしながら、これらはネットワークに平文でパスワードを送信するため、パスワードを覗き見(盗聴)される危険性が高く、特にインターネット上では大きな問題であった。SSHは通信を暗号化した代替の通信プロトコルである。 オリジナルのSSHは、フィンランド出身のプログラマであるタトュ・ウルネン (Tatu Ylönen) により1995年に開発され、はじめフリーで公開された。しかし、同年12月には、SSH社 (SSH Communications Security) が設立され

    inouetakuya
    inouetakuya 2011/02/02
    現在は、バージョン1とバージョン2の2種類のプロトコルが共存している。脆弱性が発見されているため、バージョン1の利用は推奨されない。
  • Secure Hash Algorithm - Wikipedia

    Secure Hash Algorithm(セキュアハッシュアルゴリズム)、略称SHAは、一群の関連した暗号学的ハッシュ関数であり、アメリカ国立標準技術研究所(NIST)によって標準のハッシュ関数Secure Hash Standardに指定されている。 概要[編集] (2017年現在)SHA-0、SHA-1、SHA-2、SHA-3の4種類(ないし、SHA-0はSHA-1に含めて3種類)に大別される。SHA-2まではMD5などと同じ Merkle–Damgård construction(en:Merkle–Damgård construction)のバリエーションと言える構造だが、SHA-3 は全く別の構造となっている。SHA-2 以降はハッシュサイズを大きくしたバリエーションが用意されており、SHA-2には、SHA-224、SHA-256、SHA-384、SHA-512、SHA-512

    inouetakuya
    inouetakuya 2011/01/28
    もっともよく使われる関数はSHA-1でTLS、SSL、PGP、SSH、S/MIME、IPSecなど、さまざまなセキュリティのアプリケーションやプロトコルに採用されている。
  • Git - Wikipedia

    Git(ギット[2][3])は、プログラムのソースコードなどの変更履歴を記録・追跡するための分散型バージョン管理システムである。Linuxカーネルのソースコード管理に用いるためにリーナス・トーバルズによって開発され、それ以降ほかの多くのプロジェクトで採用されている。Linuxカーネルのような巨大プロジェクトにも対応できるように、動作速度に重点が置かれている。現在のメンテナは濱野純 (英語: Junio C Hamano) で、2005年7月から担当している。 Gitでは、各ユーザのワーキングディレクトリに、全履歴を含んだリポジトリの完全な複製が作られる。したがって、ネットワークにアクセスできないなどの理由で中心リポジトリにアクセスできない環境でも、履歴の調査や変更の記録といったほとんどの作業を行うことができる。これが「分散型」と呼ばれる理由である。 背景および概要[編集] Linuxカーネ

    Git - Wikipedia
  • WebDAV - Wikipedia

    WebDAV(Web-based Distributed Authoring and Versioning、ウェブダブ)はHypertext Transfer Protocolを拡張したもので、Webサーバ上のファイル管理を目的とした分散ファイルシステムを実現するプロトコルである。 概要[編集] WebDAVは、Webサーバに対して直接ファイルのコピーや削除を行ったり、ファイル所有者や更新日時などのファイル情報を取得・設定するといった機能を持つ分散ファイルシステムで、HTTP 1.1を拡張したプロトコルで実現される。元々はファイルのバージョン管理機能も内包していたが、後に RFC 3253 で定義されたDelta-Vに分離された。 マイクロソフトによって最初に開発され、1999年2月に RFC 2518 が発表された。2007年6月に発表された RFC 4918 が2008年1月現在最新の

    inouetakuya
    inouetakuya 2011/01/17
    Mac OS X Finderは、WebDAVクライアント機能を内蔵している。アップルが運営するストレージサービスiDiskへのアクセスには、WebDAVを利用している。