タグ

ブックマーク / ja.wikipedia.org (22)

  • 波ダッシュ・全角チルダ問題 - Wikipedia

    Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界標準規格。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 従来、各国の標準化団体あるいは各コンピュータメーカーによって独自に開発されていた個々の文字コードの間には互換性がなかった[1]。ISO/IEC 2022のように複数の文字コードを共存させる方法も考案されたが、例えば日語の漢字と中国語の漢字のように、文字が重複する短所がある。一方Unicodeは、微細な差異はあっても質的に同じ文字であれば一つの番号を当てる方針で各国・各社の文字コードの統合を図った規格である[1]。1980年代に、Starワークステーションの日語化(J-Star)などを行ったゼロックスが提唱し、マイクロソフト、Apple、IBM、サン・マイクロシステムズ、ヒ

    波ダッシュ・全角チルダ問題 - Wikipedia
  • 技術的負債 - Wikipedia

    技術的負債英語: technical debt)、設計負債[1]、またはコード負債とは、ソフトウェア開発における概念であり、時間はかかるがより良いアプローチを選択する代わりに、簡単ではあるが限定的な解決策を選択することで生じる、将来的な手直しにかかる暗黙のコストを示すものである[2]。 金銭的な負債と同様[3]に、技術的負債も返済されなければ、「利子」が蓄積され、変更の実施が困難になる。技術的負債を処理しないと、ソフトウェアのエントロピーが増大する。金銭的負債と同様に、技術的負債も必ずしも悪いものではなく、プロジェクトを前進させるために(概念実証として)必要な場合もある。一方で、「技術的負債」というメタファーは、その影響を最小限に抑える傾向があり、その結果、修正するために必要な作業の優先順位付けが不十分になると主張する専門家もいる[4][5]。 コードベース上で変更が開始されると、コード

  • NAT traversal - Wikipedia

    NAT traversal(NATトラバーサル)は、TCP/IPネットワークにおいてNAT機器を用いた上で、複数ホスト間のネットワーク接続を確立する際に生じる問題を解決するために設計されたアルゴリズムである。ちなみに、NAT traversalはNAT通過を意味し、NAT越えとも呼ばれる。 例えば、P2PやVoIPなどのホスト間通信を行うアプリケーションが、相手側のNAT機器を用いたプライベートネットワークに属するホストを直接指定できない、すなわち、NATを通過できないといった問題がある。 通常は、IPsecVPNクライアントがESPパケット[1]にNATの通過をさせるためにNAT-Tが用いられる。 NAT traversal技術には多くの種類がある。しかし、NATの機能が標準化されていない為に、全ての場合において動作するNAT traversal技術は存在しない。多くのNAT trave

  • ボイヤー-ムーア文字列検索アルゴリズム - Wikipedia

    テキスト T = "ANPANMAN" に対して k = 3 から k = 8 までパターン P = "PAN" を配置した様子。この場合、k = 5 の位置で一致する。 文字列 S に対する操作を以下のように表す: S[i]: 文字列 S の i 番目の文字 S[i..j]: 文字列 S の i から j 番目までの部分文字列(i 文字目、j 文字目をそれぞれ含む) 文字列 S に含まれる文字の個数を文字列の長さと定義する。また、文字列 S の先頭を含む部分文字列をプレフィックス、末尾を含む部分文字列をサフィックスと定義する。 len(S):S の長さ S[1..i], 1 ≤ i ≤ len(S):S のプレフィックス S[i..len(S)], 1 ≤ i ≤ len(S):S のサフィックス 検索文字列をパターンと呼び、P で表す。被検索文字列をテキストと呼び、T で表す。また T

    hiro-tak
    hiro-tak 2010/01/04
    [][アルゴリズム][algorithm][検索][文字列検索]
  • Yacc - Wikipedia

    Yacc(英: yet another compiler compiler、ヤック)はパーサジェネレータの一つである。1970年代にAT&TでUNIX用にスティーヴン・カーティス・ジョンソンが開発した。 概要[編集] 名称[編集] Yacc は yet another compiler compiler(またひとつのコンパイラコンパイラ)に由来する。コンピュータ黎明期には「自動プログラミング」と呼ばれたプログラミング言語処理系の技術の進展の方向として、当時、機械語プログラムを生成するコンパイラの次はコンパイラを生成するコンパイラコンパイラであろう、ということで盛んに研究がされており、そのためコンパイラコンパイラを名乗る研究が他にもあれこれ存在した。 パーサはコンパイラの全てではないので、コンパイラコンパイラと呼ぶには Yacc のようなパーサジェネレータは不足と言えなくもないが、特段意識さ

  • 音声合成 - Wikipedia

    「読み上げソフト」はこの項目へ転送されています。耳が聞こえる視覚障害者向けにウェブサイトなどのコンピューター上の表示を読み上げるソフトウェアについては「スクリーンリーダー」をご覧ください。 この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "音声合成" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2023年11月) ヒトは発声器官を通じて音声を生成し、コミュニケーションを行なう(会話や演説、講演、各種芸能およびその中継や録音・録画など)。この音声を人工的に生成するタスクが音声合成である。合成された音声を合成音声(ごうせいおんせい)と呼ぶ。 音声合成は様々な手法で実現できる。ある種の楽

  • Apache Hadoop - Wikipedia

    Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleMapReduceおよびGoogle File System(GFS)論文に触発されたものである。 HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。[2] Hadoopは、以下の4つのモジュールによって構成されている。 Hadoop Common: 他のモジュールから共通して利用されるライブラリ群。 Hadoop Distributed File System (HDFS): Hadoop独自の分散ファイルシステム。 Hadoop YARN: Hado

  • 分類学 - Wikipedia

    この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2011年7月) 独自研究が含まれているおそれがあります。(2012年9月) 出典検索?: "分類学" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 分類学(ぶんるいがく、英語: taxonomy)とは、生物を分類することを目的とした生物学の一分野。生物を種々な共通的な特徴によって分類し[1]、体系的にまとめ、生物多様性を理解する。 なお、広義の分類学では無生物も含めた事物(観念も含めて)を対象とする。歴史的には博物学にその起源があり、古くは、鉱物などもその対象としたが、それらの分野は分類学という形で発展することがなかった。以下の叙述では狭義

  • パーセントエンコーディング - Wikipedia

    パーセントエンコーディング (英: percent-encoding) とは、URIにおいて使用できない文字を使う際に行われるエンコード(一種のエスケープ)の名称である。「%」を使用していることから、この名称で呼ばれている。一般にURLエンコードとも称される。 URLエンコードには、上記のパーセントエンコーディングによる符号化と以下に記述するapplication/x-www-form-urlencodedによる符号化の2種類がある。半角スペースはパーセントエンコーディングでは「%20」に符号化されるが、application/x-www-form-urlencodedによる符号化では「+」に符号化される。 概要[編集] URL Standardでは、URLのパス部分の構文解析の際、以下 (path percent-encode set) に該当する文字であれば、UTF-8で符号化のうえパ

  • メールアドレス - Wikipedia

    この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2021年3月) 古い情報を更新する必要があります。(2021年3月) 出典検索?: "メールアドレス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL この記事の正確性に疑問が呈されています。 問題箇所に信頼できる情報源を示して、記事の改善にご協力ください。議論はノートを参照してください。(2013年12月) 疑問点:メールアドレスの国際化対応 メールアドレス(英語: electronic mail address, email address, e-mail address)、Eメールアドレス(イーメールアドレス)、電子メールアドレス[1]

    hiro-tak
    hiro-tak 2009/07/30
    電子メールでの使用形式
  • AirSnort - Wikipedia

    AirSnort(エアスノート)は、IEEE 802.11シリーズで使われる暗号化方式であるWEP (Wired Equivalent Privacy) の暗号鍵をクラックしてしまうソフトウェア。2001年8月に公開された。 FBIが検証したところ3分ほどでクラッキングを完了されるのが確認されたが、何の対策もされなかった。 AirSnortの仕組みとWPAの登場[編集] AirSnortは受信するパケットを監視し、50,000~100,000パケットほどのパケットが集まると、WEPの欠陥を突いて暗号化鍵をクラッキングする。クラッカー向け雑誌でも紹介され、6~7分間でクラッキングが完了したとのレポートが出されている。 元々WEPにはアルゴリズムそのものに脆弱性があることが知られていたが、これらのソフトの登場によりコンピュータ業界は早急に新たな無線LAN用の暗号化プロトコルを標準化する必要に迫

  • reStructuredText - Wikipedia

    reStructuredText は、軽量マークアップ言語のひとつ。ソースコードの状態で高い可読性を持つように設計されている。reStructuredText パーサは、テキスト処理フレームワークである Docutils のコンポーネントのひとつであり、Python で実装されている。 reStructuredText は、RST、reST、ReST と略されることもある。

  • Inode - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "Inode" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2020年12月) inode(アイノード)は、ext2などのUnix系ファイルシステムで古くから使われているデータ構造である。inode にはファイル、ディレクトリなどのファイルシステム上のオブジェクトに関する基情報が格納される。 ReiserFSなどの最近のUnix系ファイルシステムでは inode を使用していないが、同等の機能を提供するには同等の情報をどこかに格納しなければならない。statシステムコールがそれらのデータをプログラム向けに提供するので、これを statデ

    Inode - Wikipedia
  • マルコフ連鎖 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "マルコフ連鎖" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2018年1月) マルコフ連鎖(マルコフれんさ、英: Markov chain)とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なもの(離散状態マルコフ過程)をいう。また特に、時間が離散的なもの(時刻は添え字で表される)を指すことが多い[注釈 1]。マルコフ連鎖は、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である(マルコフ性)。各時刻において起こる状態変化(遷移または推移)に関して、マルコフ連鎖は遷移確率が過去の状態によらず、

  • MODX - Wikipedia

    MODX(モドエックス,モッドエックス)とは、MODX LLCまたはMODX JAPANによって開発されているコンテンツ管理システム (CMS) の一種で、そのシリーズの総称を指す。PHPおよびMySQL環境にて動作する。 MODX EvolutionとMODX Revolutionに分類され、それぞれ別々のCMSとなっている。 EtomiteがMODXの前身となっている。2004年9月、Etomite用の機能拡張である「DocVar」がリリースされる。現在のMODXに備わっている「テンプレート変数」機能の元祖となったもので、これにより投稿画面上のカスタムフィールドの自由な拡張が可能になった。これに興味を示したRyan Thrashは、DocVarの開発を受け継ぎ、フォーラム内で意見交換を深める。 その一方でEtomite体はAlex(原作者)のアクティビティが低下し、開発の停滞と共にプ

  • Representational State Transfer - Wikipedia

    この記事には独自研究が含まれているおそれがあります。問題箇所を検証し出典を追加して、記事の改善にご協力ください。議論はノートを参照してください。(2023年11月) Representational State Transfer (REST、レスト[1][2][3][4]) は、ウェブAPI(ウェブアプリケーションプログラミングインタフェース)の定義に使用されるアーキテクチャスタイル(共通仕様)[5]であり、同時にウェブのような分散ハイパーメディアシステムのためのソフトウェアアーキテクチャのスタイルのひとつでもある。この語はHTTPプロトコル規格の主要著者の一人であるロイ・フィールディング(英語版)がウェブについて書いた2000年の博士論文で初めて現れ、ネットワーキングコミュニティの中ですぐに広く使われることになった。 RESTは、初めはアーキテクチャの原則と制約の集まり(後述)を指してい

  • 信頼性設計 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "信頼性設計" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2011年11月) 信頼性設計(しんらいせいせっけい)とは、工学分野において、システム・装置または部品が使用開始から寿命を迎えるまでの期間を通して、予め期待した機能を果たせるように、すなわち故障や性能の劣化が発生しないように考慮して設計する手法のこと。 冗長性設計[編集] 設計の世界において、二重に対策を講じておき、システム全体の信頼性を増加させる手法を「冗長性」という。 機械は通常多くの部品から成り立っており、部品のひとつが破壊したとしても機械全体が連鎖的に停止してしまう場合が

  • 可変長数値表現 - Wikipedia

    可変長数値表現(かへんちょうすうちひょうげん)とは、数値の値によってその表現に要する領域が変化する、数値の表現形式のひとつである。 文字列としての数値[編集] 文字(おもにアスキーコードが使われる)、ないしはBCD表現で数値の各々の桁を表現する。値の大きさを表現する方法として、数列の先頭に桁数を置く方法と、区切り文字ないしは終端コード(NUL文字がよく使われる。BCDでは0xffなどありえない値で代用する)を用いる方法がある。この表現は数値を表現する上でかなり効率が悪いが、異なる数値表現を使用するシステム間で確実に正確な値を伝達する方法として用いられる(伝達される双方のシステムがIEEE 754表現を採用してあったとしても、値を取り扱う際に有効桁外の丸め方法によっては誤差が生ずる)。いくつかのインタプリタ言語では数値を内部表現に変換せず、メモリが許す限り長精度の値を扱う実装がある。これらの

  • http://ja.wikipedia.org/wiki/%25u30A2%25u30EB%25u30D9%25u30EB%25u30C8%25u30FB%25u30B7%25u30E5%25u30D0%25u30A4%25u30C4%25u30A1%25u30FC

    hiro-tak
    hiro-tak 2007/04/27
  • 形態素解析 - Wikipedia

    形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。 もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを

    形態素解析 - Wikipedia