タグ

languageに関するtsukkeeのブックマーク (15)

  • プログラミング言語の特徴を視覚的に比較する - Radium Software

    The Computer Language Benchmarks Game のページでは,計 32 個のプログラミング言語処理系のベンチマークを集計して,そのパフォーマンスを比較している。そして最近,このページに新たなプロットが追加された。単純にパフォーマンスだけの比較を行うのではなく,パフォーマンスと「コードの長さ」を関連付けて比較を行うというものだ。上はそのプロットから一部を転載したもので,全体はこのページで見ることができる。 このプロットでは,縦軸が処理時間(上にいくほど遅い),横軸がコードの長さ(右にいくほど冗長)に割り当てられている。このようなプロットを行うと,多くの言語は3通りの偏り方を見せる ― 左上(簡潔だけど遅い)に偏る「スクリプト系」,右下(速いけど冗長)に偏る「システム系」,そして,左下(速くて簡潔!)に偏る「理想系」だ。ちなみに,右上(遅くて冗長)に偏る言語は無い…

    プログラミング言語の特徴を視覚的に比較する - Radium Software
  • 八割の動詞 - Backnumbers: Steps to Phantasien

    PC は忙しい時ほど壊れる. 先週は職場の PC にこの経験則が降りかかった. 頻繁にフリーズしはじめる VisualStudio 2008. VS 単体での修復では問題が直らず困り果て, 結局 OS から入れ直す羽目に. まあディスクが故障しなかっただけ幸いだと思おう... OS の入れ直しは生活習慣を見直し悪習を捨てる機会でもある. 私の Windows 生活で最大の悪習は cygwin だ. ホスト OS への敬意を欠く cygwin には以前から後ろめたさを感じていたが, 惰性でずるずると使い続けていた. 今回のトラブルは良き市民たれという神(シアトル在住)の思し召しかもしれない. 啓示に耳を傾け, しばらく cygwin なしでがんばってみたい. PowerShell cygwin を捨てるということはシェルを乗り換えるということだ. いま Windows 民の間でホットなシェル

  • 【レビュー】Googleからの贈り物 - Google AJAX Language APIでカンタンに翻訳サイトを (1) 超シンプルなAPIながらスゴイ実力 | エンタープライズ | マイコミジャーナル

    20日に発表されたGoogleの新しいWeb APIGoogle AJAX Language APIは、誰でも簡単に言語の翻訳を行えるようにするJavaScript APIだ。同APIを使うと、JavaScript文字列に対して「日語←→英語」や「中国語←→英語」と言った変換を簡単に行えるのみならず、文字列が何語で書かれているかを自動判別することもできる。 同APIのパワーがどれほどのものかというと、以下のような翻訳サイトを10分足らずで作れてしまったほどだ(ソースコードは次ページで解説)。 非常にシンプルなAPI(メソッド2つしかない!)にも関わらず、そのパワーがあまりに凄まじすぎる。この興奮をぜひ皆さんにもお伝えしたいと思う。 ということで、さっそくLanguage APIの使い方を学んでいこう。

  • TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア

    TinySegmenterはJavascriptだけ書かれた極めてコンパクトな日語分かち書きソフトウェアです。 わずか25kバイトのソースコードで、日語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 Yahoo!形態素解析のように サーバーサイドで解析するのではなく、全てクライアントサイドで解析を行うため、セキュリティの 観点から見ても安全です。分かち書きの単位はMeCab + ipadicと互換性があります。 デモ 日語の文章を入力し、解析ボタンをクリックしてください。 ダウンロード TinySegmenterはフリーソフトウェアです. 修正BSDライセンスに従ってソフトウェアを使用,再配布することができます. Download TinySegmenter version 0.2 使い方 <script type="text/javascript" src

  • TinySegmenter - mayokara memo

    tsukkee
    tsukkee 2008/10/13
    for わっきー
  • JavaScriptで簡易形態素解析 その2 - mayokara memo

    JavaScriptで簡易形態素解析 - mayokara lab JavaScriptで簡易形態素解析 - mayokara memo さらに改造。 ■ コード /* ipadic Licence --- Copyright 2000, 2001, 2002, 2003 Nara Institute of Science and Technology. All Rights Reserved. Use, reproduction, and distribution of this software is permitted. Any copy of this software, whether in its original form or modified, must include both the above copyright notice and the following p

  • サラ金の債権譲渡が行われたとき | 損をしない借金の仕方?それならここがお勧めです!

    借りているサラ金から突然連絡が来て、債権譲渡のお知らせなどと言われる事がたまにあります。そもそも債権譲渡とは何でしょうか。 そのサラ金が事業を辞める為に、別会社に債権をそのまま譲渡すると言うのが債権譲渡です。以前の会社から新しい会社に債権が移っただけで、借りてる方としたら、殆ど変化が無いのが債権譲渡と言えます。連絡が来た時に、返済する場所が変わる旨などが伝えられた場合には、返済を間違えずに行わなければなりません。また債権譲渡により、返済する金額が変更になるなどと言う事はまずありませんので特に問題は無いでしょう。 いきなり借りてる会社からそんな連絡が来ると、なんだか怖いイメージですが、全く怖いというものではありませんので、今までどおりに返済を続けていけば特に問題は無いでしょう。 ただし、債権譲渡は債権譲渡でももう一つ別の形の債権譲渡が存在します。借りてるサラ金会社の返済を延滞した場合、うちで

  • 形態素解析エンジン「マリモ」の記事から - 傀儡師の館.Python:楽天ブログ

    2007.08.16 形態素解析エンジン「マリモ」の記事から (1) カテゴリ:ことばの処理 先日、日語解析製品マリモは未知語の自動登録をするらしいを書いたが、@IT にマリモの記事があった。開発元のムーターに聞く 辞書不要の形態素解析エンジン「マリモ」とは。 「処理対象となるテキストの文を、1文字ごと、2文字ごと、3文字ごとと10文字単位になるまで、すべての組み合わせを解析します。漢字部分以外は、すべてローマ字に変換して行うため、母音と子音の組み合わせから新語の品詞が推定できます」(テクノロジー部門担当執行役 田中優氏)。 なるほど、そういうことやってるのね。 前略プロフを見てみる に書いた例文、 悩み深きみずがめ座♪ くるまを売る なんかはうまく解析できるのかな。MeCab だと、こういうのはこけちゃう。 マリモは、あらかじめ動詞や形容詞の活用形についての知識を持たず、頻度情報と位置

    形態素解析エンジン「マリモ」の記事から - 傀儡師の館.Python:楽天ブログ
  • 辞書不要の形態素解析エンジン「マリモ」とは − @IT

    2007/08/15 検索サービスを提供するベンチャー企業のムーターは8月1日、辞書を必要としない形態素解析エンジン「マリモ」の提供を開始した。従来、形態素解析では品詞情報を含む日語辞書を用意するのが常識だったが、マリモでは、そうした辞書を不要とした。新技術のアプローチと特性について、開発元のムーターに話を聞いた。 統計処理で単語部分を推定 形態素解析とは、与えられた文を、文法上意味のある最小の単位(形態素)に区切る処理。「今日は晴れています」なら、「今日(名詞)/は(助詞)/晴れ(動詞)/て(助詞)/い(助詞)/ます(助動詞)」と分ける。検索エンジンをはじめ、さまざまな自然言語処理の場面で必要となる基礎技術だ。 形態素解析を行うには、あらかじめ品詞情報が付加された数十万語からなる辞書を用意する必要がある。また、新語や造語、専門用語に対応するには、個別に人力で単語を登録する必要がある。

  • zuzara : 文章からキーワードを抜き出すAPI: KOSHIAN

    エラー<error> <message>GET/POST param q is invalid.</message> </error>米Y!の同じ機能を持ったAPIを参考にしています。 Term Extraction Documentation for Yahoo! Search Web Services サンプルレスポンス http://zuzara.dyndns.org/api/koshian?q=Microsoft+マイクロソフト <ResultSet> <Result id="2454">MICROSOFT</Result> <Result id="2454">マイクロソフト</Result> </ResultSet>デモフォーム 適当な文章を入力してください。 注意点 サーバの回線が細いのが不安です。将来的にドメイン名が変わる可能性が高いです。蹴飛ばしてケーブルが抜ける等の生活に

  • ブログの記事本文を抽出するAPI: TSUBUAN

    KOSHIANに続いてTSUBUANをつくりました。 URLを与えるとそのページに含まれる文らしき文章をXMLで返すAPIです。 RESTで引数はurlしかありませんが、一応仕様はこちらに。 http://zuzara.dyndns.org/docs/contentextractionapi.html サンプルレスポンス: http://zuzara.dyndns.org/api/tsubuan?url=http://blog.zuzara.com/2006/12/12/173/ アルゴリズムは以前作ったスクリプトの改良、といった感じです。精度をちゃんと数字にしていませんが、汎用的にどんなブログでも取得できるようになったと思います。必ずしもブログのみが対象ではなく、言語による依存もありません。精度実験では中国語のブログも対象にしてみました。 以前あった、ceekzさんのアイディアも使わせ

  • 翻訳 テキスト翻訳 _@nifty

  • 係り受け解析: まとめ - moratorium

    係り受け解析: まとめ 2007-06-12 (Tue) 10:24 IS TeXを頑張って覚えて最終レポートを書いたので、ここで晒す事にします。 MEによる日語係り受け解析 素性選択よりは色々な解析手法を試して精度向上したいなぁと思って作業していたのですが、限界が見えてきたので早めにまとめ上げました。 一緒に辻井研に行っているtmym氏がMEでLinear-time dependency analysis for Japanese [Sassano 04]の方式を試していて、面白い結果が出ているので期待。7500文/secって何ですか。 Similar Posts: 係り受け解析: 論文読み 係り受け解析: 実装 close(2) while select(2)ing Newer: 指きたっす Older: ESPer 2007 Comments:0 Comment Form N

    tsukkee
    tsukkee 2008/10/13
    ゴトゥーダ,ワッキー
  • プログラミング言語を作る

    このページの目的は、「独自のプログラミング言語を作る」ことです。 「プログラミング言語を作る」というのは、 やったことのない方からすれば、ずいぶん無謀な目標に見えるのかもしれません。 でも、いくつかの基礎知識さえ修得すれば、技術的には、 実はそんなに難しいものでもありません。 だったら、ひとつぐらい作ってみたいと思いませんか? なにしろプログラミング言語を作るなんて、 いかにもかっこ良さげじゃないですか。 私は作ってみたいと思いました。だから作ります。 プログラミング言語なんてもう山ほどあるのに、 今さら新しい言語なんて付け足して何をしたいんだよ! などというツッコミは入れてはいけません。 「なぜプログラミング言語なんか作るんですか?」 と聞かれたら、その答は そこにyaccがあるからだ。 で充分だろうと私は思います(yaccが何かは後述します)。 というわけで―― ただ私なんぞが新言語を

  • Fortranから最新言語まで、約2500種類のプログラミング言語の系図

    史上最初のプログラミング言語である1954年に考案された「Fortran」(フォートラン)から、今の各種最新言語に至るまで、いろいろなプログラミング言語が発展していく様子をまとめた巨大な系図を見ることができます。ちゃんと印刷できるようにPDFファイルなども置いてあります。自分の使っている言語がない場合には連絡して欲しいとのことです。 閲覧は以下から。 Computer Languages History (preview) 元のページはココ。A4用紙11枚に及ぶ印刷用PDFファイルなどをダウンロードできます。 Computer Languages History こうやって眺めてみると、いろいろな言語がお互いに少しずつ影響を与えているのがよくわかります。さすがにあまりにもマイナーな言語はサポートしていないようですが、作者に連絡すれば入れてもらえるかも。 一応全言語の一覧は以下から検索できま

    Fortranから最新言語まで、約2500種類のプログラミング言語の系図
    tsukkee
    tsukkee 2008/10/10
    Unix版,Windows版も
  • 1