タグ

2007年4月10日のブックマーク (15件)

  • 聞いてきました:Googleの大規模日本語データ公開に関する特別セッション - のほほん徒然

    第四十七回 写真はGigazineのマネです(笑) 3月に滋賀で行われる言語処理学会全国大会で、グーグルが 特別セッションをやるそうです。大規模日語データについて。 たつをさんのブログで知ったGoogleの特別セッション. グーグル株式会社では、日語の言語処理研究推進のため大規模日語データの公開を検討しています。つきましては仕様を決定するにあたり、実際にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺いしたく存じます。今回、言語処理学会様の御好意により、下記のとおりデータ仕様に関する特別セッションを設けて頂ける事になりました。 はてなブックマークでも話題になっているGoogleの大規模日語データ公開に関する特別セッション@NLP2007に,家が近いこともあり参加してきましたので,その詳細を書きます. セッション概要と要旨 Googleは日語の言語処理研究のためにW

    聞いてきました:Googleの大規模日本語データ公開に関する特別セッション - のほほん徒然
  • Google、大規模日本語データの公開を検討 | スラド IT

    3/20の言語処理学会内にて、Googleが主催する大規模日語データ公開に関する特別セッションというのがあるらしい。Googleでは、日語の言語処理研究推進のため大規模日語データの公開を検討しており、その仕様を決定するために現場の研究者/技術者の皆様の声を吸い上げたいということのようだ。 ここで思い出したが、つい先日にYahoo! Japanが Yahoo!知恵袋のデータを情報関連技術研究コミュニティに対して無償で提供するというニュースがあった。 この時は、書き言葉と話し言葉の中間的存在としてブログやQ&Aサイトなどのテキスト情報が急増しており、これを研究対象として利用できることで研究の幅が広がるということだったが、Googleのデータも非常に多様かつ巨大な情報の塊を研究対象にできるというのは意義のあることだと思う。これを使って、どんな研究ができるだろう?

  • 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ

    形態素解析と検索APIとTF-IDFでキーワード抽出
    sunaoka
    sunaoka 2007/04/10
    形態素解析
  • Bulkfeeds: Developer's API - RSS Directory & Search

    This domain name registration has expired. If you are the domain owner, please contact support@epik.com to get the renewal taken care of.

    Bulkfeeds: Developer's API - RSS Directory & Search
    sunaoka
    sunaoka 2007/04/10
    形態素解析 + 特徴語抽出
  • MySQL 4.1.15 vs 5.0.15 どっちが速い? - mysql:12312

    From: Koji Fukui <Koji Fukui <foxtrot@xxxxxxxxxx>> Date: Fri, 28 Oct 2005 10:26:28 +0900 Subject: [mysql 12312] Re: MySQL 4.1.15 vs 5.0.15 どっちが速い? 福井といいます > ベンチマーク対決! MySQL 4.1.15 vs 5.0.15 どっちが速い? > http://www.drk7.jp/MT/archives/000941.html > 5.0.15 の InnoDB は 4.1.15 に比べて1割くらいの速度しかでなくて、 > 使い物にならないと言われてますが…(^^; > だれか追試してみませんか? 追試ではないんですけど、 うろ覚えで恐縮ですが、あるツールでは、4系と5.0.7では、 結果は殆ど差がなかったと記憶しています。 但し、5.

    sunaoka
    sunaoka 2007/04/10
    innodb_thread_concurrency
  • 形態素解析辞書 UniDic

    人気デベロッパー Play’N Go は、2017年にユニークなスロットを発売しました ムーンプリンセス. オンライン スロットゲーム ムーンプリンセス このゲームは、そのユニークなオプション、シンプルな操作性、アニメをモチーフにしたカラフルなグラフィックにより、瞬く間にプレイヤーから人気を集めました。 スロットマシンの ムーンプリンセス は、漫画『美少女戦士セーラームーン』のテーマを明らかにする。第1巻は1992年に発売され、現在も人気があります。を可能にします MoonPrincess は、長年にわたり最高のスロットのリストをリードし、プレイヤーに寛大な配当だけを提供し、ゲームプレイへの関心を保証します。 すべてのシンボルが雰囲気を強調する オンライン スロットゲーム ムーンプリンセス, 心地よいサウンドトラックがゲームプレイを引き立て、音楽をパーソナライズできるため、ユーザーはスロッ

    sunaoka
    sunaoka 2007/04/10
    「茶筌」の辞書として使える
  • Flashでクロスドメイン.js

    crossdomain.js とは? crossdomain.js は、Ajax でいうところの XMLHTTPRequest を Flash 経由で行う為のライブラリです。 通常の Ajax のリクエストでは、ドメインの異なるページへのリクエストが行えませんが、Flash 経由にすることで crossdomain.xml が置かれている一般的なAPI サーバーなら直接アクセスが可能です またJSON で E4X ライクに返値を返している為、XML の内側の要素に簡単にアクセスできて非常に便利です。 crossdomain.xml を利用してクロスドメインの壁を越えられる E4X ライクに簡単に XML 要素にアクセス ダウンロード 以下から入手できます。

  • Ubuntu、Symfony、Lighttpdを使ってスケールするWeb 2.0サイトを構築する - PHPプロ!ニュース

    平素より「PHPプロ!」をご愛顧いただき、誠にありがとうございます。 2006年より運営してまいりました「PHPプロ!」ですが、サービスの利用状況を鑑みまして、2018年9月25日(火曜日)をもちましてサービスを終了させていただくことになりました。 サービス終了に伴いまして、2018年8月28日(火曜日)を持ちまして、新規会員登録ならびにQ&A掲示板への新たな質問、回答の投稿を停止させていただきます。 なお、ご登録いただいた皆様の個人情報につきましては、サービス終了後、弊社が責任をもって消去いたします。 これまで多くの皆様にご利用をいただきまして、誠にありがとうございました。 サービス終了に伴い、皆様にはご不便をおかけいたしますこと、心よりお詫び申し上げます。 件に関するお問い合わせはこちらよりお願いいたします。

    sunaoka
    sunaoka 2007/04/10
  • 今感じていること PHP、PEAR::Auth辺りのセッションて

    setExpireに関しては、こんな感じ。 If this variable is set to 0, auth never expires setIdleに関しては、こんな感じ。 If this variable is set to 0, idletime is never checked. じゃ、上の二つのメソッド呼ばなければ、永遠なのか?と考えると、そうではないと。 結局の所、PEAR::Authは後ろで、PHPのセッション管理関数呼び出している訳で。当然、php.iniの設定とも関わってきます。 で、前回は、 で、さらには、php.iniのsession.cookie_lifetimeがログイン有効期間の値より大きく設定されていないといけないと。 って、意気揚々と書いて、あえなく玉砕。 で、さらに調べてみたら、ガーベージコレクション(GC)とも関連があると。 それに関係する定義につ

    sunaoka
    sunaoka 2007/04/10
  • http://tech.blog.klab.org/archives/50277350.html

    sunaoka
    sunaoka 2007/04/10
    マルチカラムインデックスを使う時の注意点
  • HDD以上に便利なオンラインストレージ“Dropbox” ― @IT

    2007/04/09 OSのファイルシステムに統合され、Windows上からは通常のフォルダとして扱えるオンラインストレージサービス「Dropbox」の詳細が明らかになった。Dropboxは、複数のPCから同一フォルダが扱えるだけでなく、バックアップや変更履歴管理、ローカルファイルシステムと完全な透過性を備えた高機能なオンラインストレージサービスだ。 rsync、trac、subversionのいいところ取り 「ほかのオンラインストレージや同期サービスは、どれも使うのが面倒だったり、十分にスケールしなかったり、あるいは何か制限があったりするので不満だった。それじゃあということで、自分たちで、まともなものを作ろうと決めた」。DropboxのCEOで開発者のDrew Houston(ドゥリュー・ヒューストン)氏は@ITのメールインタビューに答え、開発の動機をそう語る。マサチューセッツ工科大学で

    sunaoka
    sunaoka 2007/04/10
  • [観] Twitter の API に関するメモ

    [要旨] TwitterAPI を実際に使ってみて、これはメモっておかないといけない、と思ったあれこれをまとめてみました。 [キーワード] Twitter,クライアント,chirrup,まとめ

    sunaoka
    sunaoka 2007/04/10
  • SSHサーバが受け付け可能な認証方法を列挙する - (ひ)メモ

    もっとスマートな方法ないかしらん。 #!/usr/bin/env perl use strict; use warnings; use Net::SSH::Perl; use Net::SSH::Perl::AuthMgr; QUICK_HACK: { package Net::SSH::Perl::AuthMgr; no warnings 'redefine', 'once'; *auth_failure = sub { my $amgr = shift; my($packet) = @_; my $ssh = $amgr->{ssh}; my $authlist = $packet->get_str; $amgr->{_done} = 1; $amgr->{__authlist} = [ split /,/, $authlist ]; }; *authlist = sub { my $

    SSHサーバが受け付け可能な認証方法を列挙する - (ひ)メモ
  • モダンブラウザ向けCSSハック:ウェブネタブログ

    sunaoka
    sunaoka 2007/04/10
  • あのオライリー社がオンラインで大学を開設!『Oreilly School』 | 100SHIKI.COM

    これは期待。 コンピュータ関連書籍を多数出版しているオライリー社がオンラインで大学をはじめたようだ。 もちろんコースはWebやコンピュータに関連するものばかりで実践的だ。 しかも遠隔教育の先駆者であるイリノイ大学と提携し、修了者にはその大学の単位も出すようである。 近い将来には「あ、君もオライリー大学の卒業生?」なるシーンが増えてくるのではなかろうか。 技術書といえばオライリー。同社のブランドが近い将来この業界に及ぼす影響を見守っていきたい。

    sunaoka
    sunaoka 2007/04/10