タグ

2011年8月22日のブックマーク (9件)

  • WEB+DB PRESS vol.64に日本語入力の記事を書いたよ - 射撃しつつ前転 改

    WEB+DB PRESS Vol.64に日本語入力についての記事を書かせていただきました。特集3の「作って学ぶ日本語入力」という奴です。 日本語入力歴史とかについて簡単に触れた後、かな漢字変換を実際に作ってみる、という構成になっています。ビタビアルゴリズムやダブル配列、構造化パーセプトロン、構造化SVMなどのテクニックを紹介しています。この特集だけ読めば、今年の3月の言語処理学会に私が出した論文(?)と同じものがたぶん作れます。日本語入力だけに限らず、教師あり機械学習を実装するときの最低限の知識、みたいなところも身につくと思いますので、WEBやDBに興味のある人だけでなく、自然言語処理に興味のある大学生の人々にもぜひ読んで欲しいと思います。データを入れ替えれば形態素解析なんかもほぼそのままで作れます。 構成的には、確率の概念について一切触れていないところが一つのポイントになっています。統

    WEB+DB PRESS vol.64に日本語入力の記事を書いたよ - 射撃しつつ前転 改
    kuenishi
    kuenishi 2011/08/22
    たのしみ
  • 地雷力 - steps to phantasien(2011-08-22)

    地雷力のある人がいる. 簡単に直りそうなバグ, 一日で追加できそうな機能に手をつけたはずなのに, と当人はいう. バグがバグをよび, パッチがパッチをよび, 議論が議論をよんで, 目のまえに次々と刈るべき毛深いヤックが増えていく. そんな人がたまにいる. しかも話の流れでみつけてしまったバグをぜんぶ割り振られていたりする. 気の毒に...私が遠目にうかがうなかそのひとは毛を刈りだして, 刈るそばからバグや作業が次々と湧きだすけれど, しばらく経ってふと目をやるとあらかた片付いている. そして最後には歓声を耳にする: "おわった!" おめでとうと私は応じる. そのひとは次の仕事にとりかかかる, ああ, そのバグはやめておいた方が... けれどそのひとは動じない. いや一旦は動じるけれど, やれやれと仕事を再開する. そんな人には地雷力があるとおもう. 地雷体質, 羊毛フェチなど揶揄をこめるこ

    kuenishi
    kuenishi 2011/08/22
    地雷力は才能。そんなプログラマに、わたしはなりたい
  • Urban Dictionary: brogrammer

    kuenishi
    kuenishi 2011/08/22
    おれはBrogrammerになるっ!!
  • CLX C++ Libraries

    Overvies CLX C++ Libraries は,文字列処理やネットワークプログラミングの補助などを行うための, ヘッダファイルのみで構成された C++ ライブラリです. CLX C++ Libraries は, BSDライセンスで配布しています.ソースコードの複製・改変は自由ですが, 自己責任でお願い致します. Usage CLX C++ Libraries を使用する際には,以下のファイルをダウンロードし, 解凍して出来た clx フォルダ以下のヘッダファイルを作業フォルダにコピーするか, または,インクルードオプションを適切に指定して下さい. CLX C++ Libraries で作成したクラスは clx 名前空間の中に定義してあります. 利用する場合は,直接指定するか適切な using ディレクティブを指定して下さい. 動作確認は gcc 4.0.2 (Linux), gc

    kuenishi
    kuenishi 2011/08/22
  • CLX C++ Libraries - zstream

    Declaration template < int CompressionRate, class CharT = char, class Traits = std::char_traits<CharT> > class basic_zstream; template < class CharT = char, class Traits = std::char_traits<CharT> > class basic_unzstream; typedef basic_zstream<Z_DEFAULT_COMPRESSION, char> zstream; typedef basic_unzstream<char> unzstream; Overview zstream/unzstream は,zlib ライブラリを用いた圧縮・解凍を行うためのクラスです. これらのクラスは,ともに C++

    kuenishi
    kuenishi 2011/08/22
  • GNU General Public License - Wikipedia

    GNU一般公衆ライセンス(GNU General Public License、GNU GPLまたは、単にGPL) とは、GNUプロジェクトのためにリチャード・ストールマンにより作成されたフリーソフトウェアライセンスである。八田真行の日語訳ではGNU 一般公衆利用許諾書と呼んでいる[6]。現在、GNU公式サイト日語ページではGNU一般公衆ライセンスと表記されている[7]。 概要[編集] GPLは、プログラム(日国著作権法ではプログラムの著作物)の複製物を所持している者に対し、概ね以下のことを許諾するライセンスである。 プログラムの実行[注釈 2] プログラムの動作を調べ、それを改変すること(ソースコードへのアクセスは、その前提になる) 複製物の再頒布 プログラムを改良し、改良を公衆にリリースする権利(ソースコードへのアクセスは、その前提になる) GPLは二次的著作物についても上記4点

    GNU General Public License - Wikipedia
  • Marc Andreessen on Why Software Is Eating the World

    In an interview with WSJ's Kevin Delaney, Groupon and LinkedIn investor Marc Andreessen insists that the recent popularity of tech companies does not constitute a bubble. He also stressed that both Apple and Google are undervalued and that "the market doesn't like tech." In short, software is eating the world. More than 10 years after the peak of the 1990s dot-com bubble, a dozen or so new Interne

    Marc Andreessen on Why Software Is Eating the World
    kuenishi
    kuenishi 2011/08/22
    これから、国家の競争力もソフトウェアの技術力が左右する時代になるだろう
  • C++0x in programming competition

    2018/06/23 Sony"s deep learning software and the latest informationSony Network Communications Inc.

    C++0x in programming competition
    kuenishi
    kuenishi 2011/08/22
  • yebo blog: どうして、ソフトウェアが世界を飲み込んでいるのか

    2011/08/21 どうして、ソフトウェアが世界を飲み込んでいるのか マーク・アンドリーセンがウォルー・ストリート・ジャーナルに「どうして、ソフトウェアが世界を飲み込んでいるのか (Why Software Is Eating The World)」という長文の記事を書いているそうだ。アンドリーセンは、ソフトウェアの重要性を経済が過小評価しているが、近い将来明確になるだろうと主張している[hacker news]。アンドリーセンはあらゆる業界でソフトウェア会社がトップに立っていることを示している(クラウド化で、スタートアップを起業するコストが下がった上、インターネットのおかげで市場規模は拡大している)。世界で最も大きな書店はアマゾンというソフトウェア会社、加入者数がもっとも多いビデオサービスもNetflixというソフトウェア会社、音楽会社も、Apple iTunes、Sportfy、パン

    kuenishi
    kuenishi 2011/08/22
    あらゆる業種でソフトウェアが差別化要因の筆頭になっている、と理解した