Javascript で diff というのはいくつか試された例はあるようですが、まだこれといった決定打は出ていない様子です。 実は diff は見た目ほど軽い処理ではないので、Javascript にやらせるのはこれが結構大変…… diff の計算量は、おおざっぱに言うと比較対象の要素数の二乗に比例し(実際にはそれより小さくすることができるのですが、まあ話のイメージとして)、かつメモリを大量に消費するので、バッチ的な処理に最適化されていない Javascript にはどうしても荷が重いものとなってしまいます。 比較対象の要素数を減らせば当然計算量は減りますが、行単位で比較してもあまり嬉しくない(わざわざ Javascript で処理するということは自然文が対象と思って良いでしょう)。最小の文字単位だとギブアップ。 ということは形態素解析で分かち書きして、単語単位で diff するのが J
Vimユーザがさまざまな場面でVimを使用することにこだわるのは、体で覚えるということが非常にパワフルであるためだ。つまりVimのキーバインドを一度覚えてしまえば、マウスを使いたいからという理由でキーボードから手を離すことが減り、Vimを使ってきわめて生産的に作業をすることができる。このようなVimのパワーをFirefoxでも活かしたいなら、Vimperator拡張を使ってみよう。Vimperatorを使えば、Firefoxを非常に便利な「モード」ベースのウェブブラウザに変身させることができる。 Vimperator拡張(最新バージョン0.4.1)は、Mozdev.orgから入手することができる。インストールするためには、Mozdev.orgでVimperator拡張の最新バージョンのリンクをクリックすればよい。ただしその際、拡張のインストールを許可するサイトのリストにURLを追加する必要
現在、Google には世界中で数千人のエンジニアが、検索をはじめとする、さまざまなサービスの改善、新機能の追加に取り組んでいます。今回から不定期ですが、社内のエンジニアにインタビューを行い、どのようなエンジニアが、どんな仕事をしているのかということについて、紹介していきます。 エンジニアインタビューシリーズの第 1 弾として、Google 東京 R&D センターにいる鵜飼文敏にインタビューしました。 鵜飼は、Google 入社以前からDebian JP Project や The Free Software Initiative of Japan の立ち上げなどに関わった、オープンソースコミュニティとの縁も深いエンジニアです。今回は、そのあたりを中心に話を聞いてみたいと思います。 I > まず最初に、Google での現在の仕事について、簡単に紹介をお願いします。 ukai > Goog
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
初出: 2007/6/27 更新: 2007/7/1 文章からキーワードを抽出するスクリプトをPythonモジュールとして実装しました。 分かち書きした上に、適切に複合語をつくり、さらに重要そうなものかどうかのスコアをつけます。 アルゴリズムは、以下のサイトを参考にしました。 http://gensen.dl.itc.u-tokyo.ac.jp/ ここで紹介されている論文 * 中川裕志、森辰則、湯本紘彰: "出現頻度と連接頻度に基づく専門用語抽出",自然言語処理、Vol.10 No.1, pp. 27 - 45, 2003年1月 http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/academic-res/jnlp10-1.pdf に掲載されているFLR法のみを実装しています。 実行結果サンプル たとえば、こんなページの本文をテキストフ
昨日の夜から今日に掛けてmoz-users ML 及び moz-addon ML でもじら組拡張勉強会についてゆきちさんの勉強会開催のメール及びそれに対する小池さんのリプライでゆきちさんの除名について初めて公の場に情報が出た。除名が決定したのは23日の僕が投げたメールによるもの(多数決で可決と見なしたため)で、これから外部になんらかしなければならないのでその準備をしようとしていた矢先にゆきちさんが突然前触れもなしに(スタッフに一切の連絡もなしに)開催の告知を出したため、このような騒動になってしまった。突然のメールに驚いた人も多いだろうが、除名という事実には変わりはありません。 今回の経緯についてはAmigomrさんが丁寧に説明している。経緯も完璧だと思うが、ここでは僕自身の視点から補足をしたいと思う。 ゆきちさんの矛盾点について 今回のキッカケとなったOSC沖縄には僕自身参加しておらず、当
DBを使った開発であれば必ず出てくるのがマスタメンテナンス画面だ。同じような作りで、毎度作るのが面倒に感じている人も多いだろう。だが、ユーザのためを考えれば必ず必要なのもわかっているはずだ。 せめて手軽に終わらせられるようにしよう。決まりきったコードは自動生成してしまえば良い。 今回紹介するオープンソース・ソフトウェアはphpCodeGenerator、DB定義に沿ってコードを自動生成するソフトウェアだ。 phpCodeGeneratorの特徴はなんと言っても対応しているDBの多さだ。MySQL、PostgreSQL、Oracleといった基本的なものはもちろん、Access/ODBC/SQLite/DB2/MS SQL Server/MaxDB/Visual FoxPro/FrontBase/InterBase 6/Borland Interbase 6.5/Firebird/Inform
2007/06/28 「きつい、厳しい、帰れない」で新3KともいわれるIT技術者の職場。学生の就職先人気ランキングでもIT企業は低迷している。6月28日に情報処理推進機構が開催したイベント「IPAX 2007」では、IT人材の育成をテーマにパネルが行われた。 「われわれの時代に比べるとIT技術者は尊敬される職種ではなくなった」。NECネクサソリューションズの代表取締役 執行役員社長で、NECで長くSEを務めた渕上岩雄氏はこう語る。時代の最先端技術を担いながらも、新3Kに代表されるよくないイメージが先行するIT技術者。渕上氏は過去の業務と現在の業務の違いを、人気低下の原因に挙げる。 渕上氏がSEを始めた35年ほど前は顧客企業の業務に合わせてITシステムやアプリケーションをほぼ手作りするのが一般的だった。納期2~3年は当たり前。ユーザー企業と密接にコミュニケーションを取って、システムを作り上げ
2007/06/29 アップルは次期バージョンのMac OS X、「Leopard」で、サン・マイクロシステムズが開発したファイルシステム「ZFS」を採用するという。現在、報道されているところによれば、デフォルトは従来のHFS+のままで、ZFSはオプションの形での利用ということになりそうだが、それにしてもビッグニュースだ。「サンってことはデータセンターで使う、サーバ向けのファイルシステムでしょ?」と思う人が多いだろう。確かに高可用性と高いメンテナンス性を実現する機能などはサーバ向けの印象を与える。しかし、ZFSはエンドユーザーにとっても、実に魅力的な機能を提供する。 ノートPCにこそZFS! ここでは主に、サン・マイクロシステムズでSolarisの開発に携わっているカーネル技術者、エリック・クスターツ(Eric Kustarz)氏のブログエントリ「ZFS on a laptop?」(ノート
「Code Reading―オープンソースから学ぶソフトウェア開発技法」(毎日コミュニケーションズ発行,写真1)という本があります。私はこの本の監訳者ですから,やや自画自賛になってしまいますが,ソースコードの読み方を主題にした本はほかにはあまりありません。技法からツール,データ構造,アーキテクチャ,さらには実際にコードを読んで利用する実例まで紹介している網羅的で良い本だと思います。 この本の「はじめに」で「達人プログラマー」として知られるDave Thomas氏は以下のように書いています。 他人の作品を読まなかった偉大な作家,他人の筆づかいを研究しなかった偉大な画家,同僚の肩越しに技を盗まなかった腕のよい外科医,副操縦席で実地の経験を積まなかった767機長――果たして,そんな人たちが本当にいるのでしょうか? たしかにその通りです。ソフトウエア以外の領域では修行することとはすなわち,他の人の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く