onkのブックマーク - はてなブックマーク

Webページの本文抽出 (nakatani @ cybozu labs)

Webページの自動カテゴライズの続き。前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの本文抽出がひとつの鍵になっています。今回はその本文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。本モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。【追記】大事なこと書き忘れ。本モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

onk 2020/01/12

リンク

cloth – 布の動きをシミュレート | 秋元@サイボウズラボ・プログラマー・ブログ

Flashによる布の物理的なシミュレーション。二点が壁に固定されていて、好きなノードをつまんでひっぱると、布のように伸びたり、ひらひらと舞ったりする。手を離すと元に戻ろうとする。布のサイズを変更したり、部屋の奥にある扇風機を動かしたりもできる。カーソルキーで視点の変更も。 via del.icio.us/popular この記事は移転前の古いURLで公開された時のものですブックマークが新旧で分散している場合があります。移転前は現在とは文体が違い「である」調です。(参考)記事の内容が古くて役に立たなくなっている、という場合にはコメントやツイッターでご指摘いただければ幸いです。最新の状況を調べて新しい記事を書くかもしれません

onk 2008/02/13

げぇー，先にやられた！＜スカートめくりシミュレータ

flash

リンク

TAKESAKO @ Yet another Cybozu Labs: KB942840の更新でJScript.DLLが高速になった（IE6/WindowsXP）

Windows XP 用の更新プログラム (KB942840) で、JScriptエンジンのガベージコレクション（GC）のアルゴリズムが変更されて、 Ajaxをゴリゴリ使っているWebサイトでIE6の体感速度がかなり改善された（JavaScript実行途中で固まることがなくなった）模様。 Windows Server 2003 ベースのコンピュータまたは Windows XP ベースのコンピュータで Internet Explorer 6 の JScript を使用する Web ページを表示すると、パフォーマンスの Web ブラウザ低下が発生することがあります。原因スクリプトが多くの変数を同時に作成すると、この問題は、発生することがあります。また、この問題が同じ時刻で解析される一意の多くの値がスクリプトに含まれる場合、発生することがあります。この問題は JScript エンジンがガ

onk 2007/12/13

お．今日社内で「Ajax ゴリゴリ使った案件ありませんか？」って聞かれたのってこの影響かな（’’？理由聞くの忘れてたけど．

IE

リンク

TAKESAKO @ Yet another Cybozu Labs: HackerJapan9月号にTwitter特集

ハッカージャパン9月号にて id:TAKESAKO氏によるTwitter特集が6ページ掲載されています。 Twitterを日本語化する方法(本家)や、Twit萌え音声、Twitterオフ会などについて言及しています。どうぞご利用ください。

onk 2007/08/31

すげー他人事っぽく紹介してて吹いたｗこういうの大好きです．

twitter

リンク

flowr - 外付けwebフレームワーク - のプレゼン動画を公開しました (nakatani @ cybozu labs)

LL魂のライトニングトークで発表しました「外付け Web フレームワーク flowr」のプレゼン資料を動画に落とし込みましたものを公開いたします。 IronPython/WPF でプレゼンツールごと制作してしまったので、さすがにそのままでは配布できず（本プレゼンの閲覧には .NET Framework 3.0 と IronPython 1.1 と CPython 2.5 のインストールが必要です！？）、プレゼン内容を Flash にて動画キャプチャしたものとなっています。ファイルサイズが１２ＭＢと巨大なため、上記リンクをクリックした先に置いています。先頭のネタ部分は削ろうかとも思ったんですが、まあ実害無いので残しておきましたｗ flowr の詳細や、ダイジェストではないプレゼン資料(字幕付き？)、flowr そのものの公開のお知らせなども本 blog で今後行っていきますので、よろし

onk 2007/08/26

プレゼンにアニメーションは必須だなぁ，と実感させられた．ブログに機能追加する，という考えはかなり面白いんだよねー．

リンク

throw new CybozuLabsException() - PHPでfizzbuzz

第24回PHP勉強会で紹介したCodeGen_PECLで作るextensionの話にでてきた、fizzbuzzエクステンションのspecファイルを公開します。 <?xml version="1.0" ?> <extension name="fizzbuzz" version="1.0.0"> <summary>fizzbuzz extension</summary> <description>fizzbuzz binding</description> <maintainers> <maintainer> <user>tsuruoka</user> <name>TSURUOKA Naoya</name> <em ail>tsuruoka at php.net</em ail> <role>lead</role> </maintainer> </maintainers>

onk 2007/06/13

Fizzbuzz エクステンションの spec ファイル．

リンク

TAKESAKO @ Yet another Cybozu Labs: Wiiリモコンの値をJavaScriptで取得する方法（Wiiインターネットチャンネル）

任天堂のQ&Aサイトで、Wiiリモコンの値を取得する方法が公開されていることを知人から教えてもらいました。インターネットチャンネル向けのウェブページを作りたいのですが…。 : Ｑ＆Ａ - Ｗｉｉインターネットチャンネルの拡張機能について知りたいＷｉｉインターネットチャンネルでは特別な JavaScript を用いる事でＷｉｉリモコンのひねりやテレビとの距離、複数のコントローラの状態を取得する事ができます。手元にWii本体の実機がないので（Wiiリモコンはある＾＾）まだ試していませんが、こんな感じでJavaScriptからWiiリモコンの値が取れるっぽいですね。 if (window.opera && window.opera.wiiremote) { var num = 0; // wiiremote number 0,1,2,3 var pad = window.opera.w

onk 2007/05/24

うぉお，アチィ！画面からのキョリで動きを変える仕組みを簡単に作れちゃう！さすが Nintendo！

リンク

TAKESAKO @ Yet another Cybozu Labs: ニコニコ動画勉強会に行ってきました

本日ドワンゴさんの会議室にてこっそり開催されたニコニコ動画勉強会に参加してきました。日本の動画コメントサービス「ニコニコ動画」の裏側をドワンゴの開発者の方から直接お話しを聞いて、参加者も一緒に意見交換ができる非常に面白い勉強会でした。ドワンゴさんとしては会社で行なう技術者向けの勉強会初めての試みということもあり、まずは開発者の知り合いベースで声をかけあって少人数で開催することにしたそうです。六本木のクラブの人や、バイナリカンファレンスでご一緒した人とこんなところでお会いできるとは思っていませんで、さまに想定の範囲外でした。その甲斐あって密度の濃い話ができたと思います。以下、自分用のメモを公開できる範囲で書きます。間違っていたらすみません。（ご指摘いただければすぐに訂正します） ■ニコニコ動画の苦労話 (Sさん) ニコニコ動画の歴史 2006年10月一人でプロトタイプを開発

onk 2007/04/26

「プロトタイプ開発の締め切りは設けない」「ありえない早さで開発して欲しいから」

名言

リンク

静かな静かなコンピュータ (nakatani @ cybozu labs)

静かなコンピュータ(1) 水冷サーバ自分の開発用に、ラボの個人予算でNECの水冷サーバ Express5800/110Gc-C を購入しました。 VMWare Server で仮想環境をぼこぼこ立てたかったので、デュアルコアのXeon3040にメモリ3GBと、一人で使うにはちょっぴり贅沢♪ 早速仮想環境を4つ立てて、ごりごり遊、じゃなくて仕事してます。まだ余裕あり。カタログスペックでは騒音は30dBということだったが、ほぼ期待通りの静粛性。電源を入れても、耳をマシンぎりぎりに近付けないと動作音が聞こえない。ラボは一般的なオフィスよりもかなり静かな方なのですが、それでも事実上無音と言っていいくらいでしょう。設置スペースの兼ね合いでフロントパネルが自席から見えない置き方をしているので、時々本当に稼働しているか心配に(苦笑)。静かなコンピュータ(2) USBメモリ起動Knoppix 中

onk 2007/04/26

「ラボの個人予算」ホホゥ

cybozu

リンク

throw new CybozuLabsException() - YAPC::Asia Hackathon at Dan the hotel

竹迫さんの紹介でPHPの人間ですがYAPCの後のhackathonに少しだけお邪魔させていただきました。 Pythonの西尾さんと一緒に突撃してPythonもPHPも出来る子を証明するぞ！と思ったら、Device::USB::MissileLauncherはPythonの実装を参考にしたっぽくて、Pythonはすでに出来る子であることが証明済みでした。 PHPで実装するには、まずUSBを操作する為のライブラリが必要になります。竹迫さんに教えてもらって、cvs.php.netにusblibというライブラリがある事を知ったのですが、phpize、make installしてみるとlibusbのCore部分しか実装されていないので残念ながらミサイルランチャーには利用できません。次に、時間もないことだしPHPからPerlが実行できるPerl extensionを利用してDevice::USB::

onk 2007/04/14

「最後に一応言っておく。PHPでやれば奴らはビビる！私もビビる。」これは素晴らしい応用例．エンジニアたるものこうでないと．

名言

リンク

TAKESAKO @ Yet another Cybozu Labs: Shibuya.esの動画公開

先日開催されたShibuya.js Technical Talk #3 - Shibuya.esの録画アーカイブが公開されました。犬ビームメソッドが見れるのはShibuya.esだけ！ちなみに、講演者の承諾がとれている発表枠のみの公開となっております。 Shibuya.es録画アーカイブ amachangさん: JSer のための AS3 ！[動画] abuiさん: Cycal - オンラインスプレッドシート[動画] cho34さん: えへへ、うふふ E4X[動画] sendさん: Firebug[動画] omoさん: はじめての ABC[動画] Yu Kobayashiさん: Narcissus - ナルシスト、自分を愛した美少年JavaScript[動画] takesakoさん: SWF Binary Hacks ～evalのいばら道～[動画] kusigahamaさん: fcwr

onk 2007/04/05

動画．仕事しながらだと頭に入ってこない(笑) あとで見るー．

リンク

https://labs.cybozu.co.jp/blog/kazuho/archives/2007/03/flashy.php

onk 2007/03/15

JavaScript から Flash の機能を呼び出すためのプロキシ swf．超便利！！

リンク

秋元@サイボウズラボ・プログラマー・ブログ Vistaの音声認識でPerlプログラミング

ウィンドウズ・ビスタの音声認識を使って、Perlスクリプトを書いて保存するまでの実演。まあ、自然文を書くことを想定して設計されている音声認識だから、それでプログラムを書こうというところに無茶はあるんだけれど。それにし […] ウィンドウズ・ビスタの音声認識を使って、Perlスクリプトを書いて保存するまでの実演。まあ、自然文を書くことを想定して設計されている音声認識だから、それでプログラムを書こうというところに無茶はあるんだけれど。それにしてもこの奮闘っぷりが面白い。途中でPCを壊すんじゃないかとハラハラしたよ。 [関連] Vistaの音声認識セキュリティホールに思う

onk 2007/02/09

「Enteeeeeeeeer！」って超嬉しそうに言ってて可愛い(笑) しかし外人さんって独り言多いイメージあるよなぁ．マシンに向かってサンキュー言いまくったり．さのばびっち．

neta
Vista

リンク

TAKESAKO @ Yet another Cybozu Labs: 最新のネットランナーでPlaggerが紹介されてるっ

ネットランナー2007年2月号の記事の中で、Plaggerが紹介されていることを教えてもらいました。おおお。本当に紹介されてる。「オレ専用ポッドキャストで新着Youtube動画配信」という記事で、72ページ目から4ページまるごとPlaggerです。mizzyさんのハックが全面的に紹介されています。しかもご丁寧にダウンロードサイトも開設されています。ツール保管庫.net／2007年2月号特集2 編集部で用意した config.yaml とバッチファイルもダウンロードできるようになっていて、 ActivePerlのインストールから、Plaggerをタスクスケジューラに登録するところまで解説されています。紙媒体のWindowsのインストール記事としては一番よくまとまっているのではないでしょうか。こんなに早くネットランナーで紹介されるとはまさに想定の範囲外でした。もしかして、Pla

onk 2007/01/24

ネトラン編集部やるなぁ(笑) ダウンロードサイト立ち上げた挙げ句に config.yaml も提供するとは．

Plagger

リンク

TAKESAKO @ Yet another Cybozu Labs: Perl6正規表現リファレンス（Software Design 2007年2月号）

今日1/18発売のSoftware Design 2007年2月号にて、巻末特別企画「先取り Perl6正規表現カタログ～ Perl5からの変更点を徹底解説！」を書かせていただきました。記事については、難易度の設定が非常に難しかったのですが、Perl5から変更のあった記法を中心にピックアップし、 Perl6の一つの実装である最新のPugsで動作するサンプルを中心に正規表現の書き方を解説しました。なので、Perl6の元々の仕様とは若干異なっている部分がありますし、正しくない部分もあるかと思います。間違いがあればブログで指摘していただけると嬉しいです。巻末特集は、毎回デスクトップリファレンスとして使えることを目指して書いていますので、 Software Design巻末リファレンスの正しい読み方を参考に、冊子を作ってみてはいかがでしょうか。他にも、柴田さんの「速報！Python

onk 2007/01/19

「OSSライセンスのわかりやすい解説」最近ようやく OSS をまともに使い始めたのでちょっと嬉しいかも！

書評

リンク

TAKESAKO @ Yet another Cybozu Labs: デブサミ2007出張Shibuyaイベント告知

新年明けましておめでとうございます。昨年のShibuya.pm／Shibuya.js系のイベントでは、たくさんの方の参加申込がありまして、120人規模の会場が申込開始から最速4分で締め切られてしまうといった出来事もありました。そこで、毎回120人定員の会場の申し込みが瞬時に埋まってしまう対策の一つとして、今年は今までとは違った開催形式を一つ試してみようと思います。 ■ Developers Summit 2007（デブサミ2007） [開発テクノロジー]【14-B-7】「出張Shibuyaイベント」～ Shibuya.pm presents "Shibuya.js x Shibuya.pl mashup night" ～日時：2007年 2/14(水) 17:40～19:10 会場：目黒雅叙園（東京・目黒）夢扇（B会場）定員：300人（無料） Shibuya.pm／Shibuya

onk 2007/01/11

悩んでたのに後押し要素が(´д｀; 忙しい時期でなけりゃ悩まないんだが．無理くせぇ．

event

リンク

はてなブックマーク

タグ

ブックマーク / labs.cybozu.co.jp (16)

お知らせ

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

今週のはてなブックマーク数ランキング（2024年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス