サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
都知事選
d.hatena.ne.jp/makimoto
Gyazo というスクリーンショット共有サービスがあります。クライアントソフトウェアを起動して自分の画面の一部分を指定してあげると、サーバに指定されたエリアのスクリーンショットがアップロードされ、共有できるというサービスです。さて、このサービスは非常に強力なのですが、通常は gyazo.com のサーバにアップロードされ、インターネット上にパブリックになってしまい、会社や大学などの内部情報を気軽に扱うことができません。ですが、実は Gyazo はサーバスクリプトを公開している *1 ので、httpd が動いている環境ではどこにでも Gyazo サーバを置くことができるのです。これで、リリース前の秘密のシステムの動作画面やミーティング議事録のツッコミ所などをみんなにシェアすることができますよ。やりましたね。Gyazo のしくみたぶんこんな感じ。簡単ですね。 -----------------
ちょっと前の話になりますが、日本 Ruby 会議 2009 に参加しました。プログラミング言語関係の大きなカンファに参加したのは初めてでしたが楽しかったです。何より制作意欲をかきたてられました。ぼく個人の行動は当時の Twitter を辿っていただくとして *1、某所で RubyKaigi の参加報告的なことをやることになったので、復習の意味を含め、各講演ごとの資料や動画などをまとめることにしました。*2いずれ RubyKaigi から正式な動画などが公開されると思われますが、それまでのつなぎになるかと思います。今回、まとめるにあたって、様々な方の様々な記述を参考にしました。特に、id:wayaguchi さんの RubyKaigi 2009 の 不完全ustリンク集 と、takeshinoda さん の 日本Ruby会議2009資料あつめ はとても役に立ちました。(以下敬称略)2009年
YACA - Yet Another Calorie API なるものを公開しました。適当な入力に対し、ウェブ文書中からカロリーを調べて教えてくれるというサービスです。企画的アイディアはカロリーAPI ダイエット2.0、技術的アイディアは有名人身長推定サイト SETAKEを参考にしました。そういう意味で yet another です。普通の食べ物ではそこそこ妥当な結果を出すのは勿論のこと、明らかに食べ物ではないものについても結果を返してくれます。何が嬉しいかは謎です。中で何をやっているのかというと、入力されたもののカロリーが載っているサイトを、Yahoo!デベロッパーネットワークのウェブ検索APIで検索し、複数のウェブページから得たカロリーの中央値・平均値をもとめて提示しています。極端に低かったり高かったりする値は誤取得として一定の閾値を設けてリジェクトしています。つまり、適当に調べている
ちょっとした JavaScript の練習に Twitter のアイコンをランダム表示させる Bookmarklet を書きました。それが以下です。行全体を選択してブックマークバーに持って行けば登録できると思います *1。 javascript:a=$('.fn');b=$.makeArray(a.map(function(){return this.src}));a.each(function(){this.src=b.splice(Math.random()*b.length,1)});void 0 これを Twitter のページ上で使用すると以下のようになります。ちょっと分かりづらいかも知れませんが、ちゃんとアイコンがバラバラになっているのが分かると思います。コードをもっと human-readable にすると、以下のような感じになります。Twitter は jQuery を使て
某氏と恵比寿のアメリカンなカフェで食事を取っている最中、 Rob Pike 氏の話が出ました。『プログラミング作法』*1を Kernighan と一緒に書いたり、ベル研で Unix や Plan 9 を書いてた Rob Pike 氏ですが、今は Googler になっているそうです。で、氏の現在のメールアドレスが r@ぐーぐるどっとこむ*2だそうです。r。もし社内での全アカウントが r だとすると、ssh する時とかも ssh r@server_name で解決です。羨しい。自分も m@org_name.jp みたいなアカウントが欲しいものです。計算機を扱う人間としては、自分のアカウントがどうなるのかは結構仕事のモチベーションにかかわっていく重大な問題です。そんな訳で、理想的なアカウント名を考えて行こうと思います。 これまでのアカウントたちまず、ぼくがこれまで貰ったアカウント名を振り返って
午前中にちょろちょろ仕事した後、情報処理学会 第190回自然言語処理研究会 (NL研) を聴きに東京大学本郷キャンパスへ行ってきました。NL研は先日書いたように国内の自然言語処理関係のメジャーな研究会の一つです。今回からペーパーレス化され、開催約1週間前に論文が情報処理学会電子図書館で公開されるようになりました*1。登録していない方は会場で料金を払った後、電子データを受け取るシステムのようでした。 面白かった発表のうち3つくらいについてつれつれと。奥野陽、萩原将文「インターネットを用いた日本語入力システム」は方々で話題の Social IME についてのお話。NL研でシステムの実装についてのお話は少ないように思えるので、そういう意味では珍しい内容。ぼく自身は魂が救われることのない SKK 遣いなので、普段 IM に気を使わないのですが、予測変換の通常のかな漢字変換をシームレスに使えるところ
ものすごくご無沙汰のエントリになります*1。春ということで、これから自然言語処理を始めようという方もたくさんいると思います。そういった方々がどのような学会や研究会を調べれば良いのか紹介したいと思います。 自然言語処理は機械学習、人工知能、データベース、言語学、認知心理学、音声言語処理などの境界分野としての側面もあるので、一概にどこからどこまでが自然言語処理の範疇であると明言はできませんが、取り敢えず、メイントピックとして自然言語処理を掲げていて、NLPの研究者が関わるであろう団体を並べています。 言語処理学会 (NLP)その名の通り、自然言語処理をメイントピックとして扱う学会です。ジャーナル『自然言語処理』の刊行と年に一度の言語処理学会年次大会の開催を行なっています。年次大会には国内 (と一部国外) の自然言語処理研究者が集まる国内最大規模の自然言語処理を中心とした会議です。発表は査読なし
「あたし彼女」という携帯小説をプレーンテキストで取得できる atashi-kanojo.py *1 なるコードを書いたのだが、ついでに何か遊べるものを作ろうということで、@atashitter なるものを作った。これは「あたし彼女」のテキストを形態素解析器で分かち書きした後、形態素 n-grams で頻度を取得し、それに基づいて文書を生成している。基本的なアーキテクチャは @showyou さんの @ha_ma や @dogramagra、 id:pha さんの圧縮新聞などと同じである。当初は行 n-grams で n=1 のモデルと n=2 のモデルから生成を行なっていたが、どうしてもデータスパースネスの問題にぶち当たり、綺麗に生成できなかったので、形態素 n-grams (n = 1..5) に切り替えたという経緯がある。要するに出てくるバリエーションが限られてしまうという問題で色々悩
前回の 係り受けAPI - まきもと@ねっとわーくの記事について、はてブで id:y_yanbe さんから、2008年08月22日 y_yanbe python, nlp iterなんて組み込み関数あったっけ?と思ったらPython 2.5から入ったらしいはてなブックマーク - 係り受けAPI - まきもと@ねっとわーくと書かれたり、 Twitter で、Python 2.5から追加されたiter()という組み込み関数の存在理由が分からないTwitter / Yusuke Yanbe: Python 2.5から追加されたiter()という ...とつぶやかれたので、その辺のフォローを。iter() は大体予想が付くと思うけど、オブジェクトを Iterator Object にして返す組み込み関数で、2.2 から追加された。参考までに、公式ライブラリリファレンスから引用すると、iter( o
また、一月くらいぼんやりしてたけど、こちらには技術寄りの話を書いて行こうと思う。所謂日記はmakimoto.log に書く方針で。*1ということで、ヤフーが日本語係り受け解析Webサービスというのをリリースしたので、適当なコードを書いてみた。係り受けというのは構文解析の一種で、文節同士の依存関係を解析する技術のこと。自然言語処理に置いては形態素解析の次の段階の処理として扱われることが多い。ということで、早速コード。*2 #!/usr/bin/env python # vim:fileencoding=utf-8 from xml.etree.ElementTree import ElementTree from urllib import urlopen,quote from sys import stdin ns = '{urn:yahoo:jp:jlp:DAService}' for
研究でYamCha*1を使っているんだけど、ちょっとBag-of-Words*2を取りたくなったので、いろいろごちゃごちゃしてみる。 YamChaのページのNewsの項に最新のyamcha 0.33では`Support bag-of-words feature (experimental)'とあったので使える筈なのだが、ドキュメントを隅から隅まで見ても見つからない。ソースのアーカイブの中に`example/bag-of-words.cpp'なるものがあるけど、使ってみても何故か上手く行かず、仕方がないので、grepで`bag-of-words'やら`BOW'やら`bow'やらをソースファイルの中から探して漸くどうすればよいか判明する。どうやらbag-of-words.cppは古いバージョン用のYamChaのAPIを叩くやつらしく、今は実装内に組み込まれてて素性テンプレートに記述するだけでよ
京都大学学術情報メディアセンター南館にて自然言語処理技術講習会のTA。「「茶筌」/「南瓜」を用いた形態素解析・係り受け解析、「茶器」によるコーパス管理・検索」ということで、浅原さんが壇上に立ち、我々は後ろで受講生の方々の質問を受け付けるというシステム。Windows機での実習だけど、何故かパスが通ってなかったり文字コードが違っていたり。中でもMySQL周りで様々なトラブルが発生。茶器はサーバ・クライアント方式で茶器側でSQL文をMySQLサーバに投げ、返ってきたものをまた茶器側で整形する方式を取っているのだが、インストールするパソコンのセキュリティ周りの設定次第で弾かれてしまったりするので、その辺りでトラブルが発生するらしい。 ともあれ、若干のトラブルはあったものの、自然言語処理で何かをしたいという方のために非常に練られた良いチュートリアルだったのではないだろうか。講習会では、我々の他にも
このページを最初にブックマークしてみませんか?
『d.hatena.ne.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く