鳩サブレーなクリップ 2009-10-02-5 [Stationery][Kawaii] 鳩サブレーの形をしたクリップ。 かわいい! 鎌倉の豊島屋本店でしか売っていないそうです。 お土産に頂きました。 ありがとうございました! - 鎌倉の味 鳩サブレー 豊島屋 http://www.hato.co.jp/index.html
IKEA で買った太陽電池式電気スタンドがとっても良い! 2009-06-19-2 [Gadget][LifeHacks] IKEAで買った太陽電池式の電気スタンド「SUNNAN」はすごく良いです。 - IKEA | 照明 | テーブルランプ | SUNNAN | ワークランプ 太陽電池式 http://www.ikea.com/jp/ja/catalog/products/00162479 コードレスなので、枕元や卓上などあちこちに楽々移動できます。 ストレスないよ!ストレスフリー! あと、なんだかんだですごく明るい。 周りの灯りがなくてもこれだけで読書できます。 灯りの持続時間は3,4時間くらい。 普段は、昼間部屋にほったらかしにして夜寝る前にちょこっと使う、という使い方で良いかと。 というわけで、IKEA に行く機会のある方はぜひゲットしてみてください。 2490円です。 色はオレン
ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」 2008-08-21-1 [WebTool][NLP][Programming][Algorithm] Yahoo!デベロッパーネットワーク(YDN)に 「日本語係り受け解析Webサービス」が登場しました。 Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語係り受け解析 http://developer.yahoo.co.jp/jlp/DAService/V1/parse.html 「係り受けってなに?」という方もいると思うので、 以下、まったくもって厳密ではない、適当な解説を試みます。 (1) 日本語をコンピューターで処理するには、 まず形態素解析というのをやって、 文を形態素(≒単語)単位に分割します。 YDN の「日本語形態素解析Webサービス」[2007-06-18-1] で試すことができ
Google Chart API で QRコードも生成してくれるようになった 2008-07-04-3 [WebTool] URL をなげるとグラフなどの図を画像として生成してくれる Google Chart API ですが、新たに QRコードを生成してくれるオプションができました。 QR codes (Developer's Guide - Google Chart API) 基本となるパラメータは chs(サイズ指定)cht(QRコードなのでqrを指定)chl(エンコードしたテキストを指定) の3つです。 では実例。 このブログのトップページ「https://chalow.net/」のQRコードを作ります。 URLを組み立てるとこうなります: https://chart.apis.google.com/chart?chs=150&cht=qr&chl=https%3a//chalow.
転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみました。 検索方式は転置インデックス(Inverted Index)、 ランキングには TF-IDF[2005-10-12-1] を用いました。 検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。 以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ
Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを 素直に Perl で実装したみた。 さらにマッチ箇所取り出しロジックも実装してみた。 # DP はいわゆる「類似文字列検索(あいまい検索)」に使うと 便利なalgorithm。 実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。 単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、 転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二つの文字列 "
カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ2乗値を使って単語間の関連度を調べる方法。 つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基本中の基本ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ
Web関連語抽出を試作 2007-09-04-3 [WebTool][NLP] Web関連語抽出 http://yapi.ta2o.net/kanrenp/ Yahoo!ウェブ検索APIで検索結果100件を取ってきて、形態素解析をかけて、 複合名詞的なものだけ抽出し、出現頻度をカウントして表示します。 ちょっと前に作ったやつで、まだ試作段階なんだけど、 とりあえず動くので公開しておきます。 例: - 銀行 http://yapi.ta2o.net/kanrenp/s/%E9%8A%80%E8%A1%8C.html - skype http://yapi.ta2o.net/kanrenp/s/skype.html - カメラ http://yapi.ta2o.net/kanrenp/s/%E3%82%AB%E3%83%A1%E3%83%A9.html 出てくる関連語はいろいろ使いまわしができ
Webでの単語共起を調べるサイトを作った 2007-07-29-3 [Programming][NLP] ヤフー検索を用いてWebでの単語共起を調べるサイト 「Web単語共起」(http://yapi.ta2o.net/tangokyouki/) を作りました。 日本語だけじゃなく英語もいけますよ。 Yahoo!ウェブ検索APIで検索結果100件を取ってきて、 日本語の場合は形態素解析(MeCabを使用)をかけて、 単語の出現頻度をカウントして表示します。 Unigram は1語単位でのカウント、 Bigram は連続2語単位でのカウント、 Trigram は連続3語単位でのカウントを意味します。
MECAPIのソースコード公開 2007-04-01-1 [MECAPI][NLP][Programming] MECAPI[2006-09-18-1]のソースコードを公開。 きちんと書き直そうと思ってたんだけど、手抜きでそのまま公開します。 - MECAPI - MeCab Web Service (MeCab API) https://maapi.net/apis/mecapi - ソースコード ttp://maapi.net/apis/mecapi?mode=code サーバ負荷の問題があるので、大量にアクセス(例えば毎秒数回等)する 人は自分のサーバに設置して使って頂けると幸いです。 ソースは「無償・無保証・著作権放棄」(http://lifehacks.ta2o.net/byebye-copyright.html) ですので、好き勝手に使って下さい。 設置方法: (1) MeCa
Googleが大規模日本語データを公開するという話 2007-03-13-1 [NLP] 3月に滋賀で行われる言語処理学会全国大会で、グーグルが 特別セッションをやるそうです。大規模日本語データについて。 Google: 大規模日本語データ公開に関する特別セッション http://www.google.co.jp/events/anlp2007.html グーグル株式会社では、日本語の言語処理研究推進のため大規模日本語 データの公開を検討しています。つきましては仕様を決定するにあたり、実際 にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺い したく存じます。今回、言語処理学会様の御好意により、下記のとおり データ仕様に関する特別セッションを設けて頂ける事になりました。 日時: 2007年3月20日(火) 18:30 〜 19:00 会場: 龍谷大学 瀬田学舎 言語処理学会
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く