bunhikoのブックマーク - はてなブックマーク

bunhiko id:bunhiko

ブックマーク / chalow.net (14)

鳩サブレーなクリップ
鳩サブレーなクリップ 2009-10-02-5 [Stationery][Kawaii] 鳩サブレーの形をしたクリップ。かわいい！鎌倉の豊島屋本店でしか売っていないそうです。お土産に頂きました。ありがとうございました！ - 鎌倉の味鳩サブレー　豊島屋 http://www.hato.co.jp/index.html
bunhiko 2009/10/04
モノ
リンク
IKEA で買った太陽電池式電気スタンドがとっても良い！
IKEA で買った太陽電池式電気スタンドがとっても良い！ 2009-06-19-2 [Gadget][LifeHacks] IKEAで買った太陽電池式の電気スタンド「SUNNAN」はすごく良いです。 - IKEA | 照明 | テーブルランプ | SUNNAN | ワークランプ太陽電池式 http://www.ikea.com/jp/ja/catalog/products/00162479 コードレスなので、枕元や卓上などあちこちに楽々移動できます。ストレスないよ！ストレスフリー！あと、なんだかんだですごく明るい。周りの灯りがなくてもこれだけで読書できます。灯りの持続時間は3,4時間くらい。普段は、昼間部屋にほったらかしにして夜寝る前にちょこっと使う、という使い方で良いかと。というわけで、IKEA に行く機会のある方はぜひゲットしてみてください。 2490円です。色はオレン
bunhiko 2009/06/20
生活

モノ
リンク
ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」
ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」 2008-08-21-1 [WebTool][NLP][Programming][Algorithm] Yahoo!デベロッパーネットワーク(YDN)に「日本語係り受け解析Webサービス」が登場しました。 Yahoo!デベロッパーネットワーク - テキスト解析 - 日本語係り受け解析 http://developer.yahoo.co.jp/jlp/DAService/V1/parse.html 「係り受けってなに？」という方もいると思うので、以下、まったくもって厳密ではない、適当な解説を試みます。 (1) 日本語をコンピューターで処理するには、まず形態素解析というのをやって、文を形態素（≒単語）単位に分割します。 YDN の「日本語形態素解析 Webサービス」[2007-06-18-1] で試すことができ
bunhiko 2008/08/22
形態素解析

自然言語処理

api
リンク
Google Chart API で QRコードも生成してくれるようになった
Google Chart API で QRコードも生成してくれるようになった 2008-07-04-3 [WebTool] URL をなげるとグラフなどの図を画像として生成してくれる Google Chart API ですが、新たに QRコードを生成してくれるオプションができました。 QR codes (Developer's Guide - Google Chart API) 基本となるパラメータは chs（サイズ指定）cht（QRコードなのでqrを指定）chl（エンコードしたテキストを指定）の３つです。では実例。このブログのトップページ「https://chalow.net/」のQRコードを作ります。 URLを組み立てるとこうなります： https://chart.apis.google.com/chart?chs=150&cht=qr&chl=https%3a//chalow.
bunhiko 2008/07/05
サービス

google

ケータイ
リンク
[を] 本を開いた状態に保つ「thumb thing」
本を開いた状態に保つ「thumb thing」 2007-12-09-2 [Gadget][LifeHacks] 本を開いたままで押さえるのに便利なツール「thumb thing」。親指にはめて使います。こんな感じ。電車で立って読書するときだけでなく、ラーメンやうどんなどの麺類を食べながらの読書に向いているかも！
bunhiko 2007/12/11
本

モノ

アイデア
リンク
[を] 一覧の一覧
一覧の一覧 2007-11-27-1 [NLP] 自然言語処理用のデータとして使えそうな語彙の宝庫。こういうところからコツコツと語彙を集めて辞書データを拡充するのが王道ですね。 - 一覧の一覧 - Wikipedia http://ja.wikipedia.org/wiki/%E4%B8%80%E8%A6%A7
bunhiko 2007/11/30
自然言語処理

辞書
リンク
[を] 転置インデックスによる検索システムを作ってみよう！
転置インデックスによる検索システムを作ってみよう！ 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装はパフォーマンスを無視すれば意外と簡単です。それを示すために Perl で簡単な検索システムを作ってみました。検索方式は転置インデックス(Inverted Index)、ランキングには TF-IDF[2005-10-12-1] を用いました。検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか？ 3 ペンギン大好き 4 こんにちは。いかがおすごしですか？ 5 ここ最近疲れ
bunhiko 2007/11/27
自然言語処理

検索

アルゴリズム
リンク
Dynamic Programming による類似文字列マッチの実装例
Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを素直に Perl で実装したみた。さらにマッチ箇所取り出しロジックも実装してみた。 # DP はいわゆる「類似文字列検索（あいまい検索）」に使うと便利なalgorithm。実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二つの文字列 "
bunhiko 2007/10/17
Perl

アルゴリズム

検索
リンク
カイ二乗値で単語間の関連の強さを調べる
カイ二乗値で単語間の関連の強さを調べる 2007-09-19-1 [Algorithm][Programming] カイ２乗値を使って単語間の関連度を調べる方法。つまり、関連語を探すときに、χ二乗値を関連度として使う。 perl によるサンプルコード (chiword.pl)。昔、勉強がてら作ったコード。 #!/usr/bin/perl use strict; use warnings; my %cnt; my $pair_num; while (<>) { chomp; next if /^\s*$/; my @list = sort split(/,/, $_); for (my $i = 0; $i < @list; $i++) { for (my $j = $i + 1; $j < @list; $j++) { next if $list[$i] eq $list[$j]; $c
bunhiko 2007/09/20
アルゴリズム

自然言語処理

Perl
リンク
形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ
bunhiko 2007/09/10
形態素解析

アルゴリズム

自然言語処理
リンク
Web関連語抽出を試作
Web関連語抽出を試作 2007-09-04-3 [WebTool][NLP] Web関連語抽出 http://yapi.ta2o.net/kanrenp/ Yahoo!ウェブ検索APIで検索結果100件を取ってきて、形態素解析をかけて、複合名詞的なものだけ抽出し、出現頻度をカウントして表示します。ちょっと前に作ったやつで、まだ試作段階なんだけど、とりあえず動くので公開しておきます。例： - 銀行 http://yapi.ta2o.net/kanrenp/s/%E9%8A%80%E8%A1%8C.html - skype http://yapi.ta2o.net/kanrenp/s/skype.html - カメラ http://yapi.ta2o.net/kanrenp/s/%E3%82%AB%E3%83%A1%E3%83%A9.html 出てくる関連語はいろいろ使いまわしができ
bunhiko 2007/09/05
自然言語処理

検索

api
リンク
Webでの単語共起を調べるサイトを作った
Webでの単語共起を調べるサイトを作った 2007-07-29-3 [Programming][NLP] ヤフー検索を用いてWebでの単語共起を調べるサイト「Web単語共起」(http://yapi.ta2o.net/tangokyouki/) を作りました。日本語だけじゃなく英語もいけますよ。 Yahoo!ウェブ検索APIで検索結果100件を取ってきて、日本語の場合は形態素解析(MeCabを使用)をかけて、単語の出現頻度をカウントして表示します。 Unigram は1語単位でのカウント、 Bigram は連続2語単位でのカウント、 Trigram は連続3語単位でのカウントを意味します。
bunhiko 2007/07/30
検索

形態素解析

自然言語処理
リンク
MECAPIのソースコード公開
MECAPIのソースコード公開 2007-04-01-1 [MECAPI][NLP][Programming] MECAPI[2006-09-18-1]のソースコードを公開。きちんと書き直そうと思ってたんだけど、手抜きでそのまま公開します。 - MECAPI - MeCab Web Service (MeCab API) https://maapi.net/apis/mecapi - ソースコード ttp://maapi.net/apis/mecapi?mode=code サーバ負荷の問題があるので、大量にアクセス（例えば毎秒数回等）する人は自分のサーバに設置して使って頂けると幸いです。ソースは「無償・無保証・著作権放棄」(http://lifehacks.ta2o.net/byebye-copyright.html) ですので、好き勝手に使って下さい。設置方法： (1) MeCa
bunhiko 2007/04/02
Perl

MeCab

形態素解析
リンク
Googleが大規模日本語データを公開するという話
Googleが大規模日本語データを公開するという話 2007-03-13-1 [NLP] 3月に滋賀で行われる言語処理学会全国大会で、グーグルが特別セッションをやるそうです。大規模日本語データについて。 Google: 大規模日本語データ公開に関する特別セッション http://www.google.co.jp/events/anlp2007.html グーグル株式会社では、日本語の言語処理研究推進のため大規模日本語データの公開を検討しています。つきましては仕様を決定するにあたり、実際にデータを御利用頂く研究者 / 技術者の皆様の「生の声」を是非お伺いしたく存じます。今回、言語処理学会様の御好意により、下記のとおりデータ仕様に関する特別セッションを設けて頂ける事になりました。日時: 2007年3月20日（火） 18:30 〜 19:00 会場: 龍谷大学瀬田学舎言語処理学会
bunhiko 2007/03/14
google

自然言語処理
リンク
1