タグ

ブックマーク / chalow.net (27)

  • ポメラやめました! - iPhone とワイヤレスキーボードで快適テキスト入力生活

    ポメラやめました! - iPhone とワイヤレスキーボードで快適テキスト入力生活 2010-06-23-1 [iPhone][Gadget] iPhone 3GS を新しい OS「iOS4」にアップデート[2010-06-22-1]するとBluetoothのワイヤレスキーボードが使えるようになります。 当に使えるのか心配だったのですが、試してみてうまくいったというブログ記事を見て、さっそく東京ミッドタウンにあるAppleのお店で買いました。 - iOS 4, ワイアレスキーボードによる文字入力!そして純正で使えるキーボードショートカット一覧。 http://www.appbank.net/2010/06/22/iphone-news/135279.php - Apple Premium Reseller「Idea Digital Studio」 http://www.ideadigit

    ポメラやめました! - iPhone とワイヤレスキーボードで快適テキスト入力生活
    toton
    toton 2010/09/03
    iPhone スタンドに洗濯バサミ
  • インデックスを使った指定行取り出しプログラム(Pure Perl)

    インデックスを使った指定行取り出しプログラム(Pure Perl) 2010-08-10-1 [Programming][Algorithm] テキストファイルから指定した行を取り出すタスクについて。 頭から走査する方法 まずはファイルの頭から走査していくナイーブな方法。 ■コード(getline-naive.pl): #!/usr/bin/perl use strict; use warnings; my $qidx = shift @ARGV; # start from 0 my $tgtfn = shift @ARGV; open(my $fh, "<", $tgtfn) or die; while (<$fh>) { next if $. != $qidx + 1; print; last; } close $fh; 先頭行は0行目になる仕様。 ■実行例: % cat test.d

    インデックスを使った指定行取り出しプログラム(Pure Perl)
    toton
    toton 2010/08/11
    各行の先頭バイト位置を固定長バイトにしてインデックスにする
  • 簡体字と日本語漢字の相互変換ツール Kanconvit を公開

    簡体字と日語漢字の相互変換ツール Kanconvit を公開 2009-06-14-1 [Release][Programming][Bookmarklet] Hack部(ハック部)の合宿で、中国語の簡体字と日語漢字の相互変換ツール Kanconvit を作りました。 オフィシャルな読みは「カンコンビット」ということでよろしくです。 まあ別になんでもいいんですが。 - Kanconvit - 簡体字と日語漢字の相互変換ツール http://kanconvit.ta2o.net/ 簡体字と日語漢字の違い分かりますか? 下図では、右が簡体字で左が日語漢字(Kanconvitで変換したもの)です。 左だと漢字だけ見るだけでも中国語の意味がなんとなくわかりそうでしょ? Kanconvit ダイジェスト - 文字変換ライブラリ「Kanconvit.pm」(Perlモジュール) http:/

    簡体字と日本語漢字の相互変換ツール Kanconvit を公開
    toton
    toton 2010/08/11
  • 紙とペンと平易な英語でいろんな話題を分かりやすく解説してくれるムービー

    紙とペンと平易な英語でいろんな話題を分かりやすく解説してくれるムービー 2008-08-26-2 [English][Video] このサイトの動画がおもしろいです。 いろんな話題を平易な英語とアナログツールで 分かりやすく解説してくれるビデオ。 - The Common Craft Show http://www.commoncraft.com/show -- Common Craft - Explanations In Plain English http://www.commoncraft.com/ 切り絵のストップモーションアニメーションで、 分かりやすいプレゼンテーションを行っています。 ときどき手やペンも出てきて説明を補助しています。 言語は英語ですが、これがまた非常に分かりやすい。 若干早口だけど、使われている単語や表現は 基的なものばかりなので聞き取りやすいです。 スラン

    紙とペンと平易な英語でいろんな話題を分かりやすく解説してくれるムービー
    toton
    toton 2010/07/08
    The Common Craft Show
  • Webとコーパス 第四回「カタカナから英語スペルを調べる『うろぼえ』」

    Webとコーパス 第四回「カタカナから英語スペルを調べる『うろぼえ』」 2007-10-03-2 [WebAndCorpus] Web上のテキストデータをコーパスとして見る、 というテーマでブログ記事を書いています。 今回はカタカナから英語スペルを調べるサイト「うろぼえ」を紹介します。 なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で 提供していますので、そちらでもお楽しみ下さい。 - 第四回「カタカナから英語スペルを調べる『うろぼえ』」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ § ■ウェブコーパス徹底活用 第四回 「カタカナから英語スペルを調べる『うろぼえ』」 英文を書くときに悩むのが、英語のスペルです。 ワードをはじめ、 多くのエディタソフトには英語のスペル

    Webとコーパス 第四回「カタカナから英語スペルを調べる『うろぼえ』」
    toton
    toton 2010/04/20
    「仕組みは、 Yahoo!ウェブ検索APIを使用し、 調査対象のカタカナ語でネットを検索し、 検索結果に含まれるアルファベット表記の単語(頻繁に共起する単語) を取り出す、というものらしいです」
  • Bing経由で同じIPアドレスを持つサイトを検索する「兄弟サイト検索」を公開

    Bing経由で同じIPアドレスを持つサイトを検索する「兄弟サイト検索」を公開 2010-04-09-5 [Release] Bing APIを使った、初マッシュアップです[2010-03-18-2]。 同じIPアドレスを持つサイトを検索する「兄弟サイト検索」を公開しました。 自分が借りているレンタルサーバで、他の人がどんなサイトを運営しているかを調べるときなんかに便利です。 処理は、入力されたホスト名(ドメイン名)のIPアドレスを gethostbyname で調べて[2010-04-09-4]、Bing API でIP指定検索を行って、結果を表示するという流れです。 入力(検索キー)はサイト名(例:chalow.net)だけでなくIPアドレス(例:219.94.129.235)でも大丈夫です。 兄弟サイト検索 http://find.x0.to/ip/ 検索例: chalow.net,

    Bing経由で同じIPアドレスを持つサイトを検索する「兄弟サイト検索」を公開
    toton
    toton 2010/04/14
  • Google Chart API で QRコードも生成してくれるようになった

    Google Chart APIQRコードも生成してくれるようになった 2008-07-04-3 [WebTool] URL をなげるとグラフなどの図を画像として生成してくれる Google Chart API ですが、新たに QRコードを生成してくれるオプションができました。 QR codes (Developer's Guide - Google Chart API) 基となるパラメータは chs(サイズ指定)cht(QRコードなのでqrを指定)chl(エンコードしたテキストを指定) の3つです。 では実例。 このブログのトップページ「https://chalow.net/」のQRコードを作ります。 URLを組み立てるとこうなります: https://chart.apis.google.com/chart?chs=150&cht=qr&chl=https%3a//chalow.

    Google Chart API で QRコードも生成してくれるようになった
  • ストップワードとは?

    ストップワードとは? 2008-01-20-2 [IIR][NLP] 「Introduction to Information Retrieval」[1]の第二章 (次回の輪講の範囲)の2.2.2に出てくるストップワード (stop word) の 話題をまとめました。 § ストップワード (stop word) とは、 検索にほとんど役に立たないためインデックス作成時に除外する 単語のことである。 検索対象文書に出現するすべての単語をインデックスとするのは 無駄な面が多い。 例えば、「て」「に」「を」「は」などの助詞や 英語の冠詞・前置詞 (a, the, in, of) はほぼすべての文書に出現する。 そのため、 postings list が巨大になり格納スペースや処理時間に悪影響を与え、 その上、 検索結果も大量となり検索要求を満たす結果を得るのが困難となる。 そこで効率化のために

    ストップワードとは?
    toton
    toton 2010/03/12
    ネットで入手できるストップリスト
  • ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」

    ヤフーの日語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」 2008-08-21-1 [WebTool][NLP][Programming][Algorithm] Yahoo!デベロッパーネットワーク(YDN)に 「日語係り受け解析Webサービス」が登場しました。 Yahoo!デベロッパーネットワーク - テキスト解析 - 日語係り受け解析 http://developer.yahoo.co.jp/jlp/DAService/V1/parse.html 「係り受けってなに?」という方もいると思うので、 以下、まったくもって厳密ではない、適当な解説を試みます。 (1) 日語をコンピューターで処理するには、 まず形態素解析というのをやって、 文を形態素(≒単語)単位に分割します。 YDN の「日形態素解析Webサービス」[2007-06-18-1] で試すことができ

    ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」
    toton
    toton 2010/03/03
    「係り受け解析は、機械翻訳、文章要約、意図理解など、 深くて高度な自然言語処理に利用されています。」ローカルならcabochaかknp。
  • Webとコーパス 第六回「日英対訳文対応付けデータ」

    Webとコーパス 第六回「日英対訳文対応付けデータ」 2007-10-29-1 [WebAndCorpus] ウェブ上で使えるコーパスツールを紹介している連載ブログ記事、 今回で6回目になります。今回のテーマは対訳データです。 なお、この記事は「三省堂辞書サイトのブログ」へも転載という形で 提供していますが、そちらでの連載(転載)は今回で最終回となります。 今後は不定期でこのブログ「たつをの ChangeLog」で更新していきます (たぶん年内の更新はないでしょう)。 - ウェブコーパス徹底活用 第六回「日英対訳文対応付けデータ」 - Sanseido Word-Wise Web [三省堂辞書サイト] http://dictionary.sanseido-publ.co.jp/wp/ § ■ウェブコーパス徹底活用 第六回 「日英対訳文対応付けデータ」 「翻訳メモリ」と呼ばれる一連のソフトを

    Webとコーパス 第六回「日英対訳文対応付けデータ」
    toton
    toton 2010/02/23
    「日英対訳文対応付けデータ」「翻訳メモリ」「プロジェクト杉田玄白」
  • Dynamic Programming による類似文字列マッチの実装例

    Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを 素直に Perl で実装したみた。 さらにマッチ箇所取り出しロジックも実装してみた。 # DP はいわゆる「類似文字列検索(あいまい検索)」に使うと 便利なalgorithm。 実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。 単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、 転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二つの文字列 "

    Dynamic Programming による類似文字列マッチの実装例
  • IKEA で買った太陽電池式電気スタンドがとっても良い!

    IKEA で買った太陽電池式電気スタンドがとっても良い! 2009-06-19-2 [Gadget][LifeHacks] IKEAで買った太陽電池式の電気スタンド「SUNNAN」はすごく良いです。 - IKEA | 照明 | テーブルランプ | SUNNAN | ワークランプ 太陽電池式 http://www.ikea.com/jp/ja/catalog/products/00162479 コードレスなので、枕元や卓上などあちこちに楽々移動できます。 ストレスないよ!ストレスフリー! あと、なんだかんだですごく明るい。 周りの灯りがなくてもこれだけで読書できます。 灯りの持続時間は3,4時間くらい。 普段は、昼間部屋にほったらかしにして夜寝る前にちょこっと使う、という使い方で良いかと。 というわけで、IKEA に行く機会のある方はぜひゲットしてみてください。 2490円です。 色はオレン

    IKEA で買った太陽電池式電気スタンドがとっても良い!
  • Perl でファイルを後ろから読むの術

    Perl でファイルを後ろから読むの術 2006-09-18-4 [Programming] 「Perl Hacks」、"HACK#20 Reading Files Backwards" より、 ファイルを後ろから読むの術。 File::ReadBackwards を使うだけ。手軽。 #!/usr/bin/perl use strict; use warnings; use File::ReadBackwards; my $file_name = shift @ARGV; my $bw = File::ReadBackwards->new($file_name); until ( $bw->eof ) { print $bw->readline; } なお、コマンドラインからなら tac が便利。タック!タック! - [を] ファイルの先頭に追加するには[2003-07-07-2]

    Perl でファイルを後ろから読むの術
    toton
    toton 2009/08/11
    File::ReadBackwards
  • [を] MEDIA PASS! で CD をコンパクトに収納!

    MEDIA PASS!(メディアパス)で CD をコンパクトに収納! 2007-08-18-2 [LifeHacks] ジャケットやブックレットは保存しつつ収納場所を節約するのに うってつけの CD 収納袋「MEDIA PASS!」。 ジャケット、ブックレット、ケースの裏の紙、帯、CD が きっちり入って、かさばりません。 必要なものは全部保存できるので安心。 (中古として CD を売るときにはきれいなプラスチックケースに移して、 査定してもらうのがよさげ。) 先日紹介したら大好評でした[2007-05-01-4]。 で、結局私も購入してしまいました。ははは。 ミイラ取りがなんとやらです[2004-08-06-2]。 ■KOKUYO ソフトCD/DVDケース MEDIA PASS EDC-CM50D ■KOKUYO ソフトCD/DVDケース MEDIA PASS EDC-CM50W ama

    [を] MEDIA PASS! で CD をコンパクトに収納!
    toton
    toton 2009/03/02
  • 「フリーソフトでつくる音声認識システム」が気になる

    フリーソフトでつくる音声認識システム」が気になる 2007-10-09-4 [Book] ■荒木雅弘 / フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで 音声認識についての、フリーソフトでの実習付きの自習書。 これは気になる! パターン認識や機械学習の基礎的な解説と フリーソフトを使った実習の 二部構成だそうな。 (via http://www.ss.iij4u.or.jp/~sassano/ja/log/200710.htm)

    「フリーソフトでつくる音声認識システム」が気になる
    toton
    toton 2009/02/21
    voice recognition
  • 昭和・平成と西暦を変換する鍵は25と88(と12)

    昭和・平成と西暦を変換する鍵は25と88(と12) 2009-02-11-2 [LifeHacks] 昭和・平成と西暦を変換するTips。 昭和と西暦の換算 公式:昭和 + 1925 = 西暦 昭和47年 → 47 + 1925 → 1972年 公式:西暦 - 1925 = 昭和 1972年 → 1972 - 1925 → 昭和47年 平成と西暦の換算(1999年まで) 公式:平成 + 1988 = 西暦 平成12年 → 12 + 1988 → 2000年 公式:西暦 - 1988 = 平成 2000年 → 2000 - 1988 → 平成12年 平成と西暦の換算(2000年以降) 公式:平成 - 12 = 西暦(下2桁) 平成27年 → 27 - 12 = 15 → 2015年 公式:西暦(下2桁) + 12 = 平成 2015年 → 15 + 12 = 27 → 平成27年 覚え方 1

    昭和・平成と西暦を変換する鍵は25と88(と12)
    toton
    toton 2009/02/12
  • RSS を読み込んでランダムな文章を生成する

    RSS を読み込んでランダムな文章を生成する 2008-09-07-3 [Programming][NLP][IIR][WebAPI] 今日のIIR輪講[2008-09-07-2]の内容のフォローも兼ねて、ちょっとしたハックを紹介。 bigram language model に基づく、ランダム文生成を行います。 って、まあ、単純にある単語の次に現れる単語の分布を用いて、文章を生成していくだけですが。 以下、サンプルプログラムと実行例です。 サンプルコード rss-lm.pl #!/usr/bin/perl use strict; use warnings; use XML::RSS; use LWP::Simple; use XML::Simple; use URI::Escape; use utf8; binmode STDOUT, ":utf8"; my $appid = "Yaho

    RSS を読み込んでランダムな文章を生成する
    toton
    toton 2009/01/25
    人工無脳 マルコフ連鎖で文章生成
  • 誰も興味を持たないとは思うが Magma を紹介してみる

    誰も興味を持たないとは思うが Magma を紹介してみる 2008-06-29-2 [Music] Magma(マグマ)とは、 1969年結成のフランスのプログレッシブロックなバンド。 変態的なリズムと謎な言語によるヴォーカルがポイントです。 怪しげな宗教のような雰囲気もあったりします。 「The last seven minutes」という、 「マグマとは何かを説明しやすい」曲の 最近のライブの映像があったのでご紹介。 The last seven minutes (YouTube) 格好良すぎ!イントロだけでしびれてしまいます。 ドラムを叩いているのがリーダーの クリスチャン・ヴァンデ。 ドラムではなくヴォーカルに専念したりもします。 Otis, French TV, 1984 (YouTube) Otis, 2006? (YouTube) (彼の姿に20年という時の流れを感じてくださ

    誰も興味を持たないとは思うが Magma を紹介してみる
    toton
    toton 2008/11/08
    おおMAGMA映像たくさん。google高林哲さんもMAGMA好きらしいのでスーパーハカーに興味ある人は聴くといいと思うよ!
  • Wikipediaのキーワードリンクを使って関連語データを作ってみた

    Wikipediaのキーワードリンクを使って関連語データを作ってみた 2007-06-09-3 [NLP][Programming][Algorithm] Wikipedia のキーワードリンクを使って関連語データ(関連キーワード集) を作ってみた。 Wikipedia のデータはダウンロードページからbz2形式のを取ってきた。 日のウィキペディアのXMLデータね。 (see Wikipedia:データベースダウンロード) で、Perlスクリプトで以下の関連語データ作成処理を行った。 (スクリプトはこの記事の末尾に載せておく) (1) 各キーワードページに含まれているキーワード(リンク)を取り出す。 例えばキーワードAのページにB,C,Dが含まれていたら、A => B,C,D というデータを蓄積。 またキーワードAが他のキーワードのページ(例えばX)に含まれていたら、それも蓄積。その場合

    Wikipediaのキーワードリンクを使って関連語データを作ってみた
    toton
    toton 2008/09/28
    類語 シソーラス 関連語データ(関連キーワード集)データサイズは130Mバイト。53万エントリ。関連語データ作成スクリプト(Perl)
  • ステミングとは?

    ステミングとは? 2008-01-20-1 [IIR][NLP][Algorithm][Programming] 「Introduction to Information Retrieval」[1]の第二章 (次回の輪講の範囲)の2.2.4に出てくるステミング (Stemming) の 話題をまとめました。 § 英語などの欧米系の言語では、 意味的には同じ単語が語形変化により表層文字列が異なることがある。 例えば、"retrieves", "retrieved", "retrieving", "retrieval" などで[2]、実用上これらを同じ意味のものと見なし インデックス作成時に同じ単語として扱いたいという要求がある。 ステミング (stemming) はこのような語形変化を取り除き 同一の単語表現に変換する処理である。 ステミングの手法として、 ポーターのアルゴリズム (Port

    ステミングとは?
    toton
    toton 2008/09/14
    ステミング (stemming) 語形変化を正規化。(Porter's algorithm)