furyaのブックマーク / 2007年10月15日

furya id:furya

2007年10月15日のブックマーク (5件)

携帯端末の個体識別情報(uid)取得方法
携帯サイトでユーザー認証をする方法はいくつかあります。一番簡単なのは、ユーザ名とパスワードを使う方法です。しかし、毎回入力するのはユーザにとっては面倒ですよね。 PCサイトならばクッキーを使ってこれらの情報を保存しておけるので毎回入力する必要はありません。しかし携帯サイトではクッキーが使えない(一部機種によって可能らしい)ので別の手法を取ることを考えなくてはいけません。そこで出てくるのが、携帯端末の個体識別情報(uid)を使うというやり方です。携帯電話は電話番号と同じように、その端末を識別するIDのようなものを持っています。これを利用すれば、アクセスしてきたのがどのユーザなのかを判別することが可能になるというわけです。キャリアによって取得方法や制限などがあるので、以下に紹介します。なお、個体識別情報はキャリアによって様々な言い方があるようですがここでは便宜上「端末ID
furya 2007/10/15
リンク
はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
furya 2007/10/15
リンク
第5回 N-gramのしくみ | gihyo.jp
前回は形態素解析を使う検索エンジンのしくみについて説明しました。今回は、FINDSPOTで使用しているN-gramという検索エンジンのしくみについて説明します。 N-gramによる見出し語の切り出し前回は、形態素解析による検索エンジンでは、検索可能な最小単位が分かち書きの切り分け単位となる点を説明しました。一方、N-gramを使った検索エンジンでは、単純に文字の並びを見出し語としてインデックスを作成します。1文字を元にインデックスを作成する方法をユニグラム、2文字の並びを元にインデックスを作成する方法をバイグラム、3文字の並びを元にインデックスを作成する方法をトリグラムと呼んでいます。 1文字：ユニグラム 2文字：バイグラム 3文字：トリグラム N-gramによる見出し語の切り出しは、形態素解析のための文法解析を伴わないため、特定の自然言語に依存しないという特徴があります。 FINDS
furya 2007/10/15
n-gram

検索
リンク
SennaによるN-gramインデックスで注意すべき挙動 - グニャラくんのグニャグニャ備忘録@はてな
追記:以下の文書について現在リリースされているSenna 1.0.7では、 N-gramで１文字の日本語を検索する場合は直接部分一致検索を動作させるようにしました。というわけで、以下で説明している挙動は今現在当てはまりません。１文字の単語について uchiuchiyamaさんのブログにあった、Sennaのクエリ書式に対する質問 http://d.hatena.ne.jp/uchiuchiyama/20070317/senna_query_probl em この問題ですが、おそらくN-gramでインデックスを作成している場合に起こっていると考えられます。 SennaのN-gramインデックスはbi-gram、すなわち２文字を１つのトークンとみなし、インデックスへの登録を行っています。ということは、文書の末尾を除いて、すべてのトークンは２文字となり、１文字のトークンで検索をし
furya 2007/10/15
senna
リンク
全文検索システム Hyper Estraier
概要 Hyper Estraierは全文検索システムです。たくさんの文書の中から、特定の語句を含むものを探して、該当するものの一覧を表示することができます。Webサイトを運営している方なら、自分のサイト専用の検索エンジンとして利用することができます。メールボックスやファイルサーバを対象とした検索ツールとして利用することもできます。 Hyper Estraierには、次のような特徴があります。インデックスを使った高速な検索ができます。大量の文書のインデックスを短時間で作成できます。 N-gram方式による漏れのない検索ができます。形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。世界各国の言語が扱えます。対象文書の所在や形式に依存しません。賢いWebクローラが付属しています。ライブラリとして各種
furya 2007/10/15
検索
リンク
- 2007年10月19日
- 2007年10月15日
- 2007年10月11日