タグ

2009年7月10日のブックマーク (9件)

  • 【インフォシーク】Infoseek : 楽天が運営するポータルサイト

    日頃より楽天のサービスをご利用いただきましてありがとうございます。 サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。 お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。 メンテナンスが終了次第、サービスを復旧いたしますので、 今しばらくお待ちいただけますよう、お願い申し上げます。

  • Security Akademeia【セキュリティアカデメイア】

    当サイトの一部ページには、アフィリエイト・アドセンス・アソシエイト・プロモーション広告を掲載しています。 Amazonのアソシエイトとして、Security Akademeiaは適格販売により収入を得ています。 広告配信等の詳細については、プライバシーポリシーページに掲載しています。 消費者庁が、2023年10月1日から施行する景品表示法の規制対象(通称:ステマ規制)にならないよう、配慮して記事を作成しています。もし問題のある表現がありましたら、問い合わせページよりご連絡ください。 参考:令和5年10月1日からステルスマーケティングは景品表示法違反となります。 | 消費者庁

    Security Akademeia【セキュリティアカデメイア】
    overlast
    overlast 2009/07/10
  • べた書きかな文の分かち書き再考 - 武蔵野日記

    最近仕事の行き帰り、片道自転車が40分あるので、研究というかなんというかいろいろ頭の体操をしながら自転車を漕いでいるのだが、今日は @sassano さんに教えてもらって文節をどう区切るかを再読する。いや、N文節最長一致法というヒューリスティックがどういうものだったか(アルゴリズム的にはなにをしていることに相当するのか)考え始めてしまって、なんなんだろうなぁ、と思って……。(もしかしてこのヒューリスティックを統計的な手法で説明できたらおもしろそうだな、と考えたのが事の発端) 基文献としては以下の3点。いずれも(かな漢字交じり文ではなく)かなだけからなる入力をいかに分かち書きするか、という問題に取り組んでいる。前読んだ気がするのだがすっかり忘れていた。かな漢字交じり文であれば漢字からひらがなやカタカナになったり、数字になったりするという、字種の切れ目の情報が使えるのだが、べた書きかな文は字

    べた書きかな文の分かち書き再考 - 武蔵野日記
    overlast
    overlast 2009/07/10
  • 文節をどう区切るか

    日本語入力プログラムの歴史は、入力の効率を求める歴史でした。初めは「これはペンです」という文章を入力するにも、「これは」で一度変換し「ペンです」でまた変換する方式(単文節変換)や、「これは」と「ぺんです」の間に文節を区切る指示を与える方式をとっていました。やがて、単文節変換や文節ごとに区切り記号を入れる方式から、自動的に文節を区切る連文節変換(複文節変換?)へと進化し、さらには文脈に応じて適切な語を選ぶ用例変換、AI変換が花開き、日本語入力は簡単で効率的になっていきました。 このページは、文節を区切る方法について、現行の日本語入力プログラムでよく使われる方式を解説します。用例変換、AI変換は別項にて解説します。 目次 n文節最長一致法 うしろ向きn文節評価最大法 接続コスト最小法 参考文献・資料 n文節最長一致法 採用している日本語入力プログラム:ATOK、EGBRIDGE、VJEなど。

  • Não Aqui! » CDB++ 1.0 released

    CDB++という,静的ハッシュデータベースライブラリをリリースしました.ライセンスは修正BSDです. 静的ハッシュデータベースなので,いったんデータベースを構築したら,要素の追加や削除は行えません.その代わり,コンパクトなデータベース,高速な構築,高速な検索ができるようになっています.データ構造は,Constant Databaseを採用しています.Constant Databaseの実装はいくつかありますが,クロスプラットフォームでお手軽に使えるものがなかったので,作ってみました.また,このライブラリはcdbpp.hというインクルードファイルのみで構成されているので,このファイルをインクルードするだけでアプリケーションに組み込めます. ハッシュデータベースには,Oracle DBやTokyo Cabinetなど,優れた実装がたくさんあります.しかし,単にキーと値のペアをファイルに書き出し

    overlast
    overlast 2009/07/10
  • CDB

    D. J. Bernstein Data structures and program structures cdb How to install cdb The cdbget program The cdbmake and cdbdump programs The cdbstats and cdbtest programs The cdb format specification The cdb-reading library interface cdb is discussed on the cdb mailing list. What is it? cdb is a fast, reliable, simple package for creating and reading constant databases. Its database structure provides se

    overlast
    overlast 2009/07/10
  • 日本の満員電車ごときで文句言っている奴は甘えすぎ by インド人~世界一周を目指すみかんの日常日記~

    の満員電車ごときで文句言っている奴は甘えすぎ by インド人 2009年07月10日 インド人がタイトルのようなことを当に思っているかはわかりませんが、世界レベルでみれば日の満員電車ごときで文句言っている人はそう思われてもしかたないと思います。 日の満員電車ごときで文句言っている奴は、インド人にしてみれば人生舐めているとしか思えないでしょう。 インドの満員電車 レベル1 これでカオスだと思うのは大甘です。 インドの満員電車 レベル2 警官がいても止めません。 そのまま、走っていてしまいました。 これで驚く人も、インド人にしてみればまだ甘ったれです。 インドの満員電車 レベル3 動画に写っている人も凄いけど写している人はもっと凄いと思います。 それにしても嫌な動画の終らせ方するなよ ((((;゜Д゜))) これぐらいで驚く人も甘っ・・・ すいません。僕はやっぱり甘ったれでもいいです

  • 時代はGNU screenからtmuxへ - このブログはURLが変更になりました

    GNU screenはもう古いので皆さんtmuxへ移行しましょう、という話。Gentooならemerge tmux。 スクリーンショット 手元のtmuxを撮ってみた。縦分割モード。ウィンドウマネージャはawesome。左のircクライアントはweechat。 家にもいくつかスクリーンショットがある。 tmuxへ移行する理由(メリット) 標準設定のままでもそれなりに使えるステータスバー 各ショートカットがコマンドベース(コマンドで操作ができる) 標準で縦分割機能搭載 GNU screenがたまに固まる問題(が発生するのは私だけ?)が発生しないかも ビュー専用のスクロールモード 柔軟なペイン制御 コピー&ペースト用のバッファを複数保持できる terminfo的にscreen互換 メモリ消費量が少ない(GNU screenの約1/5) 一部機能でマウスが使用できる(mode-mouse, mo

    時代はGNU screenからtmuxへ - このブログはURLが変更になりました
  • 天空の城ラピュタのモデルとなったベンメリア遺跡(カンボジア) : カラパイア

    真偽のほどは定かでないが、宮崎駿監督のアニメ「天空の城ラピュタ」のモデルとなったと噂されているカンボジアのベンメリア遺跡。 熱帯樹の茂る密林が遺跡全体を覆っていて、建造物のいたるところに熱帯樹が根を伸張し、挙句の果てに熱帯樹の倒壊に伴って建造物が無惨に倒壊してしまったという。 遺跡は、野生の虎や象が出没するため、なかなか修復が進まないまま、森の中にひっそりと埋もれている正真正銘の荒廃地帯で、寺院の屋根の上や瓦礫の間を飛んだりはねたりよじ登ったりしながら、見学できるところも、探検家気分でなかなか楽しいものなのだそうだ。

    天空の城ラピュタのモデルとなったベンメリア遺跡(カンボジア) : カラパイア