タグ

botに関するas365n2のブックマーク (27)

  • 人工無脳レビュー

    Fig. 1に最近の人工無脳の能力の、独断に基づいた分布を示す。横軸は学習能力、縦軸は文脈追跡能力を示している。近年この勢力図は大きく変わった。マルコフ文生成を行なう人工無脳の一派の台頭と、限定的ながら論理を追跡して会話に反映させる人工無脳の技術の出現である。かつて人工無脳の代名詞と考えられていた辞書型はいまや旧世代のアーキテクチャに属し、その範疇では新しい技術開発が停滞している模様である。ログ型アーキテクチャは以前から存在していたのだが、いつの時代にもあまり大きな勢力にはなっていないようである。これらの情勢の変化はマシンパワーの増大と人工無脳業界への形態素解析器の導入に伴って生じたと考えられる。以下に各人工無脳の特徴を簡単に述べる マルコフ文生成型 マルコフ連鎖を用いて文を生成する。後述の辞書型人工無脳は辞書を拡大することでよい反応をするようになるが、マルコフ文生成型は逆で、生成する文の

    as365n2
    as365n2 2010/01/13
  • otsuneは既に死亡しているのでは

    otsuneがTumblrのフィードだけをTwitterに流すようになって一年が経った。彼の消息を知る人間は果たして存在するのだろうか。生きているという根拠は一体どこにあるのだろうか。 otsuneの人格について。彼は、あえて自らの性格をロボットのように変化させていったように思える。わざと。いつBOT化してもいいように。BOTだけをネットに残して自らの肉体を滅ぼすのが目的だとしたら・・・? 彼は誰よりも人間的で、感情的な人間だからこそ自分の感情を殺した。そして、ついには自ら命を・・・。いや、考え過ぎか。 コンピュータというのは人間の心を乾いたものにしてしまう。一流のギークであった彼なら、他の人間よりも、その傾向が強かったことだろう。彼の冥福を祈る・・・。

    otsuneは既に死亡しているのでは
  • 「圧縮新聞」を作った - phaの日記

    僕は昔からロボットがロボットなりに変な文章を生成して喋ったりする人工無脳とかそういう仕組みが好きで、最近はそのへんの仕組みを勉強していました。それで大体仕組みの基はわかったので簡単なスクリプトを書いてみたよ。 圧縮新聞 このスクリプトはウェブ上にある新聞社とかのニュースの文章を元にして、バラバラにして圧縮してまとめた文章を作るので、ざっと眺めるだけでその日起こった事件の全体が何となくわかるかもしれません。リロードするたび文章は変わります。 生成例 しょうゆ・みそ業界大手のNOVA(大阪市)が入った郵便小包は、北朝鮮の鉄道網を連結する計画だったらしいことが21日、わかった。タンクに灯油を補給した。検案の結果、財政難などをほとんど与えずに6者協議の外相会議の早期再開に期待を表明した国と製薬会社に賠償を求めた。その後、死亡した。 しくみ こういった人工無脳みたいな文章生成をするには形態素解析

    「圧縮新聞」を作った - phaの日記
    as365n2
    as365n2 2009/07/05
    形態素解析+マルコフ連鎖。Yahoo!Japanの形態素解析API
  • @ymrl_dnhrは@dnhrに改名しました+人工無脳dnhrの話いろいろ - いんたーねっと日記

    4限の空きコマの思いつきで、@ymrl_dnhrを@dnhrに改名してみました。前の名前だとNatsuLion for iPhoneで@ymrl_dnhr宛てのリプライが僕宛てのリプライみたいに表示されてしまったり、エゴサーチにヒットし過ぎてウザかったりというのが主な理由です。Twitter検索で「ymrl or やまある」したフィードを購読してたら半分以上がbotのこと指してたんだぜ……!! dnhrの名前の意味は、「ダイナミック ネガティブ ハイパー ローター(Dynamic Negative Hyper Rotor)」らしいです(略語復元ジェネレーター)。 @dnhrの仕様について Followingの発言から単語を覚えて、5分くらいごとに文章を生成してPost 毎時0分には時報っぽいことをする Followすると1時間以内にFollow返しされる ただし、最後のPostが「日語っ

    @ymrl_dnhrは@dnhrに改名しました+人工無脳dnhrの話いろいろ - いんたーねっと日記
  • FriendFeedのユーザーエージェントがフィードの購読者数の通知を開始 - F.Ko-Jiの「一秒後は未来」

    「Ginormous RSS Subscription Numbers? Thank FriendFeed」によると、FriendFeedのユーザーエージェントがフィードの購読者数を通知してくれるようになったそうです。 それに伴って早速 FeedBurner のレポートが FriendFeed の購読者数を加算して表示するようになっています。 サーバーのアクセスログを調べてみると、FriendFeedのボットは次のような文字列でした。 Mozilla/5.0 (compatible; FriendFeedBot/0.1; +Http://friendfeed.com/about/bot; 150 subscribers; feed-id=xxxxxxxxx) もし自分のFriendFeedを購読してくれているユーザーが100人いた場合、フィードをFriendFeedに登録しておけば、見かけ

    FriendFeedのユーザーエージェントがフィードの購読者数の通知を開始 - F.Ko-Jiの「一秒後は未来」
  • フレッシュミーティングが新規登録可能になりました : 管理人@Yoski

    先日から招待制で細々と運営していたフレッシュミーティングですが、、、日から招待がなくても新規登録が可能になりました。 頂いたフィードバックを元にもろもろ改修をし、より広くフィードバックをいただくために招待制から一般登録制に変更させていただきました。 使いたいときに使いたいツールなので、そもそも招待制というのがピンとこないかな、とも思いつつ。。 自宅で作業している人との情報共有や外部の方とのファイルのやりとりなど、私も毎日使うツールになっています。 よろしければお試しください。 ⇒フレッシュミーティング ⇒新規登録 ※チュートリアルについて フレッシュミーティングに新規登録すると、チュートリアルということで自動応答ロボットが初期メンバーに追加されます。 これをすぐに削除される方が結構多いようなのですが(あとなんか気持ち悪いという方も)、単なる自動応答なので、よろしければ遊んでやってください

    as365n2
    as365n2 2009/03/12
    自動応答ロボットにちょとわろた
  • CAPTCHAの進化とAIの進化とのいたちごっこ | スラド セキュリティ

    Microsoft ResearchはAsirraという画像ベースのCAPTCHAを開発しているが、これを破るプログラムが既に開発されているそうだ(Technology Review・家記事)。 Asirraは表示される犬やの画像から、すべての(or犬)の画像を選択するという認証方法であるが、 パロアルト研究所のPhillipe Golle氏は83%の確率で画像が犬かか識別できるプログラムを開発した。Asirraの画像はPetfinder.comというペットの里親募集サイトが提供している300万の画像が元になっているが、Goll氏はこのサイトから8,000点の画像集め、トライアル&エラーを通して犬とを見分けられるよう学習させた。識別は画像の色とテクスチャを統計分析して行われ、特に犬のピンク色の舌との眼の緑色が識別の鍵となったそうだ。 Golle氏曰く「機械学習は情報集約に非常に

  • 毎日デイリーニューズが検索エンジンを拒否 - 新しいTERRAZINE

    User-agent: * Disallow: / http://mdn.mainichi.jp/robots.txt 上の呪文の意味 全ての検索エンジンなどのロボット(クローラ:Webページの情報を収集して回るプログラム)を拒否する。 参考:ロボット排除 - 全てのロボットがサイト全体を訪問しないようにしたい場合 ここまで体を張ったネタは、なかなかできんわ。 やっぱ、robots.txtを無視するクローラは必要なのかもしれんね。 追記 はてなブックマークのコメントを見ると、毎日.jpがクローラ蹴ってるように誤解してる人がいる。実際は「毎日デイリーニューズ」が蹴ってるだけだからね。

    毎日デイリーニューズが検索エンジンを拒否 - 新しいTERRAZINE
  • CAPTCHA破りサービス登場? | スラド セキュリティ

    ストーリー by nabeshin 2008年02月08日 16時11分 毛をちらばせるだけでなく、もっとぐにょぐにょに 部門より ITmediaの記事によると、「Live Mailのキャプチャを破るボットが登場、不正アカウントを大量取得」とのこと。「スパマーが開発したボットがCAPTCHAを解読している」と書かれているが、読み進むと「(ボットは)CAPTCHAの変形文字を入力するところまで来ると、CAPTCHA破りサービスに画像を送って読み取らせ、テキストを受け取る仕組みになっている。」とあるので、ボットが直接解読しているわけではないようだ。 タレコミ人としては、この「CAPTCHA破りサービス」がどのようなものか気になるが、OCRソフトのような物でノイズを消去しているのだろうか。3回に1回程度の成功率ということである。

  • 「出会いを求める女性」のふりをして個人情報を聞き出すボットが登場 | スラド

    /.家などですでに話題になっているが、「女性のふりをするチャットボット」が出回っているそうだ。この「チャットボット」はいわゆる「人工無能」のようなものだと思われるが、チャットで「簡単に寝れる女」をエミュレートし、「lonely」なロシア人男性を騙して名前や連絡先、電話番号といった個人情報や銀行口座などの情報を3分に一度の頻度で聞き出すとのこと。 詳細はCNETのWarning sounded over 'flirting robots'という記事にもかかれているが、このボットが備えているAI物の「出会いを求める女性」と見分けが付かないほど優秀で、30分で10人と「relationships」を結ぶことができるそうだ。更にこのボットは「ロマンチックな恋人」から「性に飢えた女性」まで、さまざまな性格を擬態することも可能で、チャット相手を「個人的なWebサイト」に誘導してマルウェアに感染さ

  • Administrative Quarantine

    Your system administrator has blocked your computer or device. Please contact the system administrator.

  • ひとり開発ブログ | » ロボット投稿型スパムをさくっと防ぐ超簡単な方法

    なんと、このideamiというしょぼいサイトにも海外からのロボット投稿型スパムが来るようになってしまいました。悲しい。 何とか対策をしようと思っていたところ、dotliveのオカダ君がいい方法を教えてくれました。(Thanks!) やり方は簡単。 ロボットスパムは、htmlのソースからformを見つけ、そこにデータを自動的に入れて投稿しているわけです。その投稿の仕方は単純で、どうやらnameでよく使われるような単語を見つけて、それに投稿しているぽい。 たとえば、「name」は名前、「mail」はメール欄、「url」はurl入力欄、みたいな感じです。 今回の対策では、これを逆手に取ります。つまり、偽物のフォームを作り、それに入力があるもの=ロボットによる投稿、と見なし、投稿させないというものです。 偽物のフォームを作り style=”display: none” しておいて、ユーザーには見

  • ウィルスバスター(トレンドマイクロ)からのアクセス - えむもじら

    Nothing ventured, nothing gained で話題になっていた 66.180.82.*からのアクセス、調べてみたらうちでも結構ありました。ただし、 Nothing ventured, nothing gained. - 66.180.82.*からのアクセス ウイルスバスター2007でURLフィルタをオンにしていると、アクセスする先のURLをトレンドマイクロのサーバーに送り、トレンドマイクロのサーバーから先に該当URLにアクセスし、サイトの安全性を確認してから、ブラウザがURLにアクセスするような仕様になっているらしい。 とのことですが、うちの最近のログを調べた限りでは、先にブラウザからのアクセスがあり、その2,3秒後にトレンドマイクロからのアクセスとなっているようです。 ウイルスバスター2007とアクセスIP66.180.82.xx - 暇人STRのブログによると、ア

    as365n2
    as365n2 2007/08/05
    UAを騙るbot
  • redir.cgi って何? - えむもじら

    (c1) [2007/07/01 15:13:51] by のり アンテナの未読管理をする目的でリンク URL の末尾に更新時刻などのクエリーを付加したりすることがあるのですが、それだとリンク先に飛んだ時に余計なクエリーが付加されたままになるので、これを回避する目的で間に redir.cgi というリダイレクタをかませています。 この辺の経緯については、ねこめしにっき(2004年6月) http://www.remus.dti.ne.jp/~a-satomi/nikki/2004/06.html の『従来型アンテナのつける「謎クエリ」に関して』と題した一連の記事が詳しいです。(redir.cgi のソースも公開されています) で、うちの先月のアクセスログを見てみたところ、UA が DoCoMo/2.0 P901iS(c100;TB;W20H10) のうちのサイトへのアクセスは2件しかなく、

    as365n2
    as365n2 2007/07/02
    リンクを片っ端からひっくりかえすタイプのクローラーに踏み台にされる。
  • [を] Robots-Nocontentで、重要じゃない箇所をYahoo! Slurpに知らせる

    Robots-Nocontentで、重要じゃない箇所をYahoo! Slurpに知らせる 2007-05-09-4 [SEO] 米Yahoo!が最近導入した「Robots-Noncontent属性」。 自分のページ内の重要じゃない箇所をYahoo!のクローラ(Slurp)に知らせることができます。 - Yahoo! Help - How do I mark web page content that is extraneous to the main unique content on the page? http://help.yahoo.com/help/us/ysearch/slurp/slurp-14.html マーキングの例: <div class="robots-nocontent"> ここはナビゲーションメニューとかで重要じゃない箇所だから ここにある単語は検索エンジンから引

    [を] Robots-Nocontentで、重要じゃない箇所をYahoo! Slurpに知らせる
  • http://underdone.net/blog/log/eid549.html

    as365n2
    as365n2 2007/06/08
    input要素のname属性の値を変えてみる。
  • 2007-05-16

    robots.txtを誤って認識する不具合(サイト管理者様向け情報) サイトごとに巡回許可/拒否を設定した robots.txt を誤って認識する不具合が発生しており、こちらを修正しました。 今回間違って巡回拒否と認識されたサイトについては、今後巡回が行われた時点でrobots.txtは正しく認識されますが、即時反映を希望される場合は、手動更新チェックを行っていただければと思います。 アイデアやお問い合わせページよりご指摘いただきありがとうございました。 はてなアイデアミーティング 5/16 日、はてなアイデアミーティングを行いました。「実装済では」タグを付けられたアイデアの検討を行った様子を録音しています。 以下のプレーヤーから再生、ダウンロードを行っていただけます。 日検討したアイデアは以下の通りです。 はてなアイデアはてなアイデアはてなアイデアはてなアイデアはてなアイデアはてな

    2007-05-16
  • tips - クローラーのアクセスを「まとめる」 : 404 Blog Not Found

    2007年05月02日12:30 カテゴリTips tips - クローラーのアクセスを「まとめる」 これ、503返す前にもう一度アクセスログを見た方がいいと思う。 [を] PerlPHPGooglebotを一定の確率ではじく 「Googleのクローラ(Googlebot)のアクセス数が多すぎてサーバに 負荷がかかりすぎる問題」に悩まされています。たとえば、/foo.cgiへのアクセスが多いとする。この場合、単に/foo.cgiではなく、/foo.cgi?query=fooや/foo.cgi?query=barにbotたちは来ていないだろうか。それが結果としてアクセスを増やしていないだろうか。 この場合なら、対処はむしろ503を返すのではなく、CGIのEntry Pointへの301を返すことなのではないか。こんな感じで。 my $q = CGI->new(); # ... if (

    tips - クローラーのアクセスを「まとめる」 : 404 Blog Not Found
  • 404 Blog Not Found:http://www.amazon.co.jp/ の「二枚舌」に学ぶ究極のSEO

    2007年04月20日23:45 カテゴリiTech http://www.amazon.co.jp/ の「二枚舌」に学ぶ究極のSEO If you prefer English, see Keywords in the URI = The Ultimate SEO - 404 Web 2.0 Not Found これを書いて思ったのは、検索サイトはどうやってAmazonのリンクを正規化しているのかというもの。 404 Blog Not Found:不都合なはてブ はてなブックマーク - www.amazon.co.jp の注目エントリー これのどこが問題かおわかりになるだろうか。 答えは、あっさり出た。 たとえば、blogで先月一番売れた「数に強くなる」をぐぐると、Amazonのリンクが一位で私の書評が二位になる。 このAmazonのリンクに注目していただきたい。こうなっている。 数に

    404 Blog Not Found:http://www.amazon.co.jp/ の「二枚舌」に学ぶ究極のSEO
    as365n2
    as365n2 2007/05/04
    botとして認定されれば、正規化されたURIにリダイレクトされる仕掛け。
  • Perl、PHPでGooglebotを一定の確率ではじく

    PerlPHPGooglebotを一定の確率ではじく 2007-05-01-2 [Programming] 「動的生成ページへのGooglebot(Googleのクローラ)のアクセス数 が多すぎてサーバに負荷がかかりすぎる問題」に悩まされています。 robots.txt の Crawl-delay は効かないし[2007-03-21-1]、 Googleウェブマスターツールでクロール率を低く設定しても ある回数よりも下がらないしで困っていました。 アクセス禁止にすれば完全解決なのですが、 それにより検索されなくなるのはファインダビリティが下がって嫌なので、 とりあえずランダムで 503 を返すことで対処しました。 ときどき503が出ることにより、しばらくするとGooglebotが 「サーバが混んでいるんだな」と思ってくれるみたいで、 結果としてクローラのアクセス数が激減、かつ、検索結果

    Perl、PHPでGooglebotを一定の確率ではじく
    as365n2
    as365n2 2007/05/04
    php&perl