Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
今回のモダシンラジオはここ最近観た映画について一人語りする回です。以下の8本の映画について15分弱でさらっと喋ってみました。15分で8本なんでほんと「さらっと」なんですが、「マダム・ウェブ」以外は全部オススメです(「マダム・ウェブ」もそんなに悪くないけど)。 ・ボーはおそれている ・ストップ・メイキング・センス 4Kレストア ・劇場版ハイキュー!! ゴミ捨て場の決戦 ・落下の解剖学 ・コヴェナント 約束の救出 ・マダム・ウェブ ・犯罪都市 NO WAY OUT ・ARGYLLE/アーガイル さて、モダシンラジオのデータをホスティングしてもらっているSpotify for Podcasters(旧Anchor)の私のページはこちらです。 https://podcasters.spotify.com/pod/show/kazuyoshi-nagasawa このSpotify for Podca
twitter検索はpublic_timelineをスクレイピングする方法でポストを収集していました。 これはうまくいっていたのですが3月のはじめにAPIによるアクセスに続いて通常ページもキャッシュされるようになり、ポストの取得がとびとびになってしまいました。影響はかなり出てしまい、回収率は1/10程度に落ち込んでしまいました。 代替策 TwitterはData mining feedという600ほどのポストを一度でもらえるAPIを提供していてポストを多く集めたい人はそれを使うようにというアナウンスをしています。しかしこれもキャッシュが効いているようですからそれほど改善しないのではないかと思い試していません。 また、既に事実上日本語のみを検索対象にするサービスになっているので日本語ユーザーのポストだけもらえればいいかと思い、日本語ユーザー(7万人前後)をRSSで取得する方法を考えましたが、
Please Try a Different Browser You are using an outdated browser that is not compatible with our website content. For an optimal viewing experience, please upgrade to Microsoft Edge or view our site on a different browser. If you choose to continue using this browser, content and functionality will be limited. Close Maximize Workforce Capacity with RPA Robotic process automation enables automation
大晦日だからXangoをhackる ライブドアネ連発で年が終わるのもいやな感じなんですよ。 ってか、ライブドアじゃなくて企業ネタで終わるのがね。 というわけでXangoハック委員会です。 だりいからターボールの提供のみで我慢してくらさい。 ダウンロード なんせ年賀状コンテンツを作らんといけない。 しばらく前に作ったXango製ロボットを公開するよ。 robots.txtとmetaタグに対応してるはず。 MySQLで管理してるよ。 Xango最新版のみでしか動かないからSVNでとってきてね。 しばらく稼動してると固まるバグもあるよ。 配布ファイルのinit_db.sqlでテーブルを作ってよ。 あとは、の __PACKAGE__->set_db('Main', 'DBI:mysql:MyRobots', 'user', 'pass'); の所の場所を適度に変更しろよ。 正直コードは適当だからな
Xangoというクロウラーフレームワークを使ってみる Xango XangoはPerlで書かれた汎用クローラーフレームワークです。 イベント型フレームワークPOEを使用することにより高速なクローリングが可能です。 実装にもよりますが、単一プロセス内でインデックシングや文字コードの変換等の処理を 同時に行うアプリケーションでも1秒に5~8 URL、1時間で 18000 ~ 22000 URLの処理が行えます。 ドキュメントはperldocのみっぽいので、日本語の情報を残す意味で使い方のメモをば。 相当端折って書いてます。 Xangoを使ったクロウラーを書くには、制御用のにPOEセッションを作る必要があります。 Xangoを制御するためのモジュールを適当な名前で作っておくのがスマートかと思います。 とりあえずセッション作成を行う処理を書きます sub spawn { my $class = s
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く