2013年12月31日のブックマーク (15件)

  • Rubyとか使ってクローリングやスクレイピングするノウハウを公開してみる! - 病みつきエンジニアブログ

    今まで何度もスクレイピングとかクローリングをしてきたので、マエショリストの端くれとしてコツを公開すべきかなあ、と思い、公開します。 今日の題材は、CNET Newsです。私はウェブ文書にタグ付けをするという研究をしているのですが、そのための教師データとしてクローリングをします。 photo by Sean MacEntee 要件定義 CNET Newsから全ニュースを保存し、その文をデータベースに保存します。これは、次のようなフローに書き下すことができます。 全URLを取得し、データベースに保存 データベースにある全URLをダウンロードする 保存した全ページを解析して、文をデータベースに保存する という流れです。これらは独立していますから、それぞれどの言語で解析しても構いません。しかし後述しますが、「あとから追いやすくする」「適材適所」といったあたりを気をつけて、言語選択をするべきだと

    Rubyとか使ってクローリングやスクレイピングするノウハウを公開してみる! - 病みつきエンジニアブログ
    yag_ays
    yag_ays 2013/12/31
  • 日本,日本語,自然言語処理 - 蝉々亭

    2013年も日で最後となりましたが,いかがお過ごしでしょうか.まだ掃除も終わっていないのでこんなエントリを書いている場合ではないのですが,整理のためにも書いておきたいと思います. 最近,自分のキャリアについて考えることが多くなってきました.現職についてあと3ヶ月程度で丸6年となりますが,年齢においても,生活においても,職業人としての到達点においても最近一つの区切りを迎えたということがあり,これまでを振り返って今後の方向性を検討する時期にあるように思っています. そんな中で何冊かキャリアに関するを読みましたが,自然言語処理分野の研究者としていささか考えさせられるものがあったのは『10年後にえる仕事えない仕事』というです.このの要点は日人メリットを活かした仕事をすればいっぱぐれない,というある意味では素朴(かつごく妥当)なものですが,興味深いのは数ある職業を 1.技能集約的か

    日本,日本語,自然言語処理 - 蝉々亭
    yag_ays
    yag_ays 2013/12/31
  • ノンパラメトリック平均場近似と確率伝播法の提案

    2013年も残り少なくなってきました.そこで,今回は研究の締めくくりとして,今年のCVPRで発表した論文について紹介したいと思います. 僕の研究は,大雑把に言うとグラフィカルモデルの最適化手法に関するものです.研究の貢献を簡単にまとめると,次のようになります. グラフィカルモデル内の確率変数が連続的である場合,計算上の理由から,変分ベイズ法ならびに確率伝播法で扱える分布のモデルには制限があります.提案手法を使うことで,非指数型の分布族に関しても変分ベイズ法を効率的に適用できるようになりました. さらに,同様の議論を確率伝播法にも適用することで,確率伝播法をノンパラメトリックに扱うこともできるようになりました. 実際の論文では対象のグラフィカルモデルを一階のマルコフ確率場に限定していますが,変分ベイズ法などの別の領域にも容易に適用できます.また,議論を簡単にするため実際の論文では確率変数の

    yag_ays
    yag_ays 2013/12/31
  • クリスマス・イブに女子大生3人でハッカソンしたよ(・ω<) - ぴよぴよ.py

    クリスマス・イブ前日 @cocodrips :「暇だから明日はっかそんしよう」 @a_yagitter @mogumogu_panT 「やろうやろう!」 (10人くらいかけたけど2人しか釣れなかった) Xmas Contestに参加した Xmas Contest 参加したといっても、16時半くらいからみんなでA問題をわいわい解いてただけ。 1回もSubmitしてないので参加したとは言えないかな。 プロコン初挑戦の子もいたので、 グラフ問題の解き方をみんなでお勉強したりしました。 1問も解いてないし、物足りない なんかみんなしようよ!ってことで、 Twitterクライアントを作りながら、Python入門することにしました。 pipのインストールから、Pythonでのクラスの作り方を講義して、 tweepyを使ってコマンドラインからツイートできるものを作りました。 参考URL: API Ref

    クリスマス・イブに女子大生3人でハッカソンしたよ(・ω<) - ぴよぴよ.py
    yag_ays
    yag_ays 2013/12/31
  • cakes(ケイクス)

    cakesは2022年8月31日に終了いたしました。 10年間の長きにわたり、ご愛読ありがとうございました。 2022年9月1日

    cakes(ケイクス)
    yag_ays
    yag_ays 2013/12/31
  • cakes(ケイクス)

    cakesは2022年8月31日に終了いたしました。 10年間の長きにわたり、ご愛読ありがとうございました。 2022年9月1日

    cakes(ケイクス)
    yag_ays
    yag_ays 2013/12/31
  • cakes(ケイクス)

    cakesは2022年8月31日に終了いたしました。 10年間の長きにわたり、ご愛読ありがとうございました。 2022年9月1日

    cakes(ケイクス)
    yag_ays
    yag_ays 2013/12/31
  • 時雨堂コトハジメ

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    時雨堂コトハジメ
    yag_ays
    yag_ays 2013/12/31
  • YAMAGUCHI::weblogの2013年を振り返る - YAMAGUCHI::weblog

    はじめに こんにちは、Go界のティム・バートンです。今年もついにあと1日となりましたが、みなさんいかがお過ごしでしょうか。ところで私事ですが日誕生日を迎えました。 Amazon.co.jp: : とんぷーリスト 関連エントリ 今年で1年の振り返りエントリも7年目になるようです。年を取るわけですね。 YAMAGUCHI::weblogの2007年を振り返る - YAMAGUCHI::weblog YAMAGUCHI::weblogの2008年を振り返る - YAMAGUCHI::weblog YAMAGUCHI::weblogの2009年を振り返る - YAMAGUCHI::weblog YAMAGUCHI::weblogの2010年を振り返る - YAMAGUCHI::weblog YAMAGUCHI::weblogの2011年を振り返る - YAMAGUCHI::weblog YAMA

    YAMAGUCHI::weblogの2013年を振り返る - YAMAGUCHI::weblog
    yag_ays
    yag_ays 2013/12/31
  • The Top 25 Most Popular Offices of 2013 | Office Snapshots

    It seems like the 2012 most popular list was written only yesterday, but 2013 has already come and gone. This year has been another excellent year at Office Snapshots for a number of reasons. Let’s take a look back at what has happened: Featured 337 Offices Added the Designer Index Added Square Footage & Completion Year to the Browse Area Added a Products Section Added Office Collections – allows

    The Top 25 Most Popular Offices of 2013 | Office Snapshots
    yag_ays
    yag_ays 2013/12/31
  • DTと契約の闇と労働者派遣事業の適正な運営の確保及び派遣労働者の保護等に関する法律 - DT日記

    なんか時空がすごく歪んで申しわけないんですけど闇 Advent Calendar 2013です。 闇っぽいこと二週間以上いろいろ考へてたら全然まとまらなくって長文を何度も書いたり消したりしてたら生活に支障をきたしてる感じがしたので、気分転換に架空の契約書と注文でも書いてみたら結構楽しかったのです ヾ(〃><)ノ゙☆ 契約書は著作物?|著作権 侵害・違反を考えるで紹介された判例によれば、土地売買契約書の記載内容は、思想又は感情を創作的に表現したものであるとはいえないから、著作物ということはできないらしいですよ。へー。 僕は善良な市民だから、いたいけな若者を相手にこんな阿漕な契約を結ぶ会社が実際に居るのかよく知らないんですけど、みなさんは真似しちゃだめですよ ヾ(#><)ノ゙ 最後に労働者派遣事業の適正な運営の確保及び派遣労働者の保護等に関する法律を貼っておきますね。 第二章 労働者派遣事業の

    DTと契約の闇と労働者派遣事業の適正な運営の確保及び派遣労働者の保護等に関する法律 - DT日記
    yag_ays
    yag_ays 2013/12/31
  • tigで見ているコミットをgithubで開く - Qiita

    bind main G !@hub browse -- commit/%(commit) bind diff G !@hub browse -- commit/%(commit) 上を~/.tigrcに書いておけば,tig起動中にGを押したとき,選択されているコミットに対応したgithubのコミットページをブラウザで開いてくれる.hubコマンドについてはGitHubユーザーのためのhubコマンド - Qiitaの記事をどうぞ. デフォルトではGはgit gcに割り当てられていて意味がわからない(たまに間違えて押してしまう)ので潰しておく. !@hubの@は出力を捨てる(つまりtigの再描画を避ける)意味がある. 参考 tig/tigrc.5.txt at master · jonas/tig

    tigで見ているコミットをgithubで開く - Qiita
    yag_ays
    yag_ays 2013/12/31
  • フグを噛み、その毒を麻薬のように利用するイルカが撮影される - アクアカタリスト

    野生生物のドキュメント映画監督John Downerによる撮影チームは、特殊なスパイ撮影を行い世界ではじめてこの行動をカメラに収めることに成功した。映像はBBCのイルカドキュメンタリーの一部だ。 非常に知的で優しい海洋を泳ぐ哺乳類として知られている“イルカ”。そのイルカが有毒のフグに噛みつき、その毒によって麻薬のような効果を得ている光景が特殊なカメラによって撮影された。   「イルカたちは非常に優しくかつ繊細にフグに噛みつき、その毒による効果を得ていた。」 動物学者でありこのドキュメンタリー番組のプロデューサーであるRob Pilleyは、その撮影された映像について語る。 「彼らは一匹のフグを殺さないよう慎重にかつ意図的に噛みつき、それを20〜30分の間数匹のイルカで交互に渡しながら遊んでいるようにみえた。」 勿論、イルカであってもフグの毒を過剰に摂取してしまえば死んでしまう。しかし、微量

    フグを噛み、その毒を麻薬のように利用するイルカが撮影される - アクアカタリスト
    yag_ays
    yag_ays 2013/12/31
  • 自分が入れたEmacs便利拡張・設定集 (2013年版) - $shibayu36->blog;

    年末emacs設定大掃除をして、これは捨てられないと思った設定書いてく - $shibayu36->blog; 昨年に引き続き、2013年の自分のemacs.dを振り返るのをやろうと思います。 今年はemacsでいろいろできるようにする、という方向よりも、emacsでの基操作をどれだけ使いやすく出来るかということを中心にやって来ました。例えば .emacs.dの管理をどうするか コードリーディングや編集を速くするにはどうするか gitとの連携をどうやって簡単にするか この辺りについて1つずつまとめて行きたいと思います。 .emacs.dを管理する .emacs.dの管理って難しいですよね。僕も関西Emacsに参加してから自分が最新のやり方についていけてないなと感じたので、今年はいろいろと見なおしてみました。 基的なやり方としてはこんなかんじです。 外部elispはpackage.elと

    自分が入れたEmacs便利拡張・設定集 (2013年版) - $shibayu36->blog;
    yag_ays
    yag_ays 2013/12/31
  • 人工知能学会誌の表紙からメッセージを(勝手に)読み取る - ただのにっき(2013-12-30)

    人工知能学会誌の表紙からメッセージを(勝手に)読み取る 例の人工知能学会誌の表紙、炎上した結果毎日毎日いろんなメディア経由で繰り返し見せられたおかげで、すっかり好きになってしまったよ。見れば見るほどさまざまな角度で深読みができて、じつに面白い。公式アナウンスによれば「掃除機が人工知能になっていることを表しています」ということなので、人工知能をネタにした抽象的なイラストということになるのだろうけど、まがりなりにも科学者たちが選んだイラストだ、単なる荒唐無稽なファンタジーではなく、(意識的か無意識かにかかわらず)ある程度の蓋然性があるものが選ばれてるに違いない。 そういう視点でこのイラストを見てみると。 まず主題は、人間そっくりなヒューマノイド・ロボットである。現在のロボット技術が進歩して人間と見紛うロボットが家庭に入るようになるのは、早くて10年、遅くとも50年くらいかかるだろう。それく

    yag_ays
    yag_ays 2013/12/31