タグ

ブックマーク / orangain.hatenablog.com (2)

  • PythonでブログのHTMLから本文抽出 2015 - orangain flavor

    2015-12-20 19:14追記: readabilityの説明を追加・修正しました。 Webページをクロールした時に、ざっくりと文 (ページ内の重要なコンテンツ) のみを抽出できると便利です。 Google検索すると、特に日語だとExtractContent以外の情報があまり見つかりません。 ExtractContentは昔使ったことがあり、たしかに便利なのですが、公開が2007年と若干古いので今でも使えるのかという疑問がありました。また、Pythonで他の選択肢として使えるライブラリは、非日語圏の方が作ったものと思われるので、日語のページで問題なく使えるのか知りたかったので調べてみました。 比較するライブラリ 比較したのは以下の5つのライブラリです。 dragnet eatiht extractcontent goose readability パッケージ名 dragnet

    PythonでブログのHTMLから本文抽出 2015 - orangain flavor
  • 将棋の定跡を勉強するためのアプリ「Kifu Notebook」を作った - orangain flavor

    最近3月のライオンを見て、子供の頃以来の将棋を始めるなどした。 最近は将棋も改めて勉強してる。直接のきっかけは3月のライオンを見たことだけど、大人になってからボードゲームをやると子供の頃とは違うように見えることに気づいたというのもある— かと (@orangain) 2017年3月7日 適当なアプリをダウンロードしてコンピューターと対戦すると、ちょっと悪い手を指すだけで付け込まれて負けてしまう。序盤の定跡というものの理解が足りていない。相手の指す手に合わせて最適な手を指し続けなければならないので、1つの戦法だけ知っていても意味がない。 図書館将棋を借りてきたり、勉強のためのアプリを購入するなどしてみた。解説されている個別の戦法は理解できるものの、考えられるすべての指し手(ここでは指し手空間*1と呼ぶことにする)における、その戦法の位置づけが把握できない。もちろん指し手空間は膨大なのだ

    将棋の定跡を勉強するためのアプリ「Kifu Notebook」を作った - orangain flavor
    yahihi
    yahihi 2018/03/21
  • 1