タグ

Programmingとcodeに関するmoqadaのブックマーク (6)

  • Pythonのコードをきれいに書くためのTips — TRIVIAL TECHNOLOGIES 2.0

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー Pythonのようなスクリプト言語の特徴の一つとして,データをソースコードに直接埋め込みやすい,というものがあると思います。実際,Pythonのコードを見ると文字列,リストや辞書といった高機能で使い回しのしやすいデータ型が,リテラルとしてソースコードに埋め込んであるのをよく目にします。時には変数に代入されたり,時には関数やメソッドの引数部分に埋め込まれたり。 いちいち離れた場所にあるデータを見に行ったり,オブジェクトを作るための宣言をする必要がなく,処理をしたい場所の間近にデータを埋め込めるので,とても便利なのですが,欠点もあります。無造作にデータ型のリテラルを埋め込んでいると,ソース

    moqada
    moqada 2008/10/26
    ("..." "...") 括弧のあとに複数の文字列をコンマ無しでつなげると長い文字列をインデントを維持しつつ記述できる。
  • 単語の頻度マトリックスを作成

    流れとしては、全単語セットからある頻度以上の単語リストを作成(これが行のセット)し、それぞれのURL毎に何個含まれているかを調べてマトリックスにする。この時、あまりにもマイナーな単語とか、逆にあまりにもよく出る単語は類似性をはかるときに情報量ゼロにしかならないので除く。 今回1100件のフィードからなる(かなり多様性の高い)セットだったので、minの頻度はかなり低く設定した。 #!/usr/bin/env python # -*- coding: utf-8 -*- import cPickle,sys def get_tagset(tag_data,min=0.1,max=0.7): all_tags = [] tag_counts = {} size = float(len(tag_data)) for tags in tag_data.values(): for tag in tag

    単語の頻度マトリックスを作成
  • LDRの購読RSSから単語セットを抽出して永続化

    LDRで購読しているフィードから単語セットを抽出して遊びたい。 データセットは一度取っておけばいいので、永続化をしておく。入力はLDRから吐き出したOPMLファイル(export.xml) #!/usr/bin/env python # -*- coding: utf-8 -*- import sys,re,feedparser,shelve,MeCab,sgmllib from xml.dom.minidom import parse, parseString opmlfile = "/Users/kzfm/export.xml" def getwordcounts(i,url): print "#%d feedparser parse: %s" % (i,url) try: d = feedparser.parse(url) except UnicodeDecodeError,e: p

    LDRの購読RSSから単語セットを抽出して永続化
    moqada
    moqada 2008/07/15
    LDRのopmlから情報を抜き取る
  • Pythonでのクロージャについて(追記あり) - NAL-6295の舌先三寸

    Pythonでリファレンスを見ながら初めてコーディングしたためクロージャの実装で悩んだ。 最初、C#とかと同じ乗りで def nabeatsu(): value = 1 def reader(): isAho = value % 3 == 0 or str(value).find('3') >= 0 isDog = value % 5 == 0 if isAho: print 'あほ' if isDog: print 'わん!' if not isAho and not isDog: print value value = value + 1 #5/10まで間違ったサンプルになっていたのを修正(5/11) return reader runner = nabeatsu() for value in xrange(1,40,1): runner() としたら、runner()を実行したときに

    Pythonでのクロージャについて(追記あり) - NAL-6295の舌先三寸
  • Site Under Maintenance

    We'll be back soon! Our site is currently undergoing maintenance. Please check back later.

    Site Under Maintenance
    moqada
    moqada 2008/03/03
    サンプルコード検索の5サイト
  • codeなにがし

    世界最高峰のブックメーカーでベットしましょう。オンラインベッティングでお気に入りのスポーツをお楽しみください。

    moqada
    moqada 2007/08/02
    コード、ソースコードノウハウ共有。書き方質問・相談。
  • 1