タグ

ブックマーク / coreblog.org (5)

  • 入門 自然言語処理を禁書にすべき10の理由 | TRIVIAL TECHNOLOGIES on CLOUD

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。 タイトルは釣りじゃない。その理由を10個挙げる。 自然言語処理のかなり基的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎる ボリュームがあるのに書き方が平易でついつい読みふけってしまう 演習問題があり,自分の理解度を確かめられたりするのもケシカラン 原著は欧米語のための言語処理について書かれた書籍なのに,日語の形態素解析などについても解説してあって我慢できない 必要ライブラリのインストールなど環境構築に時間が取られそうでヤバい 書籍の応用でBotとか人工無能とか作ったらどうかな−,と

    mactkg
    mactkg 2011/05/05
    これはwww[programming][python]
  • コメント付きのテトリスやオセロのソースコードでプログラミングを学ぼう | TRIVIAL TECHNOLOGIES 4 @ats のイクメン日記

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー プログラムを学ぶための手法はいろいろあるけど,実働するゲームやアニメーションのコードを読みながら学ぶ,という手法は,結果が目に見えるし,遊んでいて楽しいのでモチベーションが維持しやすく,スキルアップへの近道と言えると思う。そんな目的にぴったりの素材を見つけたのでご紹介。 Code Commentsというのは文字通りコメントがたくさん着いたコードを公開しようという試み。オセロやテトリス,といったなじみのあるゲームのソースコードが公開されている。ソースコードにはコメントが付いているので,どこでどんな処理をしているのかがよく分かるようになっている。パラメータを変えたりアルゴリズムを変えたりし

    mactkg
    mactkg 2011/01/10
    サンプルコードや人の作品のソースを読んだり改造したりすることで言語を理解したりライブラリを理解することはよくあるし、理解しやすいので、このとりくみはすごく支持したいと思う
  • Pythonコードの高速化ソリューションと言えばPyPyだよね〜 | TRIVIAL TECHNOLOGIES on CLOUD

    PyPyはRPythonという文法的にちょっとした制約があるPythonを使う必要がある(大抵のコードはそのまま動くらしいけど)。そういう制限があったとしても,ほぼPurePythonなコードをPyPyで動かすだけでここまで高速化できるというのは驚きだ。 今年の夏に行ったEuroPython 2010でPyPyのセッションで,ちょうどJITの作者Antonio Cuniさんが話してた。トークが終わった後「PyPyのJITはなんで速いの?」との質問に答えてAntonioさん曰く「オブジェクトが持っているデータをメモリ上の固定位置に配置してるのが効いているみたい」と言っていた。この質問をしたのは実はセッションを聞きに来てたGuidoで,彼自身もPyPyにとっても興味があるみたい。 動的型付け言語の高速化手法はいろいろあるけど,PyPyのアプローチは副作用も少ないし,straightforwar

    mactkg
    mactkg 2011/01/06
    名前も変態的だしね〜 っつーか早いなこれ…
  • Python-twitterが欧米仕様だったので日本仕様に直したでござるの巻 — TRIVIAL TECHNOLOGIES 2.0

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 半裸Botを作ったとき,PythonTwitterAPIをほげほげするのにPython-twitterを使ったんだけど。ちょっと長いTweetをPostしようとすると,「140文字以上あるよ!」という例外が発生してしまう。実際Tweetは60文字くらいしかないんだけど,おかしい。 なんでだろうと思ってソースを見てみたら原因が判明。ユニコードの8ビット文字列を,バイト列として見ている。これだと日語のマルチバイト文字列が3倍の文字数と判別されてしまう。ASCII圏のことしか考えないのは欧米製のライブラリにはよくあることで,ひょっとしたらとは思ってたけど。 ソースコードをちょっと書き換え

  • Pythonの定番モジュール集 — TRIVIAL TECHNOLOGIES 2.0

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー wiki.python.orgにはUsefulModules(Pythonの定番モジュール集)というリストがある。「開発者に有益な情報を提供するため」と注意書きがあるだけあって,これがなかなか網羅的で便利なので,翻訳しながらご紹介しましょう:-)。 リストを見ると,Web開発やテキスト処理はもちろん,数値解析,ビジュアライズ,ゲームGUIライブラリなどバリエーション豊かで,Pythonの全方位ぶりがよく見えてくる。他のカテゴリページへのポインタは,適宜リストをインラインに展開してあるものもあります。べたっと訳しちゃったので,間違いなどあるかも。コメントなどでご指摘いただけるとありがた

    mactkg
    mactkg 2010/05/13
    わーお いろいろできるね
  • 1