タグ

Rubyに関するYarmUIのブックマーク (16)

  • るりまWiki

    2008-08-12 14:29:59 +0900 (47d); rev 58 Ruby リファレンスマニュアル刷新計画メンバー用の Wiki です。 メンバーは自由に更新してください。 Ruby リファレンスマニュアルを「るりま」と省略することがあります。 リリース ReleasedProducts ダウンロードはこちらからどうぞ。 http://doc.okkez.net/ 最新のリファレンスをWebから見ることができます。一日一回更新。 プロジェクト全体に関して ProjectGoal プロジェクトの目標 ProjectTimeLine プロジェクトの予定と期限 HowToJoin プロジェクトに参加するには WorkingProcess 各種作業マニュアル http://redmine.ruby-lang.org/projects/rurema/issues Ruby リファレンス

    YarmUI
    YarmUI 2009/07/19
  • Ruby Scraping - Mechanize

    自動google検索。 require 'rubygems' require 'mechanize' agent = WWW::Mechanize.new # インスタンス生成 agent.user_agent_alias = 'Mac Safari' # User-Agentの設定 page = agent.get('http://www.google.com/') # ページ取得 search_form = page.forms.with.name('f').first # "f"という名前のフォームを探す search_form.q = 'Hello' # テキストボックス"q"に"Hello"を入力 search_results = agent.submit(search_form) # フォームのsubmitボタンを押す puts search_results.body # 結果

  • RubyのMechanizeを解説 for 1.0.0 - きたももんががきたん。

    い倒れキャンプ 千葉の館山へキャンプに行った。一緒に行った友だち2人が美家だったから、美味しいものを美味しくべられて最高だった。 集合は朝8時。行きの車でべたのは、炙りタラコのおにぎりと、柴漬けと梅の混ぜおにぎり。はじめ作。 パンを愛する友だちが買ってきてくれ…

    RubyのMechanizeを解説 for 1.0.0 - きたももんががきたん。
  • マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。

    そもそも、マルコフ連鎖とは何なのか?全く聞いたこともなかった。そして、文章を要約するのはとっても高度なことだと思っていて、自分のレベルではその方法を、今まで思い付きもしなかった。 しかし、以下のようなシンプルなRubyコードでそれが出来てしまうと知った時、目から鱗である...。一体、何がどうなっているのだ?コードを追いながら、マルコフ連鎖を利用するという発想の素晴らしさを知った! 作業環境 MacBook OSX 10.5.7 ruby 1.8.6 (2008-08-11 patchlevel 287) [universal-darwin9.0] mecab utf8環境でインストール済み マルコフ連鎖に出逢う rssを流し読みしていると、以下の日記に目が止まった。(素晴らしい情報に感謝です!) MeCabを使ってマルコフ連鎖 一体何が出来るコードなのか、日記を読んだだけではピンと来なかっ

    マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。
  • 3行でできる超お手軽全文検索 - mixi engineer blog

    梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。 使い方 テーブルデータベースについてまずおさらいしておきましょう。PerlRubyのハッシュのようにコラム名とその値を関連づけた構造を、主キーを識別子として保存するデータベースです。例えばRubyからデータを保存するに以下のように行います。データベースであることをほとんど意識させないというのが素敵ポイントです。APIはCでもPerlでもRubyでもほとんど同じなので、言語にかかわらず同じようにレコードを操作できます。 require 'tokyocabinet' include TokyoCabinet # データベースを開く tdb = TDB::new tdb.open("casket", TDB::OWRITER

    3行でできる超お手軽全文検索 - mixi engineer blog
    YarmUI
    YarmUI 2009/06/22
    わっふるわっふるわっふるわっふるわっふるわっふるわっふるわっふるわっふるわっふるわっふるわっふる
  • rubyで設定ファイルを書くとき - m-birdとFreeBSDの同棲日記

    いままではmoduleを使って setting.rb module Env HOGE_PATH = "./fuga/" end として、 main.rb path = Env::HOGE_PATH としていたけど、あまり使い勝手がよろしくない。 ので、id:viverに聞いてみた。 で、 こんな打開策。 設定を書くconfig.rbを、こんな感じに。 @hoge = "fuga" @you = "otaku" $config = Hash.new instance_variables.each {|name| $config[name[1..-1].to_sym] = instance_variable_get(name) } いじょ。 で、test.rb load 'config.rb',true p $config これを実行してみると、 $ ruby test.rb {:hoge=>

    rubyで設定ファイルを書くとき - m-birdとFreeBSDの同棲日記
    YarmUI
    YarmUI 2009/05/31
  • 神は細部に宿る - 書評 - まつもとゆきひろ コードの世界 : 404 Blog Not Found

    2009年05月25日23:00 カテゴリ書評/画評/品評Code 神は細部に宿る - 書評 - まつもとゆきひろ コードの世界 「勝間なのに、なんで献こないかな」と思ってたらMatzでした:)。というわけで購入。 まつもとゆきひろ コードの世界 まつもとゆきひろ イイ!イイよこれ! けど、すごくわかりづらいイイ!であるというのも確か。残念ながら勝間と違って、書はプログラムを書ける人でないと読むこともままならないので。 このをどれだけイイ!と思えるかで、プログラマーとしての発展段階を測れる、そんな一冊だ。blogのプログラム関連の記事を、飛ばさず読んでらっしゃる方であれば、絶対楽しめます。 書「まつもとゆきひろ コードの世界」は、まつもとゆきひろのではあるが、プログラミング言語Rubyではない。「レイヤー」で言うと、それより一段上のである。強いてRubyとして

    神は細部に宿る - 書評 - まつもとゆきひろ コードの世界 : 404 Blog Not Found
  • 全文検索システム Hyper Estraier

    概要 Hyper Estraierは全文検索システムです。たくさんの文書の中から、特定の語句を含むものを探して、該当するものの一覧を表示することができます。Webサイトを運営している方なら、自分のサイト専用の検索エンジンとして利用することができます。メールボックスやファイルサーバを対象とした検索ツールとして利用することもできます。 Hyper Estraierには、次のような特徴があります。 インデックスを使った高速な検索ができます。 大量の文書のインデックスを短時間で作成できます。 N-gram方式による漏れのない検索ができます。 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。 フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。 世界各国の言語が扱えます。 対象文書の所在や形式に依存しません。 賢いWebクローラが付属しています。 ライブラリとして各種

  • OpenGLの基礎

    OpenGLは,3次元グラフィクスプログラミングにつかわれる標準的なライブラリです. ライブラリとは,プログラムの部品セットであるといえます. ライブラリを利用することで,自分で0から書かなくても, ライブラリが提供する部品を組み合わせることでプログラムを作成することができます. ここでは,OpenGLの基礎を説明します. OpenGLの概要 Ruby/OpenGL OpenGLプログラムの基的な構造 イベント,コールバック,イベントループ 2次元図形の描画 図形プリミティブ 属性 2次元ビューの設定 ビューポート OpenGLの概要 OpenGLは,3次元グラフィクスプログラミングにつかわれる標準的なライブラリで,SGI(Silicon Graphics, Inc.)がGLという同社のコンピュータ専用のグラフィクスライブラリをもとに開発したものです. OpenGL以外でよく用いられる3

  • MySQL FULLTEXT Ngram : LIKE検索より数十倍高速な、お手軽 日本語全文検索 について|blog|たたみラボ

    tatamilab.jp

  • Ramazeさんは素晴しいと思います - ¬¬日常日記

    知名度こそまだ低いものの、Ramazeさんはとっても素晴しいウェブアプリケーションフレームワークです。特にRailsさんのような黒魔術がないところが素敵だと思います。Ramazeさんの魅力を知りたい方は以下の記事をご覧下さい。 Ramaze: Another Light Ruby Web Framework, But With MVC! Ruby Insideでも大絶賛! Ramaze: a Ruby framework that will amaze よく分かんないけどIBMの人も大絶賛中!!! Ramazeさんはとにかくシンプルで簡単。どのくらい簡単かと言うと、次のような例(http://ramaze.net/ から抜粋)くらいに簡単。 require 'rubygems' require 'ramaze' class MainController < Ramaze::Controll

    Ramazeさんは素晴しいと思います - ¬¬日常日記
  • RubyでHadoopをラップ、分散処理ツールキットが登場 - @IT

    2009/05/12 米新聞社大手のニューヨーク・タイムズは5月11日、Rubyによる大規模分散処理のツールキット「Map/Reduce Toolkit」(MRToolkit)をGPLv3の下にオープンソースで公開したと発表した。MRToolkitは、すでに稼働しているクラスタ上のHadoopと合わせて使うことでRubyで容易にMap/Reduce処理を記述することができる一種のラッパー。処理自体はHadoopが行う。すでにHadoopを使っているユーザーであれば、中小規模のプロジェクトに対して、すぐにMRToolkitを適用可能としている。 デフォルトで有用なMap、Reduceの処理モジュールが含まれていて、数行のRubyスクリプトを書くだけで、例えば膨大なApacheのログからIPアドレス別の閲覧履歴をまとめるといった処理が可能という。独自にMapやReduceの処理を定義することも

  • 統計的に正しいランキングを行う方法 - Hello, world! - s21g

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 ポジティブ/ネガティブ投票による正しいランキング方法が以下の記事で紹介されています。 How Not To Sort By Average Rating この計算方法では、投票数が少ない場合には分散が大きく不正確な評価で、 投票数が多くなるにつれて分散が小さく正確な評価が得られているという事を考慮しています。以下数式 これはScoreの信頼区間を表しています。 この信頼区間の下界をランキングのスコアにすれば良い事になります。 ここで、は、 です。全体に占めるポジティブ投票数の割合ですね。 は標準正規分布上の 信頼区間の有意確率です。 さて、五段階評価によるRatingに同様のテクニックを適用する場合はどうしたらいいでしょうか

  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

  • Ruby学習記 - CGIのリダイレクト

    2004-07-26 今日はCGIを使ったリダイレクトに挑戦。 掲示板にて(POSTメソッドを使って)記事を投稿した後に、 F5キーを押してページをリロードすると 同じ記事が二重投稿されることがある。 (PukiWikiも同じ仕様になっていた。そのため画面上に「リロード」というリンクをわざわざ用意しているんだろう) リロードによる二重投稿を防ぐためには、POSTされた後にいったん画面を表示し、すぐに別の画面に移動する方法がある。 (tDiaryやBitChannelはこの方法を使っているみたい) これに似た方法としては、POSTへの応答として Location: ヘッダと302ステータスを使うやり方がある。 試しにこのやり方を試してみた。 #!/usr/bin/env ruby require 'cgi' cgi = CGI.new base_url = "http://#{ENV['SE

    Ruby学習記 - CGIのリダイレクト
  • Support Vector Machines (SVM) in Ruby - igvita.com

    By Ilya Grigorik on January 07, 2008 Your Family Guy fan-site is riding a wave of viral referrals, the community has grown tenfold in last month alone! First, you've deployed an SVD recommendation system, then you've optimized the site content and layout with the help of decision trees, but of course, that wasn't enough, and you've also added a Bayes classifier to help you filter and rank the cont

  • 1