タグ

ブックマーク / blog.livedoor.jp/sasata299 (10)

  • AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち - (゚∀゚)o彡 sasata299's blog

    2015年12月23日23:17 AWS JavaScript AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち この記事は 今年もやるよ!AWS Lambda縛り Advent Calendar 2015 の23日目です。 「何か書くぞ!」と思いエントリーしてみたもののどうしよう、、と思っていたのですが、そういえば個人的に Apache Tika というのが最近気になっていたので使ってみることに。 Apache Tika これは、PDFやエクセル等のファイルから、テキストデータやメタデータを抽出してくれるという便利ライブラリです。これを使って、ファイルが登録されたら裏でテキストデータを抽出して、それを全文検索で引っかかるようにする…みたいなことが出来ると楽しそうです。 Apache Tika自体はJavaのライブラリなのですが、Node.jsから扱うためのライブラ

    AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち - (゚∀゚)o彡 sasata299's blog
    Hash
    Hash 2015/12/26
    こら大変.. こーゆー話…だろうか? https://aws.amazon.com/blogs/compute/nodejs-packages-in-lambda/
  • 今さらだけどMySQLのパーティショニング機能を試してみた - (゚∀゚)o彡 sasata299's blog

    2013年03月21日18:11 MySQL 今さらだけどMySQLのパーティショニング機能を試してみた 最近は花粉が飛んでて辛い季節ですがみなさまいかがお過ごしでしょうか。でももうちょっと我慢すればサクラの季節ですよ〜。花見良いですよね、飲みたいだけですが。 ・・さて、今回はちょっと必要になったので、MySQLのパーティショニング機能なるものを試してみました。存在は知ってたけど、実際に試してみたことは無かった…。 パーティショニングとは? これはどういうものかと言うと、MySQL5.1から使えるようになった機能で、ひとつのテーブルのデータを条件によって複数の領域(パーティション)に振り分けて管理することができる、というものです。例えば日別にデータを別々のパーティションに振り分けたり。 パーティショニングするとデータの削除が高速だったり(通常は削除ってものすっごい遅いけど、特定のパーティシ

    Hash
    Hash 2013/10/17
  • 相互添削型SNSのLang-8にJoinします - (゚∀゚)o彡 sasata299's blog

    2013年02月19日11:11 その他 相互添削型SNSのLang-8にJoinします こんにちわ。さて、以前の記事でクックパッド退職することは発表しましたが、次に何をするのかは言っていませんでした。そろそろ発表したいと思います。次は、 相互添削型SNSのLang-8 にJoinします!! Lang-8ってどんなサイトなの? 相互添削型SNSで、、といってもよくわからないと思うので具体的に説明します。 例えば僕たちが英語を書くと、英語がネイティブな人(例えばアメリカの人)がそれを添削してくれます。その代わりに、アメリカ中国の人が書いた日語を日語がネイティブな僕たち日人が添削してあげるという相互添削型のSNSです。添削を通じてまったく見ず知らずの海外の人と友達になることも日常的にあったりして感動します。 語学の学習に関してはもちろん座学は重要ですが、アウトプットしてフィードバック

    Hash
    Hash 2013/02/19
    思わず職場で驚きの声上げてしもた. 応援してます. やんやんよかったね!!
  • クックパッド株式会社を卒業します - (゚∀゚)o彡 sasata299's blog

    2013年01月31日18:37 その他 クックパッド株式会社を卒業します 私事ですが、このたびクックパッド株式会社を退職することになりました。 有給消化の関係でまだしばらく所属はしていますが、日1/31が最終出社日です。2009年の8月に入社したので、約3年半お世話になったことになります。ついこの間JOINした気がするのに早いものですね。 短い間でしたが、クックパッドの素晴らしい環境と素晴らしい仲間に恵まれて当に幸運でした。美味しいご飯もべられるし。僕の人生の中で、クックパッドJOINすることに決めたのはかなり上位にい込む素晴らしい決断だったと思います! やってきたこと せっかくなので振り返ってみます。クックパッドでは以下のようなことをやってきました。 ・HadoopやEMRを利用した大規模データ分析クックパッドという巨大なサイトへの機能追加、改善 ・新規事業へのチャレンジ

    Hash
    Hash 2013/01/31
    おつかれさまでした. 次回作は一体...
  • グラフ描くならMorris.jsがお手軽で良いかも - (゚∀゚)o彡 sasata299's blog

    2012年11月16日13:55 JavaScript Ruby グラフ描くならMorris.jsがお手軽で良いかも こんにちわ。寒くなってきましたがみなさまお元気ですか? さて、先日ちょっとしたグラフを描画したかったんですよ。それでなにか使いやすいライブラリ無いかなーと思っていたら railscast (revisedなので有料です) で Morris.js ってjQueryプラグインが紹介されてて良さげだったので使ってみました。google analytics みたいなツールチップも出してくれます。 使い方はとっても簡単です。 まず、jQuery (>=1.7) と Raphael (>=2.0) が必要です。あとは Morris.js があれば動作します。 これらを app/assets/javascripts/application.js に設定してください。この記事執筆時点での

  • CucumberとWebratの組み合わせが素晴らしすぎる - (゚∀゚)o彡 sasata299's blog

    2009年07月05日13:34 Ruby CucumberとWebratの組み合わせが素晴らしすぎる UK STUDIO - Cucumberの登場でRailsのテスティング環境が変わった Cucumberがアツい - moroの日記 Webratがスゴい(続:Cucumberがアツい) - moroの日記 Cucumber にふれてみた - yuum3のお仕事日記 この辺りの記事を読んで、「Cucumber」って何か凄そうだなぁ、使ってみるか!と思ったささたつです。こんにちわ。今日も暑いですね。。。(*´Д`) Cucumber にふれてみた - yuum3のお仕事日記 Cucumber自体は日語などの自然言語でテストシナリオを書けるフレームワーク的なもので、実際のテスト機能は含まれていません。ここでは実際のテストはWebratというWebアプリの受入テスト用ソフトでおこないます。

  • RSpec + Autotest::screen = 最高の開発環境 - (゚∀゚)o彡 sasata299's blog

    2008年10月20日02:41 Ruby Linux RSpec + Autotest::screen = 最高の開発環境 【追記090704】 RSpecでテストコードを書いたまとめ - (゚∀゚)o彡 sasata299's blog も併せてご覧ください。 開発はテストファーストでやりたいなぁ。(´∀`*) そう思ってちょっとRubyのテストについて調べていたら、TDD(テスト駆動開発)に対して、BDD(ビヘイビア駆動開発)というものを発見しました。 で、rubyの話になりますが、rubyにはRSpecというBDD用のフレームワークがあります。RSpecだけでも結構便利です。ただ、そこはやっぱりいちいちテストを走らせたりするのが面倒なわけなんですよ。。。 そこで、autotestの出番です!!これは、ファイルに変更があったら、それに対応するテストコードを自動で走らせてくれる、という

    Hash
    Hash 2011/07/28
    ちょっと機能作るのでRSpecに再挑戦
  • Rubyでメタプログラミング 〜暗黙的に呼ばれるto_procメソッド - (゚∀゚)o彡 sasata299's blog

    2011年01月08日23:09 Ruby Rubyでメタプログラミング 〜暗黙的に呼ばれるto_procメソッド 先日、こんな感じの処理に遭遇しました。はて、、何じゃこりゃ・・(´・ω・`) ポカーン (1..5).each(&method(:puts)) と思って調べたのでまとめておきます。この処理が理解できれば一人前です。きっと。 ブロックはオブジェクトではない Ruby では大抵のものがオブジェクトですが、オブジェクトではないものも一部あります。ブロックがその一つです。 例えばこんな風にブロックを定義することは出来ません。 block = { "test" } # in:1: odd number list for Hash そもそも Ruby の構文ではハッシュとして扱われるためブロックを直接生成することは出来ません。Block.new みたいな構文も無いので、ブロックは ti

    Hash
    Hash 2011/06/29
    ブロックはobjectじゃないから、object化するために内部的にSymbol#to_procを呼んでるのが&演算子か。
  • 10分で理解するMongoDBのパフォーマンス - (゚∀゚)o彡 sasata299's blog

    2010年04月25日00:16 NoSQL MySQL 10分で理解するMongoDBのパフォーマンス MongoDBってスキーマレスなDBで、カラムが決められないような場合に使うと効果的なんだと思うんですが、「そういうデータはハッシュにして、JSON 形式で MySQL に保存すれば良いのでは?」という意見をいただいたので、その場合とのバフォーマンス比較をしてみました。 ※最初は MySQL として innodb でしか評価していなかったため、myisam の結果についても追記しました。(2010/04/25追記) ベンチマーク環境の準備 試した環境としては、MySQL 5.1.45, MongoDB 1.2.4 です。MySQL側はこんな感じ。 mysql> desc blogs; +------------+--------------+------+-----+---------

    Hash
    Hash 2011/06/08
    ささたつさん流石や. からあげだけの男とちゃう
  • git - (゚∀゚)o彡 sasata299's blog

    2012年05月28日14:11 Git gitで特定のファイルの特定のリビジョンの内容が見たい それ git show [リビジョンのハッシュ値]:[ファイルパス] で出来るよ! git show 3jqs3oqw9e2uq33ojda:path/to/file.rb 忘れないようにメモ。コロンが忘れがち! タグ :git sasata299 コメント( 0 )トラックバック( 0 ) 2010年12月26日11:03 Git まだ使っていない人にこれだけは伝えたいgitの便利機能 ということで、今更ですけど git は便利ですね〜。もう subversion には戻れません。気が向いたので、個人的に気に入っていることをちょっと書いてみます。 1) 直前のコミットに対して、コミットし忘れたものを追加できる よくありがちなパターンですね。一通りコミットしたあとに「あっ!○○をコミットし忘れ

    Hash
    Hash 2009/06/06
    gitは、ローカル -(add)-> index更新 -(commit)-> ローカルリポジトリ -(push)-> リモートリポジトリ。いくつかオプションも。
  • 1