R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜Yasuyuki Sugai
![データマイニングとビジュアライゼーション](https://cdn-ak-scissors.b.st-hatena.com/image/square/2a030857303f78af85778180dd30d99b937c2207/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Ftokyowebmining22-120923012943-phpapp01-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜Yasuyuki Sugai
codicは、プログラマーのためのネーミング辞書です。新しいcodicでは、翻訳エンジンを搭載しネーミングをジェネレートできるようになりました。
「アイディアはあるんだけど、モックすら作れないIT起業家」「“UIだけなら自分で作れる” とやってみたけど、見にくいページにしかならない、どうしよう、、、」。高度なテクニックは不要、でも、やっぱりデザイナーさんに依頼しないといけないシーンが多いこの業界。 しかし、「Twitter Bootstrap」(以下 bootstrap)の登場により、多くの人がデザイン性の高いページデザインを短期間で作れるようになり世界は変わった。bootstrapは、プログラマーやディレクターなどが、最低限のコードの組み合わせでスッキリと解りやすいユーザーインターフェイス(UI)を構築できるライブラリ(支援プログラム群)のこと。 Bootstrapの登場で、スタートアップはスピーディにページを作りあげ、プログラマーは必要なページを “とりあえず” 作っておくくらいのことをするのが手軽になった。ただ、bootstr
多数のTCP接続をハンドリングするサーバを書くなら、1コネクション1スレッドのモデルではなく、epollやkqueueのようなイベント駆動型のI/O多重化を行うべきだ、と言われます。だが、そのような主張は、「C10K問題」が書かれた2002年から7年経過した今でも有効なのでしょうか? echoサーバを書いて、ベンチマークを取ってみることにしました。 ふたつのグラフは、いずれも接続数とスループットの関係を表しています。最初のグラフは、全接続がアクティブに通信した場合、あとのグラフは、全接続のうち小数のコネクションが順次アクティブになっていく、というモデルです。これらのグラフから、以下ようなことが読み取れます。 epoll も per-thread モデルも、良くスケールする epoll は、ワークセットが小さい場合に (最大50%) per-thread モデルよりも高速 少なくとも、1コネ
私事で恐縮なのだが、先日、父と電話をしたところ、父の携帯待受画像が、ぼくの息子から今年の3月に生まれた弟の子供に替わっていることが判明した。 7年の長きにわたって父と母の携帯待受画像に君臨してきたぼくの息子も、ニューカマーの若さには勝てず、2012年生まれの弟の子供へとその座を譲り渡し、新時代の幕開けとなった。 孫の新旧交代劇である。
文字列の長さを得る expr は引数にコロンがあると、その右側と左側の文字列を比較して、先頭から何文字までが等しいかという値を返却する。そのため、以下のようにすると文字列の長さが得られる。 expr "string" : '.*' 文字列中に特定の文字列が存在するかを調べる if echo "$STRING" | grep "$SUBSTRING" > /dev/null then echo "Found it" fi 文字列の余計なホワイトスペースの削除 echo コマンドはタブや連続したホワイトスペースを1つのホワイトスペースに変換し、先頭や末尾にあるホワイトスペースを取り除く。以下のようにすると、余計なホワイトスペースが除去できる。 STRING=`echo $STRING` 文字列から一部を取り出す。 文字列の5番目から7番目を切り出す # echo "abc:def:ghi" |
エンジニア、特にウェブ系のお仕事をしていると、いかに windows や mac が好きでも linux や BSD(mac も今や BSD ですが、、)で作業する時間が圧倒的に長くなりますよね。しかも大抵の場合 X もない CUI な環境で延々何時間も作業するわけです。 で、僕だけかもなのですが、その時間のほとんどは「テキスト処理」にあてられるわけです。TSV ファイルを特定の項目で並べ替えたり、ログファイルから何かの項目を抜き出して(UA とか)、それを種類ごとにカウントしてソートして出したり。 そんな訳で UNIX環境で perl や sed、awk 等の文字列処理が得意なスクリプト言語を良く使うようになりますよね。ちょっとしたものであれば perl で短いスクリプトを書いてしまえばOKなのですが、あらかじめ入っているコマンドを使うだけでも相当の事ができるなあと最近思ったのでメモです
システム開発において、ソースコードの品質を担保するためにはソースコードレビューが不可欠です。ソースコードレビューには主に、以下の三つの役割があります。 コーディング規約順守のチェック バグ埋め込みのチェック 性能劣化のチェック これらのチェックは、実装(コーディング)工程で行うべきものです。コーディング規約の違反箇所は、実装工程の後では修正される機会は少なくなります。また性能問題を放っておくと、システムテストなどかなり後の工程で明るみ出て、リリースまでに残された少ない時間の中で対応を余儀なくされるといった事態になりかねません。 このように、ソースコードレビューには、その後の工程で補うことができない大きなメリットがあります。繰り返しますが、ソースコードレビューは必ず行うべきです。しかし実際の開発現場では、以下のような制約により、十分にソースコードレビューを行えないことがあります。 必要なスキ
(記事が長すぎたので前編・中編・後編に分けました) 僕ももう、リストラされそうなとあるおっさんなんですが、先日Webサービスを公開しました。 きっかけになったのはこの記事です。 自分でWEBサービスを作りたいと思っている人へ http://anond.hatelabo.jp/20101203150748 こんな事できたら良いなぁと思っていると、他にもやっている方たちがいました。 たった2日で製作されたWebサービス「お部屋晒し」って? http://matome.naver.jp/odai/2131952812556433001 WEBサイトを発注してみた。 http://anond.hatelabo.jp/20120318122617 Rails3 と jQuery で、真面目にオシャレなエロサイトをつくってみました - h300 http://d.hatena.ne.jp/inouet
このドメインは お名前.com から取得されました。 お名前.com は GMOインターネット(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 ※1 日本のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 ※1 レジストラ「GMO Internet, Inc. d/b/a Onamae.com」のシェア値を集計。 ※1 2020年8月時点の調査。
最近、会社でリーダブルコードを輪読したり、Fukuoka.rb で Eloquent Ruby を読んだりしていて、メソッドや変数名の長さやコメントについての議論を読む機会があった。 昨日、たまたま 37signals のブログを読んでいたら、Rails の作者である David Heinemeier Hansson もこのトピックについて書いていた。 自分は WEB+DB PRESS で ukstudio さんの書いた RSpec についての記事を読んで感化されて以来、ソースコード中のコメントはすべて悪で、はっきりしたメソッド名、変数名を使えばコメントはいらないという考え方を持っている。DHH もそのような考え方のようだ。 要点をかいつまむ。 多くのプログラマーは短い変数名やメソッド名を好む。短い命名は明確性や簡潔性を犠牲にしているとみんな気づいてるんじゃないかと疑ってるんだけど、実際の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く