タグ

ブックマーク / chezou.hatenablog.com (14)

  • 非英語ネイティブにとってのOSSのメンテナンスコスト - once upon a time,

    disclaimer: この記事を書いている人はClouderaというHadoop/Sparkのディストリビューターの会社にいます。 codelunch.fmの20回目を聞いていろいろ思うところがあったのでつらつら買いてみます。 codelunch.fm この回のcodelunch.fmでは、前職の同僚である丸山さん(@h13i32maru)と@hokacchaさんが、お互いの家庭環境の変化を交えながら個人プロダクトの開発について話しているエピソードです。これ自体なかなかおもしろい回なので、趣味でプロダクト開発している人は聞いてみるといいんじゃないかなと思います。 丸山さんはJasperやESDocを精力的に開発していますし、hokacchaさんはnodebrewやadventarを作られています。彼らの話していた、個人で趣味プロダクトを開発するモチベーションは何かというところは、以下のよ

    非英語ネイティブにとってのOSSのメンテナンスコスト - once upon a time,
    shiumachi
    shiumachi 2017/01/02
    “開発者の時間は有限ですし、ユーザーが増える速度はコントリビュータが増える速度より速い”
  • #eigo と私〜あるいは子持ちの業務外活動の続け方 - once upon a time,

    こんにちは、温泉行きたいです。この記事は、pyspaアドベントカレンダー2016の21日目です。1日前は、渋川さんの保険の話でした。 Clouderaという外資系のHadoop/Sparkを中心としたプラットフォームを提供する会社に今年転職しました。そこで生きていく上で必要な #eigo の話を中心に2016年を振り返ります。 転職した 転職エントリーにも書きました。今ちょうど9ヶ月経ちましたが、まだ首にならずなんとか頑張ってやっています。 シンガポールでAPACのSales Enginnerでのミーティングに行ったら、いろんなアジアの国の英語とディスカッションをして揉まれました。 日のチームは成長中なので、グローバルに比べると相対的に人数も少なく、Doug CuttingやMLlibに詳しいSparkコミッターのSean OwenをはじめとするUSのエンジニアと話す時間が多くあるのがと

    #eigo と私〜あるいは子持ちの業務外活動の続け方 - once upon a time,
    shiumachi
    shiumachi 2016/12/21
    Ingressすごい “全然関係ないのですが、Clouderaに誘ってくれた @shiumachi さんとはIngressのコミュニティ運営で繋がったのですが、人生何が何につながるかわかりませんね”
  • Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた

    今日のre:InventでDeep Learningを使った音声合成サービスのAmazon Pollyが発表されました。 正直、DLを使ったの音声合成が話題になったのなんて今年に入ってからだと思っていたのに、もう商用化したんか!という気持ちでいっぱいです。 Amazon Polly – 文章から音声へ、47の声と24の言語 | Amazon Web Services ブログ Amazon Polly – Lifelike Text-to-Speech [2016/12/02追記] PollyがDLベースという話は https://aws.amazon.com/jp/polly/ に、"Polly is an Amazon AI service that uses advanced deep learning technologies to synthesize speech that so

    Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた
    shiumachi
    shiumachi 2016/12/02
    “本一冊で$2.4くらいという驚異的な安さ” サンプル音声聴くとその凄さがわかる
  • Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016 - once upon a time,

    さる11/8に、自社の主催するCloudera World Tokyo 2016で、機械学習プロダクトの作り方について話をしました。 図: Hadoopの生みの親 Doug(@cutting)と握力王新沼さん(@hiroki_niinuma)の対談イベントの様子 大規模データに対するデータサイエンスの進め方 #CWT2016 from Cloudera Japan www.slideshare.net データの民主化の話、データサイエンティストとデータエンジニアの役割分担とチーム構成、機械学習の業務フロー、Cloud Nativeなデータサイエンスといった盛りだくさんの話をしました*1。 話の中で特に言いたかったことは2つ、P.16のリスクを取ってくれる責任者を捕まえようという話と、P.29の機械学習込みのプロダクトは改善をし続けないと死ぬという話です。 あとは、できるだけ機械学習をしない

    Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016 - once upon a time,
    shiumachi
    shiumachi 2016/11/15
    “話の中で特に言いたかったことは2つ、P.16のリスクを取ってくれる責任者を捕まえようという話と、P.29の機械学習込みのプロダクトは改善をし続けないと死ぬという話”
  • 川崎Ruby会議 01を開催しました #kwsk01 - once upon a time,

    さる 8/20 に川崎Ruby会議01を開催しました。 regional.rubykaigi.org 川崎Ruby会議は、kawasaki.rbの主催する地域Ruby会議です。 ちゃんとしたまとめはるびまに出ると思うので、ここでは開催の経緯なんかを簡単に書こうと思います。 なお、発表内容が気になる方はタイムテーブルにあるスライドや動画へのリンクを見ると良いと思います。 togetter きっかけは Ruby Kaigi 2015 日酒が事実上無限に飲める会に参加したところ、咳さんに「次のregionalはやらないの」と言われ、基調講演者が決まればありかもと答える 翌日、miyagawaさんと飲んでるかくたにさんと話して、「2回以上続くregionalはやっぱり特定の地域コミュニティがやってるね」と言われる さらに翌朝、帰る直前のmameさんに会って「川崎のregionalやるとしたら、基

    川崎Ruby会議 01を開催しました #kwsk01 - once upon a time,
    shiumachi
    shiumachi 2016/08/24
  • 「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,

    2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。 connpass.com 今回はClouderaに入って初めてのコミュニティイベントということでしたが、なんと400人を超える応募をいただいてとてもありがたい限りです。 会場をご提供いただいたDMM.comラボ様、発表いただいたサイバーエージェントの内藤さん、DMM.comラボの加嵜さん、LTの皆様ありがとうございました。 togetter.com pandasを大規模データにつなぐIbis Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS from Cloudera Japan www.slideshare.net Ibisはpandasの作者でもある Wes McKinney(@wesmckinn) の作っているライブラリです。 ひとこ

    「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,
    shiumachi
    shiumachi 2016/07/29
    “SQLの途中結果を変数に格納できるので、途中までの処理は共通でそこから先を複数パターン作るというのも同じ変数に格納して、後段のメソッドチェーンを変えれば楽にできるというメリットが有ります”
  • そのモデル、過学習してるの?未学習なの?と困ったら - once upon a time,

    移転しました。 https://chezo.uno/post/2016-05-29-sonomoderu-guo-xue-xi-siteruno-wei-xue-xi-nano-tokun-tutara/

    そのモデル、過学習してるの?未学習なの?と困ったら - once upon a time,
    shiumachi
    shiumachi 2016/05/29
    “learning curveやvalidation curveを描くことで、そのモデルが過学習しているか未学習なのかを判別できます”
  • 機械学習の分類の話を損失関数と決定境界を中心に整理してみた - once upon a time,

    機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyter notebookにしました。 github.com [追記] githubだと日語を含む数式のレンダーが壊れるので、nbviewerの方がいいかもしれません。 https://nbviewer.jupyter.org/github/chezou/notebooks/blob/master/classification.ipynb [/追記] パーセプトロンが見直されたのはなんでだっけ、SVMってどういう位置づけだっけ、というのを確認できればなぁと思っています。 多層パーセプトロンまでに至るところの流れがうまく伝わればなぁと思っています。 間違いなどがあれば、是非ご指摘いただ

    機械学習の分類の話を損失関数と決定境界を中心に整理してみた - once upon a time,
    shiumachi
    shiumachi 2016/05/09
  • データを一箇所に集めることでデータ活用の民主化が進んだ話 - once upon a time,

    先日、この記事を読んで分析のハードルを下げること大事だよね、というのを思い出したのでつらつらと書いてみようと思います。 qiita.com 内容としては正直タイトル詐欺で、SlackからRDSにクエリ発行できるようにして、各種権限を持っているエンジニアでなくても分析できるようになったよ、という話です。 ここでいう「データ活用の民主化」というのはかっこ良く言ってみたかっただけで、「データ分析を生業にしている人以外もデータを活用してビジネスを進められるようになる」というくらいのニュアンスだと思って下さい。 「データ分析」というとアナリストの人がやること、みたいな職務が分かれている環境もあるとは思いますが、そうではない会社(前職)の一例です。 データ活用が広まった流れ 数秒〜数十秒で対話的にクエリが返ってくると、トライアンドエラーが100倍くらいできる 今まで実行計画を気にして避けていたことにガ

    データを一箇所に集めることでデータ活用の民主化が進んだ話 - once upon a time,
    shiumachi
    shiumachi 2016/05/05
    “SQLやデータも同じで、データ活用の民主化が進むことでドメインに対する知識やパッションを持った人が、道具としてのデータを使って新しいことを生み出すことができるようになる”
  • 転職しました - once upon a time,

    はじめての転職エントリです。 一部の方にはお伝えしましたが、先週からClouderaで働いています。 まとめ Ruby大好きポエム プロダクトエンジニアポエム データ大好きポエム お前だれよ? kawasaki.rbやMachine Learning Casual Talks、Julia Tokyoなどのミートアップをやってます。 なお、今後もコミュニティ活動は続けていきたいと思います。 Rubyが好きでクックパッドに入った 仕事でまったくRailsを書いていない人だった*1のに、「Rubyが好きです!Rubyistなら一度は働いてみたいです!NLP機械学習はやってきたんですが、世の人の役に立つものを作って使ってもらいたいです」とミーハーな気持ちで挑んだのですが、なんとか拾ってもらえて2年8ヶ月働くことができました。 「Rails書いたことないのに採用されて驚いた」と飲んだ時に話したら、

    転職しました - once upon a time,
    shiumachi
    shiumachi 2016/03/31
    “そんな中で、shiumachiさんの記事を読んで” 教訓: キャリアパスについての煽り記事を書けば採用が捗る
  • Machine Learning Casual Talks #3 (略称MLCT)やりました #MLCT - once upon a time,

    先日、Machine Learning Casual Talks #3を行いました。 togetterのまとめ 久しぶりのMLCTでしたが、今回も濃密な議論が行われました。 今回、発表資料を乗せるとともに、開催にあたってカジュアルとは、何故始めたか、を改めてお知らせしたので、それをこちらにも書いておきます(次回は募集ページに書こう) 発表資料 プロダクション環境でオンラインで機械学習を動かすにあたってツライ話 #MLCT from Shinta Nakayama www.slideshare.net Mlct 20150430v2 from Masakazu Sano www.slideshare.net Hivemall LT @ Machine Learning Casual Talks #3 from Makoto Yui www.slideshare.net まさか、Hivemal

    Machine Learning Casual Talks #3 (略称MLCT)やりました #MLCT - once upon a time,
    shiumachi
    shiumachi 2015/05/03
  • 非エンジニアのコミュニティにSlackを導入した話 #ingress - once upon a time,

    普通の人達*1の集まりである、Ingressの地域コミュニティでSlackを導入してそろそろ3ヶ月になったので、知見を書こうと思います。 Ingress内でのコミュニケーション Ingressではゲーム内のチャットはcommと呼ばれるものがありますが、ほとんど使われていません。 その理由は主に2つあります。 commは行動ログが流れる中でメンションができるというスタイルをとっているため、特に関東圏では流れるデータ量が多すぎてiOS版のcommはフリーズの原因として嫌われている 全体公開のチャットと自陣内のチャットとがタブ一つ隣り合わせのため、うっかりチームチャットを公開してしまう事故が多発する そこで、多くの場合はGoogleアカウントとの親和性の高いGoogle+での広い地域のコミュニティ*2と、地元の地域チャットとしてHangoutの組み合わせで使われてきました。 これは、どうも国内だ

    非エンジニアのコミュニティにSlackを導入した話 #ingress - once upon a time,
    shiumachi
    shiumachi 2015/01/16
    へー、こんな使い方ができるのか。知らなかったけど便利そうだなあ!
  • 社内でLean Analytics読書会を終えました - once upon a time,

    社内でLean Analytics読書会をやった 今年の4月末に、Lean Analyticsを読もうという話を @ryo_katsuma氏が社内ブログで言い出したことにより始まり、5月から12月まで毎週1章を読み進めていくペースで読んでいきました。(かつまさん、ありがとうございました!) 英語読書会と言っても、翻訳をしてそれを読み合わせるというよりは、皆が事前に読んできて分からなかったこと、きになったコトを話したり、内容から広がった自分たちのサービス開発の上での経験談を話して盛り上がるという会でした。 このスタイルで得られることは多く、英語は輪読すると続けやすいというmiyohideさんの言葉だけではなく、社内外の様々な事例に突っ込んで議論できたのがとても良かったです。古参の人の持っている知識ってなかなか新参者には伝わる機会が少ないのですが、いい話がどんどん出てきたのが素晴らし

    社内でLean Analytics読書会を終えました - once upon a time,
    shiumachi
    shiumachi 2014/12/29
    "One Metric That Matters"
  • #ingress でフルタイムのプロエージェントと出会った話 - once upon a time,

    この記事はIngress Advent Calendarの15日目の記事です。 昨日は@kwappaさんの #ingress のイベント #Darsana XM Anomaly Tokyo に参加してきたよ! - かっぱラクガキ帳 でした。 Darsana参加してきたよ Darsana参加された皆さん、お疲れ様でした! ResistanceのゆるふわA10*1なので負けて悔しい気持ちもありましたが、初めての公式イベントに参加できてとても楽しかったです。 特に最終戦はotsuneさんと戦うことができたので(そして人数的にもイーブンの中でポータルを死守できました!)、ぎりぎりの白熱した戦いを繰り広げることが出来てとてもよかったです。 現場では州を囲む緑の巨大CFに囲まれたものの、「我々は局地戦を淡々と行うしかないんだ」とチームで話しながら、ポータルを死守し運良く4戦全勝できました。 (写真は

    #ingress でフルタイムのプロエージェントと出会った話 - once upon a time,
    shiumachi
    shiumachi 2014/12/15
    あの人は、敵ながら本当に尊敬できる人だしまた会いたいと思う緑エージェントの一人だ
  • 1