タグ

ブックマーク / chezou.hatenablog.com (60)

  • Docker imageを用意してWindows/macOSでスムーズに同人誌を作った話(Sphinx編) - once upon a time,

    こんにちは、ハイラルに移住したchezouです。最近は、Rから始まりRで終わる言語をよく書いています。 いよいよ明日に迫ってきた技術書典2ですが、お-13で技術書供養寺として頒布を行います。 内容は、僕の機械学習の実務におけるtipsとfastFMを使った推薦、@tokorotenさんのKickstarterの分析、@hagino3000さんのスプラトゥーンのデータマイニングということで盛り沢山です。初めての同人誌ですが、140ページを超えた薄くない薄いになりました。 是非買いに来てください! tl;dr 技術書を書くときに、LaTeXを含んだDocker image使ってCIでビルド出来るようにすると共同執筆が捗るよ 前回までのあらすじ 今回は、メンバーがWindowsの人とmacOSの人の混成チームであったこと、全員がPythonに馴染み深い人だったので、reStructuredTe

    Docker imageを用意してWindows/macOSでスムーズに同人誌を作った話(Sphinx編) - once upon a time,
    chezou
    chezou 2017/04/08
    明日の技術書典2への執筆に裏側を少し書きました。Sphinxに限らずDocker imageとCI使った共同執筆はオススメです
  • 数式入りのmarkdownをSphinxを使ってhtml/pdfにする - once upon a time,

    Sphinxでmarkdown拡張を扱うためのrecommonmarkというライブラリがあります。 これを使うとreSTではなく、markdownを書いてhtmlPDFが吐けるようになります。 詳細は以下のエントリにやり方がまとまっています。 tech.3rd-p-zombie.net 実は、このrecommonmarkはconfigに設定を書くだけで、数式をmarkdownの中に埋め込めるのでした。 conf.pyの上の方に以下をimportし、 import recommonmark from recommonmark.parser import CommonMarkParser from recommonmark.transform import AutoStructify source_suffixの修正、source_parsersの追加 source_suffix = ['.

    数式入りのmarkdownをSphinxを使ってhtml/pdfにする - once upon a time,
    chezou
    chezou 2017/01/22
    長年の懸念だった、どうしたらmarkdownで数式書けるんだ問題の解決方法見つけた
  • 非英語ネイティブにとってのOSSのメンテナンスコスト - once upon a time,

    disclaimer: この記事を書いている人はClouderaというHadoop/Sparkのディストリビューターの会社にいます。 codelunch.fmの20回目を聞いていろいろ思うところがあったのでつらつら買いてみます。 codelunch.fm この回のcodelunch.fmでは、前職の同僚である丸山さん(@h13i32maru)と@hokacchaさんが、お互いの家庭環境の変化を交えながら個人プロダクトの開発について話しているエピソードです。これ自体なかなかおもしろい回なので、趣味でプロダクト開発している人は聞いてみるといいんじゃないかなと思います。 丸山さんはJasperやESDocを精力的に開発していますし、hokacchaさんはnodebrewやadventarを作られています。彼らの話していた、個人で趣味プロダクトを開発するモチベーションは何かというところは、以下のよ

    非英語ネイティブにとってのOSSのメンテナンスコスト - once upon a time,
    chezou
    chezou 2017/01/02
    ポエム書いてて思い出したのが、githubのissueが初心者向けのMLか何かだと思って質問する人が最近増えてる気がする
  • #eigo と私〜あるいは子持ちの業務外活動の続け方 - once upon a time,

    こんにちは、温泉行きたいです。この記事は、pyspaアドベントカレンダー2016の21日目です。1日前は、渋川さんの保険の話でした。 Clouderaという外資系のHadoop/Sparkを中心としたプラットフォームを提供する会社に今年転職しました。そこで生きていく上で必要な #eigo の話を中心に2016年を振り返ります。 転職した 転職エントリーにも書きました。今ちょうど9ヶ月経ちましたが、まだ首にならずなんとか頑張ってやっています。 シンガポールでAPACのSales Enginnerでのミーティングに行ったら、いろんなアジアの国の英語とディスカッションをして揉まれました。 日のチームは成長中なので、グローバルに比べると相対的に人数も少なく、Doug CuttingやMLlibに詳しいSparkコミッターのSean OwenをはじめとするUSのエンジニアと話す時間が多くあるのがと

    #eigo と私〜あるいは子持ちの業務外活動の続け方 - once upon a time,
    chezou
    chezou 2016/12/21
    未来の記事を書いてしまった...
  • Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた

    今日のre:InventでDeep Learningを使った音声合成サービスのAmazon Pollyが発表されました。 正直、DLを使ったの音声合成が話題になったのなんて今年に入ってからだと思っていたのに、もう商用化したんか!という気持ちでいっぱいです。 Amazon Polly – 文章から音声へ、47の声と24の言語 | Amazon Web Services ブログ Amazon Polly – Lifelike Text-to-Speech [2016/12/02追記] PollyがDLベースという話は https://aws.amazon.com/jp/polly/ に、"Polly is an Amazon AI service that uses advanced deep learning technologies to synthesize speech that so

    Rubyで深層学習を使った音声合成Amazon Pollyを使ってWebサイトの読み上げ音声合成してみた
    chezou
    chezou 2016/12/01
    別にRubyじゃなくてもいいんですけど、とても簡単でした
  • icloudのカレンダーに来るイベントスパムを避けるための設定変更 - once upon a time,

    最近、めちゃくちゃicloudのカレンダーにレイバンのスパムが来るようになってうざいので、通知されないように回避するためのicloudの設定方法を書いておく。 1. PCのブラウザでiCloud.com へ行きカレンダーを開く 2. 左下の歯車から環境設定を開く 3. 「詳細設定」の「イベント参加依頼の受信方法」の設定を「xxxx@yyyy.comへメールを送信」にする この設定にすると、設定したメールアドレスに通知が来るのでメールを削除するだけになる。 補足 追加された予定を通知しないように削除するには、icloudに新規カレンダーを追加してそちらに移動してから、カレンダーごと削除すると招待した輩に通知をすることなく消せる。 参考サイト 9to5mac.com astralbodi.es www.dagasorega-e.net

    icloudのカレンダーに来るイベントスパムを避けるための設定変更 - once upon a time,
    chezou
    chezou 2016/11/26
    書いた。icloudのカレンダー使ってない人は今すぐ設定変更すべき
  • Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016 - once upon a time,

    さる11/8に、自社の主催するCloudera World Tokyo 2016で、機械学習プロダクトの作り方について話をしました。 図: Hadoopの生みの親 Doug(@cutting)と握力王新沼さん(@hiroki_niinuma)の対談イベントの様子 大規模データに対するデータサイエンスの進め方 #CWT2016 from Cloudera Japan www.slideshare.net データの民主化の話、データサイエンティストとデータエンジニアの役割分担とチーム構成、機械学習の業務フロー、Cloud Nativeなデータサイエンスといった盛りだくさんの話をしました*1。 話の中で特に言いたかったことは2つ、P.16のリスクを取ってくれる責任者を捕まえようという話と、P.29の機械学習込みのプロダクトは改善をし続けないと死ぬという話です。 あとは、できるだけ機械学習をしない

    Cloudera World Tokyo 2016で機械学習プロダクトの作り方を話しました #cwt2016 - once upon a time,
    chezou
    chezou 2016/11/15
    同僚に「Hadoopの話にしなくていいんやで」って言われたので好き放題話させていただきました
  • RNNLMベースの形態素解析器 JUMAN++ をhomebrewでインストールできるようにした - once upon a time,

    京大の黒橋・河原研から最近出たJUMAN++をmacOSのhomebrewでinstallできるようにしました。 JUMAN++はRNNLMというディープラーニングベースの言語モデルを使っています。 こちらの記事を読んで知ったという方も多いのではないでしょうか。 qiita.com インストール方法は、現段階では後述する理由のためhomebrew-coreにはまだ入っていないので、tapを使ってください。 [2016/10/23追記] やっと家homebrewに入ったので、tapは要らなくなりました。 [/追記] $ brew install jumanpp github github.com JUMAN++のサイト凄い JUMAN++のサイトには解析を試せるWebアプリケーションがあるのですが、それがなかなか面白いです。 このリンクに対して、 http://tulip.kuee.kyo

    RNNLMベースの形態素解析器 JUMAN++ をhomebrewでインストールできるようにした - once upon a time,
    chezou
    chezou 2016/10/15
    JUMANとMeCab周りのところの比較は真面目にやろうとして力尽きている感満載なので、クリティカルな問題があればそっと教えてください...
  • PDFの表をpandasのDataFrameにできる tabula-py 作った - once upon a time,

    RubyKaigiに参加するとコード書きたいという気持ちが高まって良いのですが、今回はPDFの表を読み込んで pandas の DataFrame に変換できる tabula-pyを作りました。 これをもってRubyKaigiの参加報告とさせていただければと思います。 tabula-pyとは tabula というJavaで書かれたPDFから表を抽出するライブラリをPythonでうすーくラップしたものです。実装を見てもらえばわかると思いますが、当にsubprocessでJavaのプログラムを叩いて標準出力で受け取るというだけしかやっていません。 もともとは、Rのtabula実装がかなり色々できるのを知ってPythonがないらしいというので作りました。Rの実装はマジでJavaをごりごり書いていて尊敬の念を抱いています。 tabulizerパッケージによるPDF表データからのデータ取得 git

    PDFの表をpandasのDataFrameにできる tabula-py 作った - once upon a time,
    chezou
    chezou 2016/09/12
    RubyKaigiの成果です。感想も少しだけ書いていいます/某国の政府系ドキュメントなんかにお使いください
  • 川崎Ruby会議 01を開催しました #kwsk01 - once upon a time,

    さる 8/20 に川崎Ruby会議01を開催しました。 regional.rubykaigi.org 川崎Ruby会議は、kawasaki.rbの主催する地域Ruby会議です。 ちゃんとしたまとめはるびまに出ると思うので、ここでは開催の経緯なんかを簡単に書こうと思います。 なお、発表内容が気になる方はタイムテーブルにあるスライドや動画へのリンクを見ると良いと思います。 togetter きっかけは Ruby Kaigi 2015 日酒が事実上無限に飲める会に参加したところ、咳さんに「次のregionalはやらないの」と言われ、基調講演者が決まればありかもと答える 翌日、miyagawaさんと飲んでるかくたにさんと話して、「2回以上続くregionalはやっぱり特定の地域コミュニティがやってるね」と言われる さらに翌朝、帰る直前のmameさんに会って「川崎のregionalやるとしたら、基

    川崎Ruby会議 01を開催しました #kwsk01 - once upon a time,
    chezou
    chezou 2016/08/24
    ポエムです。100人規模の小さな技術イベントやりたいと思う人がいれば参考になるかもです
  • 「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,

    2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。 connpass.com 今回はClouderaに入って初めてのコミュニティイベントということでしたが、なんと400人を超える応募をいただいてとてもありがたい限りです。 会場をご提供いただいたDMM.comラボ様、発表いただいたサイバーエージェントの内藤さん、DMM.comラボの加嵜さん、LTの皆様ありがとうございました。 togetter.com pandasを大規模データにつなぐIbis Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS from Cloudera Japan www.slideshare.net Ibisはpandasの作者でもある Wes McKinney(@wesmckinn) の作っているライブラリです。 ひとこ

    「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,
    chezou
    chezou 2016/07/26
    昨日の #summerDS のまとめと補足書きました/ id:dayafterneet 脚注にベンチマーク記事へのリンク追加しました
  • JupyterからSpark clusterを操作できるlivy + sparkmagicを試してみた - once upon a time,

    Spark Summit 2016でもトークがあったSparkのREST serverであるlivyですが、MicrosoftがHDInsight上のSpark clusterとJupyterをlivyを使って繋げられるようにしたと聞いて、早速試してみました。 Jupyterって何?という方は簡単に言うと、ブラウザで各種言語のREPLが動くものと思ってもらえばいいです。 詳細は過去に書いた以下の記事を読んでみてください。 techlife.cookpad.com livyとは livyはSpark clusterをコントロールするためのREST Serverです。 Microsoftはこれとjupyter notebookのsparkmagicを使ってHDInsightとjupyterをつなげるようにしているそうです。 MSの取り組みはSpark Summit 2016のトークがわかりやす

    JupyterからSpark clusterを操作できるlivy + sparkmagicを試してみた - once upon a time,
    chezou
    chezou 2016/07/12
    Spark summitでも話題に登ったHDInsightでも使われているlivyを試してみました
  • そのモデル、過学習してるの?未学習なの?と困ったら - once upon a time,

    移転しました。 https://chezo.uno/post/2016-05-29-sonomoderu-guo-xue-xi-siteruno-wei-xue-xi-nano-tokun-tutara/

    そのモデル、過学習してるの?未学習なの?と困ったら - once upon a time,
    chezou
    chezou 2016/05/29
    機械学習頑張れよと言われたので書きました。怪しい所は指摘お待ちしております!
  • 機械学習の分類の話を損失関数と決定境界を中心に整理してみた - once upon a time,

    機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyter notebookにしました。 github.com [追記] githubだと日語を含む数式のレンダーが壊れるので、nbviewerの方がいいかもしれません。 https://nbviewer.jupyter.org/github/chezou/notebooks/blob/master/classification.ipynb [/追記] パーセプトロンが見直されたのはなんでだっけ、SVMってどういう位置づけだっけ、というのを確認できればなぁと思っています。 多層パーセプトロンまでに至るところの流れがうまく伝わればなぁと思っています。 間違いなどがあれば、是非ご指摘いただ

    機械学習の分類の話を損失関数と決定境界を中心に整理してみた - once upon a time,
    chezou
    chezou 2016/05/09
    ひっそりと書いてみました。数式はあまり使わないように心がけているので、いま勉強中の人の感想も聞ければ嬉しいです
  • データを一箇所に集めることでデータ活用の民主化が進んだ話 - once upon a time,

    先日、この記事を読んで分析のハードルを下げること大事だよね、というのを思い出したのでつらつらと書いてみようと思います。 qiita.com 内容としては正直タイトル詐欺で、SlackからRDSにクエリ発行できるようにして、各種権限を持っているエンジニアでなくても分析できるようになったよ、という話です。 ここでいう「データ活用の民主化」というのはかっこ良く言ってみたかっただけで、「データ分析を生業にしている人以外もデータを活用してビジネスを進められるようになる」というくらいのニュアンスだと思って下さい。 「データ分析」というとアナリストの人がやること、みたいな職務が分かれている環境もあるとは思いますが、そうではない会社(前職)の一例です。 データ活用が広まった流れ 数秒〜数十秒で対話的にクエリが返ってくると、トライアンドエラーが100倍くらいできる 今まで実行計画を気にして避けていたことにガ

    データを一箇所に集めることでデータ活用の民主化が進んだ話 - once upon a time,
    chezou
    chezou 2016/05/05
    ちょっと遅れたマーケ担当SQL話へのアンサーソングです
  • 転職しました - once upon a time,

    はじめての転職エントリです。 一部の方にはお伝えしましたが、先週からClouderaで働いています。 まとめ Ruby大好きポエム プロダクトエンジニアポエム データ大好きポエム お前だれよ? kawasaki.rbやMachine Learning Casual Talks、Julia Tokyoなどのミートアップをやってます。 なお、今後もコミュニティ活動は続けていきたいと思います。 Rubyが好きでクックパッドに入った 仕事でまったくRailsを書いていない人だった*1のに、「Rubyが好きです!Rubyistなら一度は働いてみたいです!NLP機械学習はやってきたんですが、世の人の役に立つものを作って使ってもらいたいです」とミーハーな気持ちで挑んだのですが、なんとか拾ってもらえて2年8ヶ月働くことができました。 「Rails書いたことないのに採用されて驚いた」と飲んだ時に話したら、

    転職しました - once upon a time,
    chezou
    chezou 2016/03/30
  • #CookpadTechConf 2016でクックパッドの研究まわりの取り組みを発表しました - once upon a time,

    1/23に開催されたCookpad TechConf 2016で、クックパッドの研究開発に関する取り組みを紹介させていただきました。 R&D at Foodtech company - #CookpadTechConf 2016 from Michiaki Ariga www.slideshare.net メッセージとして伝えたかったことは、 たべみるという主にtoB向けに提供しているクックパッドの検索履歴を可視化したサービスを学術提供開始しました 普段はAndroid書いてるアプリエンジニアが、自らレシピをカテゴリ分類できる仕組みがありますよ ということです。 [2016/01/25 10:04追記] たべみるの学術アカウントは無償提供させていただいております [/追記] たべみるは、社内でも季節の材やトレンドを見てレシピを選定するためにも活用しているのですが、地域ごとの差異なんかもわ

    #CookpadTechConf 2016でクックパッドの研究まわりの取り組みを発表しました - once upon a time,
    chezou
    chezou 2016/01/25
    検索履歴可視化サービス「たべみる」の学術無償アカウント提供、アプリエンジニアが楽に分類器を使える仕組みについて紹介しました
  • 2015年を振り返って - once upon a time,

    今年は色々と挑戦をし、成功したもの失敗したもの多くの体験ができました。 雑感 その中で痛感したのが、背中を預けられる仲間と働くことの重要性でした。 通年を通じて会社の同僚に散々言われつづけてきた2つの言葉があります。 責任を取らない人の言葉は気にしてはいけない。自分で責任を取り権限を掴め。 この言葉が実行できたのは今年の終盤でした。開き直ってしまえば、しんどさはあるもののどんどん進めていくことができるようになりました。 当にそれは自分がやるべきことか?断れないから引き受けていないか。自分のキャパを過大に見積もりすぎてはいけない。 年の中盤から意図的に参加する勉強会を絞ったり、主催も控えめにデリゲートできるものはデリゲートしてきました。結構切り捨てるものは切り捨てました。 けど、もう少し抑えられる気がしています。 自分の「得意」が何で、それを踏まえた上で何を伸ばしていきたいか、何でもやる、

    2015年を振り返って - once upon a time,
    chezou
    chezou 2015/12/30
    書きました
  • 2015年に買ってよかった物まとめ - once upon a time,

    書いておくと後から検索できることもあり、今年買ってよかったものを書いていこうと思います。 1. 防水Bluetoothスピーカー Patech Bluetooth 3.0 ワイヤレススピーカー 内蔵マイク付 吸盤式対応 防水仕様 (ブラック) 出版社/メーカー: Patechメディア: エレクトロニクスこの商品を含むブログを見る お風呂にも使えるし、キッチンでも冷蔵庫に貼り付けたりして使えて便利です。水の音に負けない程度の音量を稼げて、iPhoneiPadで単純に再生するよりもながら聴きが捗ります。 Podcastを聞くのにちょうどよいです。Podcastの音をAirplayで良いスピーカーに繋いで出すとあまり音が頭に入らないんですが、ちょっと昔のラジカセみたいな感じでちょうど聴きやすくなります。 もこれを使って英語Podcastを聞くようになっています。 chezou.hatena

    2015年に買ってよかった物まとめ - once upon a time,
    chezou
    chezou 2015/12/29
    書きました
  • Julia Tokyo #5を開催しました #JuliaTokyo - once upon a time,

    chezou
    chezou 2015/12/25
    まとめました