タグ

ブックマーク / shiumachi.hatenablog.com (13)

  • ルミノソジャパン合同会社に転職しました - 科学と非科学の迷宮

    2018年12月3日付で、Luminoso Technologies Inc. の日法人である、ルミノソジャパン合同会社のソリューションアーキテクトとして勤務を開始しました。 この会社は、自然言語理解のためのMITスピンアウトのスタートアップです。まだ全世界で数十名しかおらず、日では私と代表の2名のみの会社です。 Luminosoを使うことで、お客様のお問い合わせ記録のテキストからお客様の声を抽出したり、口コミなどの解析から迅速な製品の改善に繋げることが可能になります。 これだけ聞くとあまり目新しくないように見えますが、Luminosoの特長としては、こうした結果を、辞書も不要で、かつ少量のデータだけで実現できるということです。NLP番導入の大きな壁の一つであった、辞書管理やデータ管理をスキップすることで、導入コストと時間を大幅に削減することができます。 詳細については以下のページ

    ルミノソジャパン合同会社に転職しました - 科学と非科学の迷宮
    wyukawa
    wyukawa 2018/12/03
    ゼロからのスタートかっこいい
  • Clouderaを退職しました - 科学と非科学の迷宮

    2018年11月30日(金)は、Cloudera株式会社への最終出社日でした。2011年4月1日に入社したので、勤続日数は2800日でした。 Clouderaオフィス2011年 Cloudera Japan オフィス 2012年 日にオフィスも同僚もいない状態からのスタートでしたが、今日、多くの同僚たちに見送られる形で会社を出ることができました。 退職するときは、最後の一人として会社を去るか、自分がいなくても会社が回るようになったときか、そのどちらかにしよう、と決めていました。皆が退職することを惜しんでくれましたが、私がいなくても会社は問題なく続いていくでしょう。私が理想とする結末にたどり着くことができて、当に嬉しいです。 7年前、ごく一部の人しか知らなかったHadoopは、今や多くの人が知るソフトとなり、Hadoopに限らず、様々なデータ基盤を活用することが当たり前の時代となりました

    Clouderaを退職しました - 科学と非科学の迷宮
    wyukawa
    wyukawa 2018/11/30
    まじかー。お疲れ様でした〜
  • 進捗ヤバいプロジェクトに直面した経験がある人なら(多分)楽しめるカードゲーム「Not My Fault!」 - 科学と非科学の迷宮

    エンジニアプロジェクトがオンスケであると嘘をつき続けるゲームは盛り上がった pic.twitter.com/aWkKIPtAAS— Yoshifumi Yamaguchi (@ymotongpoo) 2017年7月30日 @ryushi さんの主催で仲間内で集まってボードゲーム・カードゲームで盛り上がったのですが、その中で @tokoroten が持ってきた「Not My Fault!」というカードゲームが非常に衝撃的でした。 まず、背景設定がすごい。 残り30日で絶対に完成させなければいけないプロジェクトに、プレイヤー達はプロジェクトメンバーとして参加しています。 進捗は絶対に遅れてはいけません。 もし、プロジェクトの進捗が報告されていたよりも進んでいないとしたら? それはもちろん、進捗を過大報告したヤツの責任です。 監査を入れて、そいつを追い詰めよう! というのがゲームの設定です。

    進捗ヤバいプロジェクトに直面した経験がある人なら(多分)楽しめるカードゲーム「Not My Fault!」 - 科学と非科学の迷宮
    wyukawa
    wyukawa 2017/07/31
    前職でプロマネが進捗が遅れてるのにお客さんに問題ないです、キリって報告しつづけてそのままとんずらして退職したことを思い出した。その後怪しまれて発覚して炎上したとさ
  • 「Hadoopの時代は終わった」の意味を正しく理解する - 科学と非科学の迷宮

    Hadoopの時代は終わった、という言説をたまに見かけるようになりました。 もちろん終わってなどいません。しかし、Hadoopとその取り巻く環境が変化したのは事実です。 記事では、この変化が何なのかを明らかにし、その上で、なぜHadoopの時代は終わったという主張が実態を正しく表していないのかを説明していきます。 DISCLAIMER 私はHadoopを中心としたデータ基盤を取り扱うベンダー、Clouderaの社員です。 中立的に書くよう努めますが、所属組織によって発生するバイアスの完全な排除を保証することはできません。 以上をご了承の上、読み進めてください。 要約 データ基盤は、Hadoopの登場により非常に安価となり、今まででは不可能だった大量のデータを取り扱えるようになりました。 Hadoopは、NoSQLブームの中、処理エンジンであるMapReduceとストレージであるHDFSが

    「Hadoopの時代は終わった」の意味を正しく理解する - 科学と非科学の迷宮
    wyukawa
    wyukawa 2017/07/10
    Hadoopのエコシステムが広がってるからなあ
  • 誰でもできる、プレゼンが劇的にうまくなる基本テクニック - 科学と非科学の迷宮

    私も「テクニカルエバンジェリスト」などという大層な肩書を会社からいただいており、講演や連載記事などの執筆を行っていますが、私のプレゼン技術は数年前にMSの西脇さんのプレゼンセミナーに参加させていただいて学んだものがほとんどで、正直言うとこのような記事を書いて講釈を垂れるような立場ではありません。 しかし、直近で西脇さんのセミナーがないということと、会社も大きくなり同僚が増えていく中で、速やかに自分のプレゼン技術を共有しなければならないという状況になったため、恥ずかしながら自分なりの方法を説明するためにこの記事を執筆することにしました。 プレゼンとは銘打っていますが、実際にはプレゼンだけでなく、ブログの記事執筆などさまざまな表現の場で活用することができます。"present"とは「伝える」「表現する」という意味であることからもわかるかと思います。 著者の経験 公開イベントでのプレゼンは、小さ

    誰でもできる、プレゼンが劇的にうまくなる基本テクニック - 科学と非科学の迷宮
  • セールスエンジニアという仕事 - 科学と非科学の迷宮

    現在の自分の肩書である「セールスエンジニア」という仕事がどのようなものか知らない方も多く、毎回説明するのが大変なのでブログ記事にしました。セールスエンジニアという仕事はなかなか馴染みがありませんが、20代後半から30代のITエンジニアのキャリアパスとしては面白い仕事の一つだと思います。マネージャーになるかどうか考える前に、是非一度読んでください。 この記事では、ClouderaのようなB2BのITソフトウェアベンダーのセールスエンジニアを想定して執筆しています。他の業界のセールスエンジニアについては確実に状況が異なりますのでご注意ください。 要約 セールスエンジニアとは、お客様が自分たちの製品を正しく活用できるよう情報を提供していき、営業が製品・サービスを販売するのを助ける仕事です。お客様への製品紹介と提案が主要業務ですが、その方法は様々です。お客様の要望を満たすようなサンプルプログラムを

    セールスエンジニアという仕事 - 科学と非科学の迷宮
    wyukawa
    wyukawa 2016/06/04
    外資系ITベンダーにしか存在しないポジションな気がするので情報少ないなか貴重な情報だ。
  • リスクヘッジと給料と英語 - 科学と非科学の迷宮

    この記事の要約 英語が話せるようになれば、日の人材市場ではなくグローバルの人材市場で自分の価値を判断されるようになる ITエンジニアにとって日語のみの仕事はグローバルに比べて給料・待遇ともに劣っていて、各種経済予測からこれが改善されることは絶望的 英語使ってグローバル企業で働くことは、「一攫千金や立身出世を狙う野心家のキャリアパス」ではなく、ITエンジニアにとって生き残るための必須能力となりつつある あけましておめでとうございます。今年もよろしくお願いします。 最近、私の会社で日での格的な採用活動を始めました。その関係で転職に興味ありそうな人と色々と話をしているのですが、全員が共通して「英語がきつそうで……」といった反応でした。いずれも技術者として優秀な方々ばかりで、その技術の修得に多大な努力を要していたはずです。自然言語というものは、母語であれば普通は特に専門教育を受けずとも使え

    リスクヘッジと給料と英語 - 科学と非科学の迷宮
    wyukawa
    wyukawa 2016/01/03
    英語頑張ります
  • 転職してから4年が経ちました - 科学と非科学の迷宮

    といっても4月1日の話なのでもう一ヶ月以上も前になるのですが、色々と忙しくて後回しにしてました。 ブログで転職報告してから4年の間、どういう仕事をしてきたのか書いてないことに気づいたので、せっかくなのでちょっとまとめてみようと思います。 1年目(2011年) 「朝、ベッドから起きると、そこが職場になっていた」 この感覚は今でも忘れません。オフィスも同僚もいなかった私は、在宅勤務という形で Cloudera での仕事を始めました。1Kの小さいマンションに住んでいたため他の作業部屋がなく、自分のベッドの横の机がそのまま仕事場になりました。 サポートエンジニア(今は COE = カスタマー・オペレーション・エンジニアという名前になっている)として今の会社での仕事を始めたのですが、肩書き通りの仕事だけをしていればいいなんていうことは当然あるわけもなく、日にいる唯一のエンジニアとして何でも仕事をこ

    転職してから4年が経ちました - 科学と非科学の迷宮
  • HBase 0.96 で導入される新しいコンパクション「Exploring Compaction」 - 科学と非科学の迷宮

    Hadoopアドベントカレンダー2013、3日目を担当する @shiumachi です。 今回は HBase 0.96 の新機能を一つ紹介します。 要約 HBase 0.96 は賢くなったのでみんな使おう。 コンパクションのおさらい HBase では、Log Structured-Merge tree (LSM-tree) というデータ構造を使っています。 LSM-tree を簡単に説明すると、入力されたデータをログとメモリ上のデータストア(Memstore、メモリストア) に書き込みます。 メモリストアがいっぱいになると、まとめてディスクにフラッシュし、新しいストアファイルを生成します。 このストアファイルがたまってきたときに、少しづつ一まとめにしてなるべくファイル数を少なくするようにします。これがコンパクションです。 コンパクションを実行することにより、ファイルは一つにまとまります。こ

    HBase 0.96 で導入される新しいコンパクション「Exploring Compaction」 - 科学と非科学の迷宮
    wyukawa
    wyukawa 2013/12/04
    素晴らしいエントリ。そういえばうちの環境は普通のputとバルクロードを併用しているんだった。
  • Hadoopのディスクあふれ対策(補足) - 科学と非科学の迷宮

    最近流行りのディスク容量があふれたときの挙動、Hadoop編を書こうと思ったらwyukawaさんが既に書いてくださったのでやめました。 ……と思ったのですが、せっかくなので id:wyukawa さんが書いてない箇所を補足してみようと思います。 ( この記事は @kernel023 にレビューしてもらっています。ありがとうございます ) wyukawaさんの記事へのコメント まずHBaseを使っている場合はcompactionがある関係上Disk使用率は50%以内に抑えておくのが無難だと思います。この辺はCassandraと同じですね。 全データを同時にコンパクションするケースはまずないので無理に50%以下に抑えなくていいとは思いますが、意識はしておいた方がいいですね。 私は60%での警告を推奨しますが、この辺はケースバイケースです。 MapReduce の出力結果など、いきなり容量増える

    Hadoopのディスクあふれ対策(補足) - 科学と非科学の迷宮
    wyukawa
    wyukawa 2013/08/05
    良エントリ。これ読んでるとCDH4使いたくなるな。
  • Hadoopに関する雑感 (Hadoop アドベントカレンダー2012 XX日目) - 科学と非科学の迷宮

    最近はなるべく技術的な話しか書かないようにしていたのですが、たまには個人的な思考を書いてみることにします。 クリスマスだし、ブログ初めてから8周年でもあるわけですし。 Hadoop は、大量のデータをリーズナブルに計算処理できるようにしたいという課題から生まれました。 つまりキーとなる課題として、 データが大量である リーズナブルである 計算処理ができる というものがあります。 後ろ2つは話が早い。低コストで計算処理を行いたいというのはほとんどのIT関係者が抱くニーズでしょう。 しかし、「データが大量である」という課題が厄介です。 まず第一に、「そんな大量のデータがどこにあるのか?」という問題があります。 たとえば1日1TBのデータを生成したとしても年間365TBです。ようするに 0.3PB。ビッグデータの代名詞として言われる「ペタバイトオーダー」には程遠いです。 1日1TBって、要するに

    Hadoopに関する雑感 (Hadoop アドベントカレンダー2012 XX日目) - 科学と非科学の迷宮
    wyukawa
    wyukawa 2012/12/26
    たしかに>しかしこの質問にはさらなる質問があります。 「データ解析すると何がうれしいの?」という話です。 この問題の方が数段深刻です。
  • #hadoopAC12jp Hadoop アドベントカレンダー 2012 5日目 HBase の便利ツール(1) HFile - 科学と非科学の迷宮

    Hadoop アドベントカレンダー 2012 空いているところ担当の shiumachi です。 今日は HFile という、HBase の中でもかなりマイナーなツールを紹介します。 概要 HBase のデータは HDFS 上に保存されています。 この HDFS 上のデータの基単位は org.apache.hadoop.hbase.io.hfile.HFile クラスによって管理されます。 HFile クラス、実は実行可能です。 このクラスを使うことで、 HBase のストレージファイルに対する様々な調査を行うことができます。 聞いたことないという方が多いでしょうが、世の中の HBase ユーザの 99% は使わないツールですのでご安心ください。 ていうか多分私のようなサポート専用と言っていいです。 使い方 $ hbase org.apache.hadoop.hbase.io.hfile

    #hadoopAC12jp Hadoop アドベントカレンダー 2012 5日目 HBase の便利ツール(1) HFile - 科学と非科学の迷宮
    wyukawa
    wyukawa 2012/12/05
    メモ
  • 大企業のマネージャもスタートアップに飛び込もうぜ - 科学と非科学の迷宮

    (注: ここでの話は主にB2BのIT業界の話をしています。他の業界は知りません) IT系のそこそこ有名なスタートアップの会社に勤めている人と何度か話す機会がありましたが、口を揃えて「いいマネージャがほしい」と言います。 エンジニアの場合、2つの点で優秀な人を(相対的に)集めやすいです。 エンジニア同士の横の連携が強く、一人優秀な人を雇えばその人のネットワークを使って別の優秀な人を雇いやすい(くどいようですが「相対的に」) github やオープンソースプロジェクト、勉強会などのアクティビティを見ることができるので比較的容易にスキルを判別できる ところが優秀なマネージャとなるとそうもいきません。そのマネージャが優秀かどうかは一緒に仕事した人じゃないとわからないので、単に面接しただけでは判別しにくいです。 さらに、エンジニアはともかく優秀なマネージャは大企業にとどまって外に出てこないので、おそ

    大企業のマネージャもスタートアップに飛び込もうぜ - 科学と非科学の迷宮
    wyukawa
    wyukawa 2012/10/07
    仕事ぶりは優秀だけどキャリアに対して保守的というのは確かにあるかも。ただ優秀な人間は年齢の上下を気にしない気がするな。給料や社会的な信用?みたいなのがネックなのかも。
  • 1