タグ

ブックマーク / lab.astamuse.co.jp (4)

  • Linuxでinodeが枯渇した場合にどうやって調査するか - astamuse Lab

    こんにちは。並河(@namikawa)です。 最近はすっかり暖かい日が続いておりまして、花粉が飛散して当に悲惨な感じになってしまっているアカウントがこちらになります。 さて、近頃は、GCPへの移行を終えたり、新しいメンバーが続々とジョインしてきてくれていることもあり、業のインフラ職人業が随分と減ってきていて、やっぱり最近力を入れている採用の話を書こうかなと思ったのですが、そういえば前回は採用向けの話(アスタミューゼの開発組織と採用に関するQAアレコレ)を書いたところだったので、今日はLinux運用環境での小ネタでも書こうかと思います。 「なぜかサーバに書き込めません!」 ある日、とあるサーバのディスク関連のアラートが飛んできて、エンジニアがサーバの状況を確認したところ、ディスクの容量には空きがあるが、なぜか書き込めないという状態になっていました。 # df -h Filesystem

    Linuxでinodeが枯渇した場合にどうやって調査するか - astamuse Lab
  • 英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。 - astamuse Lab

    こんにちは。白木(@YojiShiraki)です。デザイナーです。 今日はPythonで英文形態素解析をする上でお手軽便利なpolyglotについて紹介します。 背景 当社ではデータを分析・解析する機会がままありまして、こうしたときに自然言語解析の処理のツールを利用しています。特に最近では英語データが多く、このあたりのツールのニーズが高くなっています。 しかし、いざ英語の解析となると意外に情報がありません。 例えば、日語の解析ならMeCabやChaSen、Kuromojiといったものはすぐ見つかります。しかし英文の自然言語解析ではTreeTaggerの情報は目につくもののイマイチまとまった情報がありません(このページやこのページに他の選択肢がまとまっていますが)。 おそらくこの領域ではNLTKが王道なのかと思いますが、やや重厚感あります。 そこでもう少しライトなものをということでPoly

    英文の自然言語処理におススメ!お手軽なPolyglotを使ってみた。 - astamuse Lab
  • Spark 2.0 で Spark SQLを試す - astamuse Lab

    こんにちは!Spark大好きな朴です。 日はSpark 2.0で大幅の改善が行われてたSpark SQLについて書こうと思います。 弊社ではCDHのバージョンアップをこまめに行うことでSpark,HBaseなどのプロダクトの最新バージョンを常に試せる環境を作っております。 Spark 2.0についても先日弊社福田のもう待てない、Spark2.0の導入と実践にも書いてたとおり もう使えるようになりました。 ということで少し乗り遅れた感もありますが、日はSpark 2.0でSpark SQLの実力を試したいと思います。 Spark 2.0でSpark SQLの主な変更点は以下の3つ SparkSession 性能改善 サポートするSQLが増えた 日は上記3つの改善について触れてみたいと思います。 【変更その1】 SparkSQLのニューエントリポイントSparkSession Spark

    Spark 2.0 で Spark SQLを試す - astamuse Lab
  • 企業向けエンジニアブログの作り方 - astamuse Lab

    皆様こんにちは。アスタミューゼという会社でエンジニア業をしています並河 (@namikawa) と申します。 弊社も、昨今の流行りにのっとり、会社で技術ブログをはじめることにしました。 エントリのタイトルにはわかりやすく "エンジニアブログ" と書きましたが、このブログでは、 astamuse.com をはじめとした弊社のWebサービスを作っている関係者(エンジニア、デザイナー、たまにディレクターや責任者など)が定期的に、Webサービス技術に関して、最近やっていること・興味のあることを、持ち回りで取り上げます。 このブログを通じて、アスタミューゼという会社の事や、サービス開発の現場の雰囲気が少しでも伝わればいいなと思います。 私個人としては、自分の個人ブログは10年以上続けているし、前職では会社のエンジニアブログがあったので寄稿もしましたが、そういえば企業ブログの運営はしたことがありま

    企業向けエンジニアブログの作り方 - astamuse Lab
  • 1