decoy2004のブックマーク - はてなブックマーク

カエルでもわかる！Spark / MLlib でやってみる協調フィルタリング（後編） - ALBERT Engineer Blog

はじめに前編では MLlib で実装されている協調フィルタリングについて、アルゴリズムの面から解説してみました。いわば理論編です。後編は実践編として Java コードや性能評価実験の結果を見ていきます。 MLlib 協調フィルタリングの実行 MLlib の協調フィルタリング org.apache.spark.mllib.recommendation.ALS を利用する Java のコード例を以下に示します。 import org.apache.spark.api.java.JavaRDD; import org.apache.spark.mllib.recommendation.ALS; import org.apache.spark.mllib.recommendation.MatrixFactorizationModel; import org.apache.spark.mll

decoy2004 2014/11/06

リンク

Java 8 ＆機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

はじめにさる 5/30、今か今かと待ち望まれていた Spark 1.0 が遂にリリースされましたね！その前日 5/29 には都内で実際のところ Spark ソースコードリーディングだった Hadoop ソースコードリーディング #16 が開催されるなど、 Spark についての注目度が俄然高まってきているように思えます。そんなわけで、0.9.1 からの変更点や機能追加について、Java と機械学習に携わるエンジニアの視点で今回の 1.0 リリース内容をまとめてみました！何が変わったのか？ Spark : Java 8 のラムダ式サポート Java エンジニア的に今回の一番の変更点は、何と言っても Java 8 のラムダ式への対応、ですね。今年 3 月の Java 8 正式リリース後、主に Stream API の周辺においてラムダ式を書く機会が徐々に増えつつあるかと思い

decoy2004 2014/07/17

『クラス分類・回帰。行列計算特異値分解、主成分分析』 / “Java 8 ＆機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog”

リンク

Java 8 ＆機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

はじめにさる 5/30、今か今かと待ち望まれていた Spark 1.0 が遂にリリースされましたね！その前日 5/29 には都内で実際のところ Spark ソースコードリーディングだった Hadoop ソースコードリーディング #16 が開催されるなど、 Spark についての注目度が俄然高まってきているように思えます。そんなわけで、0.9.1 からの変更点や機能追加について、Java と機械学習に携わるエンジニアの視点で今回の 1.0 リリース内容をまとめてみました！何が変わったのか？ Spark : Java 8 のラムダ式サポート Java エンジニア的に今回の一番の変更点は、何と言っても Java 8 のラムダ式への対応、ですね。今年 3 月の Java 8 正式リリース後、主に Stream API の周辺においてラムダ式を書く機会が徐々に増えつつあるかと思い

decoy2004 2014/07/17

『クラス分類・回帰。行列計算特異値分解、主成分分析』

リンク

文字コード地獄秘話第1話：Unicodeにおける全角・半角 - ALBERT Engineering Blog

ごあいさつ皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。固定観念を捨てよう「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。しか

decoy2004 2014/04/22

『Amibguousは東アジアなら全角、そうでないなら半角』

リンク

Mahout で fuzzy k-means やってみた - ALBERT Engineering Blog

はじめに本エントリはデータが曖昧に分類されるのをグラフ描画して見てみたいという動機で、適当なサンプルデータに対してファジークラスタリング手法の1つである fuzzy k-means 法を実施してみたという内容です。 fuzzy k-means は Hadoop 上で動く機械学習ライブラリ Apache Mahout により実行したので、そちらのコマンド等も記載します。 k-means もいいんだけど… fuzzy k-means は知らないけど k-means なら知っている、という方もいらっしゃると思います。 k-means 法は最もオーソドックスなクラスタリング手法でアルゴリズムも理解しやすく、様々な BI ツールで実装されています。また、実データで上手くクラスタリングできることが多く、いろいろなところで使われているのではないでしょうか。しかし、k-means にもいくつか問題

decoy2004 2014/01/09

リンク

はてなブックマーク

タグ

ブックマーク / tech.albert2005.co.jp (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / tech.albert2005.co.jp (5)

カエルでもわかる！Spark / MLlib でやってみる協調フィルタリング（後編） - ALBERT Engineer Blog

Java 8 ＆ 機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

Java 8 ＆ 機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

文字コード地獄秘話 第1話：Unicodeにおける全角・半角 - ALBERT Engineering Blog

Mahout で fuzzy k-means やってみた - ALBERT Engineering Blog

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Java 8 ＆機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

Java 8 ＆機械学習の視点でみる Spark 1.0 リリース - ALBERT Engineering Blog

文字コード地獄秘話第1話：Unicodeにおける全角・半角 - ALBERT Engineering Blog