Synergy LAB[B!]新着記事・評価 - はてなブックマーク

Solr vs elasticsearch 類似文書検索（MoreLikeThis） | Synergy LAB | シナジーマーケティング株式会社 R&D

6 users

lab.synergy-marketing.co.jp

こんにちは、馬場です。 Solrとelasticsearchを比較するシリーズ、最終回は類似文書検索機能について比較します。 Solrとelasticsearch、両方のベースとなっているLuceneにはMoreLikeThisという類似文書検索の機能が実装されています。両者とも当然LuceneのMoreLikeThisを利用して類似文書検索機能を提供していますが、API の形式などはかなり異なります。 Solrの場合 Solrでは、類似文書検索のプログラムは以下のようになります。 import org.apache.solr.client.solrj.impl.HttpSolrServer import org.apache.solr.client.solrj.SolrQuery import org.apache.solr.common.util.NamedList import

世の中
2014/05/04 07:24

圧縮ツールのパフォーマンスを測ってみた | Synergy Marketing LAB

7 users

lab.synergy-marketing.co.jp

「ネットワークが遅くて、数百 MB のファイルを送るのにかなり時間かかるんですよねぇ」という話を聞いたので、使っているツールを聞くと gzip だというので、bzip2 や xz を使うといいかもしれない、というふうに答えました。あとになって実際のところどうなのかと思ったので、実際にいくつかのパターンで圧縮、伸張にかかる時間と圧縮率を測ってみました。用意したのは 20MB, 107MB, 1.1GB の3種類のファイルで、すべてプレインテキストですが、内容はバラバラです。使ったツールは gzip, bzip2, xz です。圧縮時間 (sec.) 20 MiB 107 MiB 1.1 GiB gzip (default)

世の中
2013/12/16 09:48

linux

LIBLINEARで分類したい！(2) | Synergy Marketing LAB

4 users

lab.synergy-marketing.co.jp

「2013年は彗星ラッシュだ！」と騒いでいたくせに、未だ今年最初の彗星が見れていない東です。さて前回は、LIBLINEARにおける分類時のバイアスの効果について説明しました。では、学習時にはバイアスはどのように働くのでしょうか。 ■ バイアスと学習の関係。前回引用したLIBLINEARの論文の2章を再掲します。 In some cases, the discriminant function of the classifier includes a bias term, . LIBLINEAR handles this term by augmenting the vector and each instance with an additional dimension: , where is a constant specified by the user. 識別関数にはバイアス

世の中
2013/10/03 11:37

声タイプ診断アプリ VoiceDoctor

3 users

lab.synergy-marketing.co.jp

＜サービス終了のお知らせ＞『声タイプ診断』に興味を持っていただきありがとうございます。サービス開始より、予想をはるかに上回る多くの皆様にご利用いただいてまいりましたが、音声研究活動の休止により、本アプリの提供を 2018年2月19日（月）をもちまして終了させていただきました。既にインストールされている場合も、ご利用できません。本アプリで収集させていただいたデータは、弊社R&Dにおける音声研究活動に大きく寄与しました。ご利用いただいた皆様、長らくのご愛顧ありがとうございました。 Synergy Marketing 研究企画チーム

世の中
2013/09/04 20:14

アプリ

法人で iOS Developer Program に登録する際のポイントと所要時間 | Synergy Marketing LAB BLOG

11 users

lab.synergy-marketing.co.jp

こんにちは。高椋です。先日【声タイプ診断アプリ】をリリースしましたが、アプリ開発の参考情報として、法人で【iOS Developer Program】に登録する際のポイントと、実際にかかった時間をご紹介します。（詳しい登録手順などは、色々なサイトで紹介されていますのでそちらをご覧ください）【事前準備】手続には、実在企業かどうかの確認の為、以下のどちらかが必要です。 ■登記簿謄本等をApple本社にFAX ■D‑U‑N‑S® 番号 ※「D‑U‑N‑S® 番号」は東京商工リサーチに登録があれば、無料で照会が可能です。 https://duns-number-jp.dnb.com/search/jpn/find_result.asp 照会申請後30分ほどで返信がきました【手続き】 Apple ID作成 iOS Developer Programs 登録 ※企業の場合は

世の中
2013/08/26 17:59

ベイジアンネットワーク勉強会－確率伝播その２ | Synergy Marketing LAB BLOG

3 users

lab.synergy-marketing.co.jp

前回に引き続き PROBABILISTIC REASONING IN INTELLIGENT SYSTEMSの第4章を読みます。おまけとして、ベイジアンネットワークの実装で良く用いられるJunction Tree Algorithmについても解説資料をまとめてみました。実用的なベイジアンネットワーク上の推論ではループ（loop≠cycle）の存在を考慮する必要があります。確率伝播のメッセージは矢印の逆向きにも伝わるため、循環して結果が揺らぐためです。ループの対処法は大きく三つ存在し、ここでは一つ目の手法をいくつか取り上げています。グラフを変形してループを無くしてから推論を行うシミュレーションで求めるループがあっても気にせず確率伝播を計算し、結果が収束するのを期待する二つ目と三つ目については別のメンバが解説してくれた／してくれる予定、なのでそのうち共有できるかも知れませ

世の中
2013/06/10 12:46

ScalaQueryでカラムをEnumerationにマッピングする | Synergy Marketing LAB BLOG

4 users

lab.synergy-marketing.co.jp

こんにちは、東です。お仕事でScalaからRDBをアクセスするのにScalaQueryを使っています。 ScalaQueryで「格納できる値が制限されているカラム」を素敵に取り扱う方法についてご紹介します。条件設定下記のような社員管理用の簡単なテーブルを考えます。 CREATE TABLE employee ( id INT, name CHARACTER VARYING, department CHARACTER VARYING ); 部署名には'FINANCE'や'RESEARCH'などの英語部署名が文字列で格納されるとします。また、この会社には'FINANCE'、'RESEARCH'、'MARKETING'の３つの部署しかなく、これ以外の文字列は登録されないものとします。素直な実装上記のテーブルにアクセスするコードをScalaQueryで素直に実装すると、以下のよう

世の中
2013/04/21 12:21

scala
dev

Wekaでベイジアンネットワーク（2） | Synergy Marketing LAB BLOG

6 users

lab.synergy-marketing.co.jp

前回に続き「2. 与えられたデータセットを使ってネットワーク構造を学習する」の手順を説明します。 Wekaではベイジアンネットワークは分類器の一種です。分類器とは、あるデータを少数のカテゴリに分類するもので、既知のデータから未知のデータを推測することが出来ます。既知のデータを使って、分類器がデータを分類できるようにすることを「学習」といいます。 Weka Explorer を使うと分類器の学習と評価が出来ます。例題として、ユーザの行動から予想される購入サービスを「分類」するという問題を考えます。「集合知プログラミング」第7章、表1のデータを使います。これは、あるウェブサイトでのユーザの行動と購入サービスを関連付けたものです。操作の流れは以下のようになります。ユーザの行動とそのユーザが購入したサービスのデータを入力する学習アルゴリズムを決定し、パラメータを入力する

世の中
2012/12/13 20:21

パターンランゲージの形式　〜慶應大の講義より〜 | Synergy Marketing LAB BLOG

8 users

lab.synergy-marketing.co.jp

最近気になっている「パターンランゲージ」。学生時代、建築学科であった私は習ったはずだけど、キレイサッパリ忘れてしまったので勉強しなおそう！と思ったのはいいけど、本がとっても高いぞ、うーむ・・・そんな感じでウダウダしていたら、HCD-net で講演されていた井庭先生の講義が iTunes U で公開されている事を知ったので、まずは授業を受けてみることにしました。（馬場さんを真似っこ） KEIO SFC on iTunes U：http://itunes.sfc.keio.ac.jp/ アウトプットから始まる学び Output-Driven Learning 与えられた知識をインプットするだけが、学びではない。「はなす」ことでわかる Release of Thoughts 自分の考えを「話す」ことは、自分からその考えを「離す」こと。井庭先生の「学習パターン」より井庭先生

世の中
2012/11/23 22:21

機械学習(5) – スタンフォード大学の講義から | Synergy Marketing LAB BLOG

4 users

lab.synergy-marketing.co.jp

こんにちは、馬場です。はい。無事完走しました！報告がだいぶ遅くなりましたが、第９週、第10週の内容と講義全体の総括をしたいと思います。 16. 異常検出今回は異常なデータを検出するアルゴリズムです。例えば、洪水などの災害の検知や製品を作る上で異常なものを除く場合に利用します。まず、データが平均μ、分散σの正規分布だと仮定します。この平均や分散は、学習データから算出します。すると、この情報から特定のデータの出現確率が求められます。そして出現確率があるしきい値εよりも小さい場合に、異常と判定するのです。異常検出モデルを作成する場合にデータを収集した場合、当然異常データが含まれているとしてもほんのわずかでしょう（だって異常なのですから）。このデータをクロスバリデーション用のデータと学習データに分ける場合、学習データは正常データのみで作成し、クロスバリデーションデータやテストデータに、異

世の中
2012/11/02 18:17

nlp

機械学習(3) – スタンフォード大学の講義から | Synergy Marketing LAB BLOG

3 users

lab.synergy-marketing.co.jp

こんにちは。馬場です。ブログさぼっている間に、講義はとうとうラスト10週目に突入です！が、今回は第５週、第６週の講義の内容を紹介します。 9. ニューラルネットワーク前回ニューラルネットワークがどのようなモデルなのか、説明していました。今回は学習データよりモデルを計算する方法について説明しています。まずは、尤度関数です。ベースはロジスティック回帰の尤度関数と同じなのですが、それが組み合わせているので、強烈なΣ祭りとなっていました。思わず面食らったのでここでは紹介しません！次に、尤度関数の値が最小になるようなパラメータΘの算出方法について、説明していました。要は学習データの数だけ、フォワードプロパゲーションとバックプロパゲーションを繰り返すのですが、ここでAndrew先生。今までのアルゴリズムよりかなりごちゃごちゃしているので、今からその心を教えます。といって、説明を始めまし

世の中
2012/07/12 13:21

機械学習

はてなブックマーク

はてなブックマーク

『Synergy LAB | シナジーマーケティング株式会社 R&D』

機械学習のご利用は計画的に | Synergy LAB | シナジーマーケティング株式会社 R&D

切り抜きたい（再発明 Ver.） | Synergy LAB | シナジーマーケティング株式会社 R&D

オープンラボ2014 | シナジーマーケティング株式会社R&D | OPENLAB2014 by SYNERGY MARKETING R&D

表情認識アプリをつくってみた | Synergy LAB | シナジーマーケティング株式会社 R&D

Solr vs elasticsearch 類似文書検索（ドキュメントの登録） | Synergy LAB | シナジーマーケティング株式会社 R&D

Stanford大学の自然言語処理講座（1-1）NLPの世界へようこそ！ | Synergy Marketing LAB

Solr vs elasticsearch 類似文書検索（日本語解析の設定） | Synergy Marketing LAB

LIBLINEARで分類したい！(1) | Synergy Marketing LAB BLOG

Synergy LAB | シナジーマーケティング株式会社 R&D

UX KYOTO #05 参加レポート（構造化シナリオ法） | Synergy Marketing LAB BLOG

Stanford大学の自然言語処理講義(1-5) – Word Normalization and Stemming(単語の正規化と語幹抽出) | Synergy Marketing LAB BLOG

UX KYOTO #04 参加レポート（ペルソナ／シナリオ法） | Synergy Marketing LAB BLOG

UX KYOTO #06 参加レポート（ペーパープロトタイピング） | Synergy Marketing LAB BLOG

ベイジアンネットワーク勉強会-確率伝播その1 | Synergy Marketing LAB BLOG

機械学習(4) – スタンフォード大学の講義から | Synergy Marketing LAB BLOG

時計仕掛けのHeroku | Synergy Marketing LAB BLOG

機械学習(2) – スタンフォード大学の講義から | Synergy Marketing LAB BLOG

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『Synergy LAB | シナジーマーケティング株式会社 R&D』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません