タグ

ブックマーク / aial.shiroyagi.co.jp (5)

  • Word2Vecを使ったトピックトレンドの抽出 | カメリオ開発者ブログ

    こんにちは。データ解析担当の柴田です。 このたびNikkeiBPさんと強力でテキストマイニングのビジュアライゼーション作成のための分析を行いましたので、ご紹介します。ごく基的な手法に最新の手法を加えることで、一段興味深い分析結果を出すことが出来ました。 ビジュアライゼーションへのリンクはこちら 背景:「ウェアラブル」のトレンドってどう変化してきたの? 今回NikkeiBPさんからご相談を受けたのは日経ビッグデータにて毎月一回行われているコーナー、「今月のビジュアライゼーション」向けの分析です。今回頂いたお台は、「ウェアラブル」。今月はApple Watchの発表もあり、大きく盛り上がっているテーマです。今回日経BPさんの記事を元に、このテーマでどのようなトレンドの変遷があったのか、ビジュアライズしたい、というお代を頂きました。 データ: 頂いたデータは、日経BPの1999-2014までの

    Word2Vecを使ったトピックトレンドの抽出 | カメリオ開発者ブログ
  • 白ヤギコーポレーション 最先端情報吸収研究所 カメリオ開発者ブログ

    エンジニアの谷田です。 最大内積探索問題(Maximum Inner Product Search, 以下MIPS)ってご存知でしょうか?データベースに登録された多くのアイテムのベクトルのうち、クエリのベクトルとの内積を最大化するアイテムを探す問題です。行列分解を用いてユーザにアイテムをレコメンドするときなど、この探索が問題になってくることがあります。 MI […]

    yuiseki
    yuiseki 2015/08/04
  • トピックモデルに基づく多様性の定量化 | カメリオ開発者ブログ

    こんにちは、シバタアキラ(@punkphysicist)です。 明日NikkeiBPさんから発売予定の「図解と数字で説得する! データプレゼンテーションの教科書」の�記事のために、自然言語処理を使った分析をさせていただきましたのでご紹介させていただきます。こんなビジュアルのかっこいい分析です。 今回ご協力させていただいたにご興味をお持ちの方は下記からお探し頂けます!下記日経BPさんのご紹介 得られた答えや発見を図解やビジュアルの形で分かりやすく示す「プレゼンテーション」能力も身に付ける必要に迫られて います。そこで、図解を使ってメッセージを分かりやすく伝える方法論から、最先端のデータビジュアライゼーションの現状までを盛り込んだムック「データプレゼンテーションの教科書」の一部を公開します。これこそデータを魅せるワザを習得できるベストプラクティスです。 今回のお題は「多様性」です。今年もいろ

    トピックモデルに基づく多様性の定量化 | カメリオ開発者ブログ
  • 自動要約アルゴリズムを公開しました! | カメリオ開発者ブログ

    要点から言うと、この度試験的に自動要約サービスを公開しました。画像をクリックしてGo! こんにちは、白ヤギの自然言語処理見習い、シバタアキラです。忙しい時に余計なことを聞かされると、イラっとクルものです。「いいから要点にまとめてくれない?」とか、夫婦間でいうのはあまりオススメしませんが、職場ではよく聞かれるのではないでしょうか。戦略コンサルティング会社は「3っつで言うと」とよく言うことでも知られているように、要点をまとめてササッと話せる人を大量生産しており、実際に重要なポイントをコンサイスに表現できる人は「よく出来る」ということになるわけです。 アルゴリズムによる自動要約の研究は最近始まったものではなく、既に10年以上の研究がなされており、理論的にも体型だって論じられているようです。自然言語処理学会では、各種の問題に対してアルゴリズムの公募が行われていますが、2007/2008年にはNIS

    自動要約アルゴリズムを公開しました! | カメリオ開発者ブログ
  • ディープラーニングを使ったイメージの切り抜き | カメリオ開発者ブログ

    こんにちは、シバタアキラです。この度PyDataの家であるアメリカのコミュニティーで半年に一度開催されているPyDataカンファレンスに出席するため、NYCに行って来ました。11/22-11/23の二日間の日程で行われ、延べ250人ほどが参加したイベントです。その時の模様は、先日のPyData Tokyo第二回ミートアップでもご説明させていただき、また後日記事化されると思いますので、そちらをぜひご覧いただければと思います。 今回はそのPyData NYCカンファレンスで私が発表してきたミニプロジェクトについてお話します。最近各所で話題に上がるディープラーニングですが、これを使った応用を「カメリオ」のサービス向上のために使えないか、というのがそもそものプロジェクトの着想でした。今回PyData Tokyoオーガナイザーとして、またディープラーニングで色々と面白い実験をしている田中さん(@a

    ディープラーニングを使ったイメージの切り抜き | カメリオ開発者ブログ
  • 1