タグ

miningに関するdrumscoのブックマーク (5)

  • 『最適化』という魔法の言葉 - dataminer.me

    はじめに データマイニングの仕事をやっているとよく『最適化』という言葉に出くわすことがある。例えば、『データマイニングの技術を使って広告効果を最適化してます』とか『うちのゲームデータ分析によってユーザーに対して最適なコンテンツを出し分けている』とか。 自分も困ると『データマイニングにより最適化を行ってます』と話しちゃうことが多い。そりゃ「最適化=最も適した状態にすること」なんだから話を聞いた相手もぐうの音も出ないから相手を説得しやすい。 でも、最適化って「どう最適化するか=データマイニング技術」よりも「何を最適化するか=何をKPIにするか」の方がお金儲けに直結するし、そここそがデータマイニングのコアになっていることが多いと思うので、それに関する個人的な意見。 例として広告における最適化 「CPA最適化」とか「CTR最適化」とか。ネット上でとれる数値に対して最適って言う文脈で出ることが多い

    『最適化』という魔法の言葉 - dataminer.me
  • Orange Data Mining

    Data Mining Fruitful and FunOpen source machine learning and data visualization. Download Orange 3.37.0 May 30, 2024 Document embeddings vs. Bag of wordsWhen to use document embeddings instead of a bag of words. May 14, 2024 Orange Data Mining uses the fastest t-SNE implementation in PythonJournal of Statistical Software published a paper describing our state-of-the-art implementation openTSNE. Ap

  • Aho Corasick 法 - naoyaのはてなダイアリー

    適当な単語群を含む辞書があったとします。「京都の高倉二条に美味しいつけ麺のお店がある」*1という文章が入力として与えられたとき、この文章中に含まれる辞書中のキーワードを抽出したい、ということがあります。例えば辞書に「京都」「高倉二条」「つけ麺」「店」という単語が含まれていた場合には、これらの単語(と出現位置)が入力に対しての出力になります。 この類の処理は、任意の開始位置から部分一致する辞書中のキーワードをすべて取り出す処理、ということで「共通接頭辞検索 (Common Prefix Search)」などと呼ばれるそうです。形態素解析Wikipediaはてなキーワードのキーワードリンク処理などが代表的な応用例です。 Aho Corasick 法 任意のテキストから辞書に含まれるキーワードをすべて抽出するという処理の実現方法は色々とあります。Aho Corasick 法はその方法のひと

    Aho Corasick 法 - naoyaのはてなダイアリー
  • [を] テキストマイニングを使う技術/作る技術

    テキストマイニングを使う技術/作る技術 2006-12-28-3 [書評・感想] テキストマイニングの分野で有名なIBMの那須川哲哉氏による入門書。 全編具体的で分かりやすい。 ■那須川哲哉 / テキストマイニングを使う技術/作る技術 ―基礎技術と適用事例から導く質と活用法 テキストマイニングというと、ブログや掲示板での特定の何かの評判情報 検索など、近年その活躍の場が一般ユーザの目に付くところまで広がって 来ている。 このはテキストマイニングを支える技術、事例紹介、技術以外の側面 (運用など)はもちろん、「テキストマイニングとは何か」ということ についても初心者にも分かりやすいよう、かなり丁寧に解説されている。 一番重要なポイントが最初の方で述べられてる。これ、大切。 [...]テキストマイニングというものは、あくまで人間が膨大な文書データ を有効活用するた

  • KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

    概要と特長 KH Coderとは、計量テキスト分析またはテキストマイニングのための自由ソフトウェアです。 アンケートの自由記述・インタビュー記録・新聞記事など、さまざまなテキストの分析にお使いいただけます。 プログラミング不要、マウス操作で格的な分析 安心の分析プロセス完全公開、研究利用も多数 New! 機能紹介(スクリーンショット) スクリーンショット集 [旧ページ:言葉・文書・可視化・他] KH Coder 3 正式版の新機能 New! 機能追加プラグイン「文錦®」シリーズ New! ダウンロードと使い方 KH Coder 3 正式版ダウンロード (Version 3.02) 使い方を知るためのチュートリアル ヘルプ 質問&エラー報告用の掲示板 ※投稿にはGitHubへの登録が必要(無料)[旧掲示板] よくある質問(FAQ) 開発者が語る公式セミナー & サポート:㈱SCREEN A

    drumsco
    drumsco 2006/12/05
    内容分析(計量テキスト分析),テキストマイニングのためのツール
  • 1