タグ

2011年9月7日のブックマーク (6件)

  • HTMLテキスト抽出ツール

    ■ 説明 「WebTextClip」はインターネットからHTMLデータを読込んで効率良くテキストデータを抽出するソフトです。テキストの抽出は内部に組込んだスクリプト言語によって行うので、よくある掲示板巡回ソフトのようなキーワード登録方式より自由度が高くプラグイン方式ほど敷居は高くありません。しかもテキスト抽出に最適化した組込み関数を豊富に持っているので、簡単な構成のサイトであればほんの十数行程度で誰でも巡回用スクリプトを作成できます。 ※アーカイブにはいくつかのニュースサイトと掲示板スクリプトが同梱してあります。参考にしてどんどんスクリプトを作成してみて下さい。 【特徴】 Pascal言語ライクなWEBアクセスとテキスト抽出に最適化したスクリプト言語「WASABI(わさび)」を搭載 掲示板・ニュース・日記・時刻表など種類を選ばずテキストデータを簡単ゲット! ツリー・スレッド表示に対応したメ

  • [ThinkIT] 第1回:テキストマイニングとは (1/3)

    近年多くの企業において、様々なチャネルから集めた顧客からの直接の問い合わせやクレームをデータベースに蓄積することが可能となっている。この蓄積された膨大なテキストデータのデータベースについて、その傾向と変化を把握し、戦略の確認・検証、課題の発見、さらには解決するための施策を抽出する分析を行うことがテキストマイニングだ。 連載では、顧客の声(テキストデータ・定性情報)を分析するテキストマイニングという技術・ツールについて紹介していく。扱うテーマとしては、企業に集まる顧客の声や声の活用状況とテキストマイニング技術、成功事例と失敗しないためのポイントなどを取り上げていく。 さて、連載の原稿を書くために、筆者はとあるファンミリーレストランに立ち寄った。店内に入ると、店員呼び出しベルの横にあったハガキサイズの用紙にふと目がとまった。そこには、こう書かれていたのである。 「お客様の声をお聞かせくださ

  • RMeCab - アールメカブ

    _ 基 2022 年 05 月 02 日 RMeCab_1.10 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2022 年 04 月 29 日 RMeCab_1.08 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2021 年 11 月 27 日 M1 MacOSX 用の注意を追記 2021 年 05 月 27 日 RMeCab_1.07 for R-4.1.0 (M1 Mac 用バイナリを追加で作成) 公開 2021 年 01 月 11 日 RMeCab_1.06 for R-4.0.3 (MacおよびLinuxでは辞書としてneologdを指定できるようになりました) 公開 R と MeCab? (ただしWindowsでは64bit UTF-8辞書版)の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すればRMe

  • KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

    概要と特長 KH Coderとは、計量テキスト分析またはテキストマイニングのための自由ソフトウェアです。 アンケートの自由記述・インタビュー記録・新聞記事など、さまざまなテキストの分析にお使いいただけます。 プログラミング不要、マウス操作で格的な分析 安心の分析プロセス完全公開、研究利用も多数 New! 機能紹介(スクリーンショット) スクリーンショット集 [旧ページ:言葉・文書・可視化・他] KH Coder 3 正式版の新機能 New! 機能追加プラグイン「文錦®」シリーズ New! ダウンロードと使い方 KH Coder 3 正式版ダウンロード (Version 3.02) 使い方を知るためのチュートリアル ヘルプ 質問&エラー報告用の掲示板 ※投稿にはGitHubへの登録が必要(無料)[旧掲示板] よくある質問(FAQ) 開発者が語る公式セミナー & サポート:㈱SCREEN A

    miya1972
    miya1972 2011/09/07
    内容分析(計量テキスト分析)もしくはテキストマイニングのためのフリーソフトウェア。
  • テキストマイニングのフリーツール: 知財ファイナンス・モデリング

    (共起ネットワークの図。関連する単語がグラフネットワークで見える化されている。) 久々の更新になってしまった。今回は小生の専門であるテキストマイニングについて少しだけ。 今関わっているプロジェクトの関係でテキストマイニングをちょっとやることになった。テキストマイニングをやるためのツールは結構充実している。しかも、便利なツールがフリーで使えてしまうのである。かつては、SASのような年間数百万円もする高価なソフトを使わなければならなかったので、今はその意味でとても恵まれている。 高価なSASの代わりに爆発的に流行ってきているのがRである。このソフトはオープンソースであり、しかも最新の統計やマイニングに関する関数が素早く提供される。ある意味では既にSASよりも優れているという専門家もいるくらいだ。これを使って遊んでみない手はない。 Rを使って日語のテキストマイニングもできるようになってきた。阪

    テキストマイニングのフリーツール: 知財ファイナンス・モデリング
  • 「炎上」のターゲットになりやすい業界・業種とは? 日経デジタルマーケティング

    トップページ > 失敗に学ぶ 「炎上」のターゲットになりやすい業界・業種とは? シリーズ:ソーシャルメディア炎上事件簿【第2回】 このところ、従業員個人のアカウントからの不適切な投稿で“炎上”するケースが多発している。悪意がないだけに始末が悪い。所属企業が特定されると、ネット上の抗議は企業に押し寄せる。従業員サイド、企業サイドそれぞれに自衛対策が急務となっている。 シリーズ第1回 「ソーシャルメディアガイドライン2.0」、従業員発の炎上トラブルに対処急務 シリーズ第3回 炎上防衛のQ&A 炎上からの失地回復、ベストケースはどこ? シリーズ第4回 炎上防衛のQ&A 炎上、公式アカウントの運用は当面見合わせるべき? シリーズ第2回は、Q&A形式で炎上の原因や「なりすまし」回避の方法などを紹介する。 Q.「炎上」のターゲットになりやすい企業はありますか?@それはどんな業界・業種でしょうか?@なぜ