タグ

marketingとlinguisticsに関するsstのブックマーク (3)

  • 社内セミナーで形態素解析について話しました

    持ち回りの社内セミナーが自分の番になったので、形態素解析についてまとめてみて、発表しました。係り受け解析入門に引き続き、自然言語処理チュートリアルシリーズ第2弾になります。結構ボリュームがあって、力作になってます。 今回の狙いは3つくらいありました。 ひとつは自分自身昔の文献などを読んだことがなかったので読んでみたこと。見ると、昔は多くの論文を企業の人が書いていて驚きます。初期の文献で引用したものはほとんどが企業系研究者の方の論文です。日本語入力の文脈で研究されていたからなのかな、という気がします。 もうひとつは現在の問題点と問題意識をまとめる。書いたとおり、アプリケーションに対して最適なことをすべき、という思いがあります。それは単にアプリケーションごとに形態素解析器を作るべき、ということではないです。そもそも形態素解析というソリューションは適切ですか?という問いかけです。実際に弊社では、

  • Webサイトの構成・文書作成のコツは「パラレリズム」:日経ビジネスオンライン

    3月17日現在、一冊のの入稿を終えて、この原稿を書いているところです。この編集作業をしていた時、Webサイトや社内文書でも、似たような間違いを犯しているのでは? と感じるポイントに気付いたのです。それは、単純なようで見落としがちなことでした。 「配慮」も最後までできていないならバツ 原稿執筆を依頼した著者さんから、シンクタンクや政府などの調査結果を掲載してほしいとデータを受け取りました。例えば、小売業の市場シェアに関するデータで、原稿に合わせる形で7種類あったのですが、そのうち2種類だけに調査した年月日が書かれていたのです。 そこで「あのー、残りの5種類も年月日をもらえないですかね?」とお願いしました。「パラレリズム」が最後まで守られていなかったからです。 パラレリズムというのは、「並列」という意味。テクニカルライティングなどでは、よく知られている手法で、内容的に並列するパラグラフや章で

    sst
    sst 2009/03/23
    読み手は、物事が並列してあるのを見ると、そこには同じ種類のものが同じ形で並んでいるだろうという「メンタルモデル」を作って予測します。それによって、後続する情報の理解が早まります。
  • 自由回答データを定量的な切り口で分析するには? ― @IT情報マネジメント

    Webなどを通じて、顧客や利用者の意見を集めることが簡単にできるようになってきた。しかし、非定型の自由回答データは非常に有意義な意見を得ることができる反面、分析するのに手間が掛かる。手軽に定量分析する方法はないだろうか? Webや電子メール、ケータイの普及で、幅広くさまざまな意見を募ることが安上がりにできるようになってきました。最近ではブログやSNSなどのCGMと呼ばれる口コミ系メディアも花盛りです。 Webアンケートも広く行われていますが、アンケートの回答は「出題側の仮説に影響される」という制約があり、“意外な発見”にはなかなか結び付きません。 一方、メールなどで寄せられる自由回答や意見・要望はそうした制約もなく、何かビジネスのヒントがありそうですが定量的な分析ができないという弱みがあります。せいぜい分析者が文章を読んで主観的に解釈するぐらいにしか活用していないのではないでしょうか? あ

    sst
    sst 2006/12/05
    アンケートなどの自由回答について、、品詞・コンコーダンス・特定属性の回答を抽出、などができる
  • 1