タグ

分析に関するmkawanoのブックマーク (18)

  • チャットデータ分析で捉える、コーチのポジティブ発言の重要性 - Quipper Product Team Blog

    はじめに みなさんこんにちは。データ分析グループでインターンをしています丹田 (@JinTanda)です。 今回、スタディサプリの合格特訓コースにおける、『コーチの声掛けと学習継続の関係性』を自然言語処理の観点から分析しましたので、ご紹介いたします。 概要 スタディサプリには『合格特訓コース』という、コーチが生徒の勉強計画やモチベーション向上、勉強に関わる種々の悩み事の解決をテキストチャットを通してサポートするプランがあります。 「コーチのどのような発言が生徒との良い関係性を築き、学習行動を促すことができるか」というのは生徒の継続的な学習を実現するために重要な分析軸です。 これまでのサービス運営の経験から、コーチのポジティブな発言が重要であるという仮説はあったものの確証は得られていませんでした。 そこで今回、コーチの発言からポジティブな単語を取り上げ生徒の学習継続率との関係性を分析したとこ

    チャットデータ分析で捉える、コーチのポジティブ発言の重要性 - Quipper Product Team Blog
  • 創業140年の古い会社でデータの民主化を進めた話 / nikkei data driven 20180823

    THE GUILD勉強会 #03「データ×UXデザイン」資料 データ分析のトレーニング「データ道場」など日経のデータドリブン関連の施策について

    創業140年の古い会社でデータの民主化を進めた話 / nikkei data driven 20180823
  • HIP HOPでわかるネットワーク分析

    自己紹介 みなさん、はじめまして。 Aidemy 研修生の 加藤正義 (加藤正義 (@Kato_Justice) | Twitter) です。昔はテレビ東大生として、時々バラエティ番組とかに出ていました。 〈●〉EYE-CATCH〈●〉 フィーチャリング関係で繋がった日語ラッパーのコミュニティをグラフ化すると、以下のような構造をしている。 ノードの色は派閥を表し、媒介中心性が大きいほどノードのサイズが大きい。ラッパーの派閥は フリースタイルダンジョン組 KGDR + RHYMESTER + 愛国ラッパー達 (韻が固い) 独立したその他ユニット という具合で分かれた。 媒介中心性の最も高いラッパーはKEN THE 390だった。 ラッパーは好き嫌いが激しい 突然ですが、僕は日語ラップが好きです。しかし、当のラッパー同士がお互いのことを無条件で好きかというと、どうやらそうではないようです。

    HIP HOPでわかるネットワーク分析
  • マンションポエム徹底分析!

    マンションポエム。それはマンション広告にちりばめられた詩的キャッチコピー。 折り込みチラシや、駅や電車内の広告などでよく見かけると思う。「洗練の高台に、上質がそびえる」(「プラウドタワー白金台」野村不動産より)といったあの名調子のことだ。 このマンションポエム観察をライフワークにしているぼく。今回はさらに踏み込んだ分析をしてみよう。

    マンションポエム徹底分析!
  • 互助会の構造をGephiで可視化してみる - ゆとりずむ

    こんにちは、らくからちゃです。 以前ぶらっとインターネットをぶらぶらしていたら、こんな記事を見つけました。 『パナマ文書』の問題については、いいなー偉い人は沢山お金持っててさー、と遠い世界の話にしか感じられませんでしたが、解析手法については中々興味深いお話でした。 今回の流出事件では、2.6TBもの大量のデジタルデータが流出されたと言われています。しかし、このデータの中から、資金の流れの関連性を分析していくのは、人力では不可能に近い作業です。そこで今回力を発揮したのが『グラフ解析』という手法です。 グラフ解析とは何か グラフというと、折れ線であったり縦棒であったり、そういった数値を可視化するツールとしての印象をお持ちかもしれませんが、数学の用語としては様々な要素と要素の関係性を分析するツールという意味で用いられます。 つーても分かりづらいかもしれませんが、『人物相関図』のようなものと言えば

    互助会の構造をGephiで可視化してみる - ゆとりずむ
  • データ分析の「7つの進化のステップ」を今一度おさらいしてみる - 渋谷駅前で働くデータサイエンティストのブログ

    2016年最初の記事ということで、もはや1月下旬に差し掛かりつつありますがこちらでは改めて、あけましておめでとうございます&年もよろしくお願いいたします。 で、新年一発目のお題は。。。実は似たようなお題で過去にも記事を書いていますが(笑)、年も改まったことなので今一度備忘録的におさらいしてみたいと思います。観点としては、どちらかというと「これからデータ分析のカルチャーを職場に導入していくとしたらどうやってステップアップさせていくか」みたいなところです。なお過去記事はこちら。 この辺の話題を踏まえながら、過去記事リンクのオンパレードで恐縮ですがちょっと一席やってみます。なお以下に挙げる「ステージ」はあくまでも一例であり、業界によってはもっと高度な方向に展開させられる(orもっとプリミティブなレベルに留まる)こともあるので、参考程度に見てもらえればと。 特にここでは「まだデータ分析を始めてい

    データ分析の「7つの進化のステップ」を今一度おさらいしてみる - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点

    今回は「ほぼRしか使ったことがない」人間*1が、できる限り二者の優劣をくっきり述べる。 僕はほとんどRしか使ったことがない。Pythonはtfidfやクイックソートをライブラリ無しで実装した程度。 前半の主張は以下である。 「過去のRでの10回程度の解析において、Rで不十分さを感じてPythonを使った経験は1度だけ、しかも部分的にしかなかった。Rの使いにくさを感じることも最近はだいぶ無くなった。だから初学者には「事足りる」Rを勧める。」 前半の主張 今までにRでやった解析の内容は大体以下である。 (未発表)は途中で頓挫した、もしくは現在進行中/契約により詳細&解析結果の公開不可能のプロジェクトである。 [ビジネス・製造業] 米国新車価格の線形重回帰分析(授業の期末課題) [ビジネス・不動産不動産賃貸価格の線形重回帰分析(発表スライド) [ビジネス・IT] EコマースサイトのARIMA

    統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点
  • 日本戦ツイート分析|2014ワールドカップ(ブラジル大会):朝日新聞デジタル

    ※選手や監督の名前を含むツイートを収集、その中に多く出てくる言葉を分析・抽出しています。 ※ツイッターのデータは「NTTデータ」の協力で収集。東北大学大学院の乾・岡崎研究室の支援を受けて、ツイート件数、関連語、ポジ・ネガを分析しました。関連語では、意味のない文字などを除いています。 ※円グラフは、いわゆる「ポジ・ネガ分析」です。活躍を評価しているツイートを「ポジティブ」。プレー批判や交代を要求するようなツイートを「ネガティブ」。単に選手交代を紹介するなど、評価に言及しないツイートを「ニュートラル」と分類しています。 ※最新ブラウザの使用をおすすめします。お使いのブラウザによっては正しく表示されない場合があります。 ※画像のうち、遠藤、岡崎、伊野波、、ザッケローニ監督、ボニ、ヤヤ・トゥーレ、ドログバ(2枚目はAFP)、長友(2枚目)はロイター。大久保、柿谷、内田、今野、青山、酒井高、ジェルビ

    日本戦ツイート分析|2014ワールドカップ(ブラジル大会):朝日新聞デジタル
  • 1994年F1サンマリノGPにおけるアイルトン・セナ死亡事故発生のメカニズム|すがやみつる

    マンガ家。1950年、静岡県生まれ。デビュー作『仮面ライダー』(原作・石ノ森章太郎)。代表作『ゲームセンターあらし』など。85年からパソコン通信を開始。94年、小説家デビュー。2011年、早稲田大学大学院人間科学研究科修士課程修了。13~21年、京都精華大学マンガ学部教授。

    1994年F1サンマリノGPにおけるアイルトン・セナ死亡事故発生のメカニズム|すがやみつる
  • 進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!

    はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
  • 2013年東京都議選の簡単なデータ分析: 311後の日本の政治論壇

    東京都議選について簡単な分析を行ったのでここで紹介しておきたい。 自公圧勝の背景  都議選についての個人的な注目点は、現在の安倍自民党の世論調査に見られる数値上の「好調さ」がどの程度選挙結果に反映されるかである。2012年衆院選では、自民党は議席数では大勝を収めたものの、得票数などのデータは大敗を喫した2009年に比較しても悪化していた。有権者のうち比例区で自民党に投票した割合(絶対得票率)は17%以下であった。その後、株価の上昇等に代表される景気の気の部分の向上もあり、安倍内閣と自民党の支持率は高く推移している。  しかし、世論調査結果と選挙結果は単純にリンクするものではない。また内閣支持率は、政党支持が流動化している現在では乱高下しやすい状況にある(『「政治主導」の教訓』所収の拙稿参照)。世論調査だけでなく、実際の選挙結果でも、安倍自民党の支持が着実に浸透しているのかどうか、2012年

  • 「n日間移動平均」+「±2σ境界線」をExcelでプロットしてお手軽にKPIの異常値をチェックする(厳密ではないけど) - 渋谷駅前で働くデータサイエンティストのブログ

    僕の得意分野は計量時系列分析(Econometric time series analysis)なんですが、実際にソーシャルwebサービス企業でデータ分析に取り組む上ではそんなに細かいことやる必要はない、というかそこまで正確な分析をする前に実務上色々やるべきことがある、ということは結構多いです。 実際のところ、当は異常値検出・外れ値検出みたいな手法でゴリゴリやりたい(例えばyokkunsさんが提供なさっているRの{ChangeAnomalyDetection}パッケージとか、はたまた{tsDyn}パッケージでも実装されているようなSETARとか、もしくは{MSwM}パッケージでやれるマルコフ状態転換モデルとか)んですが、Rを使ってもらうだけでも一苦労という現場ではそうも言ってられないという実態もあります。 ということで、もう何もかも面倒なのでお手軽に「KPIの上がり下がりを見て『これ凄く

    「n日間移動平均」+「±2σ境界線」をExcelでプロットしてお手軽にKPIの異常値をチェックする(厳密ではないけど) - 渋谷駅前で働くデータサイエンティストのブログ
  • 文系のための「多次元データ解析」

    まずは、基的な用語と、Rでの基的なコマンドをここで学ぶ。何も知らずに、回帰分析や主成分分析、クラスター分析をするのは「無謀」というもの。気持ちは理解できなくは無いのだが。以下のトピックを見て、一つでも知らない用語があるならば、先に進まずに、最初から順にチュートリアルをこなした方が良い。また、理解できている人も、一般的な教科書とは異なった説明もある。軽く目を通した方が良いかもしれない。 文系のための「行列の構造」 文系のための「行列」(1):行列データの構造について 文系のための「行列」(2):多次元データについて 文系のための「行列」(3):行列の種類について 文系のための「行列」(4):「変数」と「添字」について 文系のための「行列の演算」 文系のための「行列の演算」:行列の「足し算」と「引き算」 文系のための「内積」(1):行列の「掛け算」の方法 文系のための「内積」(2):行列の

    文系のための「多次元データ解析」
  • SYNODOS JOURNAL : 自民党はなぜ勝利したのか 善教将大・坂本治也

    2013/1/189:0 自民党はなぜ勝利したのか 善教将大・坂治也 1. はじめに 2012年12月16日に投開票が行われた衆議院議員総選挙は、自民党の圧勝で幕を閉じた。自民党の比例区における得票数は16,624,457票(相対得票率27.6%)と、得票数第2位の日維新の会(12,262,228票[20.4%])とそれほど大きな差があるわけではなかったが、小選挙区では擁立した候補者288名のうち237名が当選するという、まさに圧勝と呼び得る結果となった。 もっとも、この結果について、多少なりとも違和感を覚えた人はそれなりに多くいるのではないだろうか。たしかに自民党が勝利することは、選挙前の報道内容などから十分に予測できることではあった。民主党への支持が選挙直前に急激に回復した兆候は見られなかったし、日維新の会や日未来の党など「第3極」と呼ばれる政党も選挙に向けての事前準備が十分整

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • 少人数学級が学力向上に寄与するかの話 - 発声練習

    追記:「経済学が〜」と思われた方はぜひリンクしてある「文部科学省:2011年7月:公立義務教育諸学校の学級規模及び教職員配置の適正化に関する検討会議(第3回) 議事録」の前半部を読まれることをお勧めします。参考人として呼ばれた方々もこれは測定自体が難しい話ですと言っています。 NHKニュース:“教職員定数 5年で1万人削減”案のはてなブックマークコメント いや、財務省はあながちウソ言ってない。少人数学級化だと、上位学力層の競争が緩み、上位学力層が劣化する副作用がある(クラスサイズパズルと言う)。経済学者が立証してるが教育学者は認めたがらない を読み、Googleでクラスサイズパズルを検索したら以下の議事録が見つかった。簡単な話ではないらしい。 文部科学省:2011年7月:公立義務教育諸学校の学級規模及び教職員配置の適正化に関する検討会議(第3回) 議事録 少人数学級というのは、当然ながら、

    少人数学級が学力向上に寄与するかの話 - 発声練習
  • 「武雄市Facebookページ分析」を分析してみたよ  Hatelabo::AnonymousDiary 2012-04-19

    佐賀県武雄市が市のホームページを廃止し、Facebookページに移行したのは去年の8月のことだ。 ソーシャルメディアを活用した先進的な取り組みとして賞賛される一方で、当に市民サービスにつながるのかという懐疑の声も多かった。 今回、Facebookへの移行に関する分析レポートが発表された。 武雄市Facebookページ分析から見られる、自治体がソーシャルメディアで実現できること http://archive.is/46Fh6 このレポートの内容は妥当なのかを分析してみる。 移行後半年で目的を達成武雄市が市のホームページをFacebookページに移設した目的は、以下の4つだそうだ。 1.市職員と市民がコミュニケーションを取る機会を設け、両者をつなげていく。(インタラクション性) 2.市の活動や施策などの情報を、素早く発信し、市民に限らず広く拡散する(拡散性) 3.SNSを使って広く誰でも見せ

    「武雄市Facebookページ分析」を分析してみたよ  Hatelabo::AnonymousDiary 2012-04-19
  • 質的研究と量的研究について - 社会学者の研究メモ

    とある出版企画でそういうお話を書かなければいけないので、社会学におけるいわゆる「質的研究」と「量的研究」の区別についてメモを書いておく。 結論から言うと、次のように考えるとミスリーディングである。つまり、「まずある<理論>があって、それを<実証>する手段として質的な研究と量的な研究がある」という考えである。こういう考え方は、混乱のもとであるから、避けたほうがよい。多くの社会調査論のテキストでは調査手段の選択として「質的調査」と「量的調査」を選択することがあるかのように書かれているが、少々説明不足である。そうではなく、さしあたり量的研究とその他のタイプの研究が、量的研究とどのような関係にあるのか、と考えたほうがスッキリする。 分野外の研究者からすれば見えにくいが、実際には量的研究と言っても様々である。が、現状からして、「複数のパラメータを含むモデルを構築し、それをデータに当てはめて統計学的推

    質的研究と量的研究について - 社会学者の研究メモ
  • 1