タグ

2015年4月2日のブックマーク (21件)

  • 前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ

    実は僕は結構頻繁に{arules}パッケージを使うんですが*1、個人的には汎用性を考えて必ず素性ベクトルの形になるようにデータを前処理して読み込むようにしています。例えばこんな感じ。 ビール ソーセージ 牛肉 ... 1 0 1 ... 0 1 0 ... 1 1 1 ... ... ... ... ... なのですが、場合によっては前処理なしでただベタっとアイテムリストが個々のトランザクションごとに並んでるだけのデータを扱わなきゃいけないことも多いと思います。つまり、こんな感じのデータです。 ビール, 牛肉 ソーセージ ビール, ソーセージ, 牛肉 ... こういう場合、素性ベクトルの形に直そうとすると際限なくカラム方向に伸びていってしまうことが多く、前処理自体が非常に厄介になったりします。そこで、そういう時に出来る限り面倒な操作をせずに{arules}パッケージで扱える形に読み込む方法

    前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ
    ichi2410
    ichi2410 2015/04/02
  • キャッチ! 解説委員記事 - キャッチ!世界のトップニュース

    2024年7月3日 (水) イランで、先月28日、大統領選挙の投票が行われ、欧米との対話を重視する改革派のペゼシュキアン候補と、欧米との対決姿勢を鮮明にしている保守強硬派のジャリリ候補による決選投票が5日、今週金曜日に行われることになりました。どちらが当選するかは、イラン核合意の行方も左右するものとして、注目されます。 中東情勢担当の出川展恒解説委員とお伝えします。 Q1: イランと言えば、大統領ではなく、最高指導者が、すべてを決める国と思われますが、今回の選挙が注目されているのはなぜですか A1: 確かに、イスラム共和制のイランでは、大統領は、絶大な権限を握る最高指導者に次ぐ...記事を見る 6月19日(水) 6月20日は「世界難民の日」です。 世界では迫害や紛争から逃れ、国際的な保護を求めている人は1億2000万人を超えました。難民たちをいかに救うか、日をはじめ国際社会全体の喫緊の課

    キャッチ! 解説委員記事 - キャッチ!世界のトップニュース
    ichi2410
    ichi2410 2015/04/02
  • 外国人旅行者 すしやラーメン楽しむ NHKニュース

    観光庁が日を訪れた外国人旅行者の動向をツイッターのつぶやきなどを通して調べた結果、すしに加え、ラーメンを楽しんでいることが分かりました。 それによりますと、多くの外国人旅行者は、関東・中部・関西圏を移動し、東京や大阪などを巡るいわゆる「ゴールデンルート」に集中しているということです。またツイッターでは、べることに関連して「sushi(スシ)」のつぶやきが最も多く、2番目の「dinner(ディナー)」に次いで、3番目に「ramen(ラーメン)」が多くつぶやかれていることが分かりました。さらに、東京の秋葉原を訪れた人は、「anime(アニメ)」や、「maidcafe(メイドカフェ)」のほか、中古のゲームソフトなどを販売する店の名前などのつぶやきが多く、外国人旅行者が日のいわゆる「オタク文化」に興味を持っていることをうかがわせています。 このほか土産物の関連では、外国人旅行者に抹茶風味が人

    ichi2410
    ichi2410 2015/04/02
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
    ichi2410
    ichi2410 2015/04/02
  • アソシエーション分析+グラフ構造可視化 ({arules} + {arulesViz}) で教師あり学習の変数重要度を可視化する - 渋谷駅前で働くデータサイエンティストのブログ

    グローバルTokyoRで何話そうかなー、と思っていたんですがそう言えば主賓がvisualizationの人なんだったっけなぁということで、可視化の話にでもしようかなと。ということで、僕の大好きなネタでもやろうかと思います。 それは、「とにかく{arules} + {arulsViz}で可視化してしまえ」戦略。基的に世の中のデータマイニングにせよ分類問題にせよ、実は様々な説明変数の共起(?)関係で表せることが多く*1、そういう時は何だかんだでassociation rulesを使うのが一番手っ取り早いんですよね。僕自身の勉強不足を補う目的からも(汗)、ちょっと書いてみようと思います。 アイテム間の条件付き確率たくさん→ベイジアンネットワークもどき→有向非循環グラフ 基的に、association rulesはアイテム間の共起確率をある状態に対する条件付き確率として出すものです*2。そして

    アソシエーション分析+グラフ構造可視化 ({arules} + {arulesViz}) で教師あり学習の変数重要度を可視化する - 渋谷駅前で働くデータサイエンティストのブログ
    ichi2410
    ichi2410 2015/04/02
  • 足掛け3年の集大成「もう間違われてもいい」昭文社×旺文社コラボ

    「請求書が間違えて送られてくるんですよ」 「就職説明会で間違えて出席されるなんていうのはもうデフォですね。そのまま入社した社員もいますから」 ここまで名前を間違われやすい出版社がほかにあっただろうか。そう、一部の人にはもはや恒例のネタとなっている昭文社と旺文社の話だ。 両社は2013年から、間違われることをネタにしたコラボ企画「どっちがどっち?」キャンペーンを展開。2014年のエイプリルフールには、Twitterのアカウントはそのままにアイコンのみを入れ替えてつぶやき、多くの人を混乱の渦に陥れた(関連記事)。 2015年も同様の取り組みを実施中。旺文社はガイドブックを発行する昭文社らしく山形旅行の様子を一日かけてツイート。昭文社は旺文社が提供している英単語学習アプリを使って勉強する様子をツイートしていくとのこと。 地図やガイドブックで知られる昭文社と、教科書や参考書で知られる旺文社。ジャン

    足掛け3年の集大成「もう間違われてもいい」昭文社×旺文社コラボ
    ichi2410
    ichi2410 2015/04/02
  • R {arules} によるアソシエーション分析をちょっと詳しく <1> - StatsFragments

    今週は系列パターンマイニング用 R パッケージ {arulesSequences} と格闘していた。使い方にところどころよくわからないポイントがあり、思ったよりも時間がかかってしまった。 関連パッケージである {arules} ともども、ネットには簡単な分析についての情報はあるが、 データの作り方/操作についてはまとまったものがないようだ。とりあえず自分が調べたことをまとめておきたい。2 パッケージで結構なボリュームになるため、全 4 記事分くらいの予定。 概要 まずはパターンマイニングの手法を簡単に整理する。いずれもトランザクションと呼ばれるデータの系列を対象にする。トランザクションとは 1レコード中に複数の要素 (アイテム) を含むもの。例えば、 POSデータ: 1トランザクション = POSレジの売上 1回。アイテムはそのときに売れた個々の商品。 アンケート調査: 1トランザクション

    R {arules} によるアソシエーション分析をちょっと詳しく <1> - StatsFragments
    ichi2410
    ichi2410 2015/04/02
  • Rで文字列を日付時刻型に変換する

    日付時刻と観測値が対応付いたデータってありますよね。例えば、原子力規制委員会が公開している放射線モニタリング情報だと下記のようなCSV形式で、測定時刻と測定値が対応付いています。 V5, V6 2014/12/26 23:50, 0.033 2014/12/26 23:40, 0.034 2014/12/26 23:30, 0.033 ................, ..... こういうデータを見ると、V5を横軸、V6を縦軸にして時系列グラフを描きたくなりますよね。でも、V5が文字列型で読み込まれていると、そのままplotのx軸に指定してもうまくいきません。 日付や時刻を表現する型に変換してやる必要があります。 上記のような書式(日付がスラッシュ、時刻がコロン)ならば、POSIXlt関数に引数で渡すだけで、簡単に変換することができます。 > as.POSIXlt("2014/12/26

    ichi2410
    ichi2410 2015/04/02
  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

    ichi2410
    ichi2410 2015/04/02
  • アソシエーション分析可視化パッケージarulesViz - Analyze IT.

    最近転職して、Rをメインで使用しています。(弊社のR使用率はなんと100%!) 今後も仕事を通じてRの普及と進歩に貢献していきたいと考えています。 今回の記事の更新はRAdventCalendar2012の一貫として更新しています。 ハッシュタグは#RAdventJPですので、こちらもぜひチェックしてみてください。 早くビールが飲みたいので、今日はアソシエーション分析の結果を可視化するパッケージのarulesVizの紹介をしてお茶を濁したいと思います。 アソシエーション分析とはなんぞやとかRでのアソシエーション分析の使い方については、Tokyo.R #22の発表資料が大変よくまとまっていてわかりやすいので、こちらをご覧になってください。これを読めばアソシエーション分析については基を抑えることが出来ると思います。アソシエーション分析について知らない方はこの記事を読む前にこちらをご覧になって

    アソシエーション分析可視化パッケージarulesViz - Analyze IT.
    ichi2410
    ichi2410 2015/04/02
  • アソシエーション分析(1)

    アソシエーション分析(associations analysis)は、百貨店や店舗などで集めている表1のようなトランザクションデータを活用するために、バスケットの中の商品間の関連性について分析を行う方法である。アソシエーション分析は、表1に示すような、トランザクションデータから、頻出するアイテムの組み合わせの規則を漏れなく抽出し、その中から興味深い結果を探し出すことを主な目的とする。 アソシエーション分析は、1990年代初めに英国の有力百貨店マークス&スペンサーの店舗で集めているデータの活用に関して相談を受けたことをきっかけとして、IBM研究所が研究を始め、Apriori(アプリオリ)というアルゴリズムを開発したと言われている。Aprioriアルゴリズムは、巨大なデータベースからアソシエーションルール(associations rules)を抽出することを実現し、データマインニングの実用

    ichi2410
    ichi2410 2015/04/02
  • 新社会人必須。Chrome拡張「社会人ブラウザ」 – なかよしインターネッツ

    いつまでも学生ノリが抜けずに目的もなくダラダラとインターネットで遊び、人生という何物にも代えられない貴重な時間をドブに捨て文句だけはいっちょまえに言って他人の足を引っ張ることに夢中なみなさんを矯正し圧倒的な成長を実現することができる無料のChrome拡張が『社会人ブラウザ』です。 社会人ブラウザ – Chrome ウェブストア https://chrome.google.com/webstore/detail/%E7%A4%BE%E4%BC%9A%E4%BA%BA%E3%83%96%E3%83%A9%E3%82%A6%E3%82%B6/ldaamcmpjjabpmmopdjknbobifnkbhhd この革命的な「社会人ブラウザ」をインストールするには「Chromeに追加」をクリック。 「追加」をクリック。これでインストールは完了です。 すると新しいタブを開くごとに胸に刻むべき至極のメッセ

    新社会人必須。Chrome拡張「社会人ブラウザ」 – なかよしインターネッツ
    ichi2410
    ichi2410 2015/04/02
  • これは便利!Homebrewに追加されたtapコマンドはリポジトリを追加して簡単にフォーミュラを増やせる | Macとかの雑記帳

    Homebrewに「tap」というコマンドが追加されました。このコマンドを使う事で、公式以外でフォーミュラを公開していたリポジトリをhomebrewの中に取り込むことができ、$ brewコマンドで扱えるようになります。 これにより今までhomebrewにはなかったvimやApache、phpといったフォーミュラを簡単に追加できるようになりました。また、自分のgithubアカウントにアップしているフォーミュラがある場合は、それも取り込むことができます。 brew tap の使い方 今回追加されたのは、tapとuntapの2つです。 tapはリポジトリを追加し、untapは追加した特定のリポジトリを削除するコマンドです。使い方は以下になります。

    これは便利!Homebrewに追加されたtapコマンドはリポジトリを追加して簡単にフォーミュラを増やせる | Macとかの雑記帳
    ichi2410
    ichi2410 2015/04/02
  • brew doctorの /usr/bin occurs before /usr/local/binにはまったときの解決法

    brew doctorするとはまる 以下エラーメッセージ Error: /usr/bin occurs before /usr/local/bin This means that system-provided programs will be used instead...

    ichi2410
    ichi2410 2015/04/02
  • 株式会社 闇

    このサイトでは不可解なことが起こ🅒呪🅗ノ?ります弊社は責任ヲをぉぉオ🅘負い🅞タ?スケ?@かねますの㊰で予Жめご了承 くださいこのサイト🅡タス@ケ??け🅘ては呪Жワレています。🅚タ@助け🅞ケてノ¶@呪ワレ¶れて🅚いま🅞@す殺🅝?呪う呪う呪ウ呪ヲ呪うウウ?🅘ヲ?🅘🅡タスケて?🅤

    株式会社 闇
    ichi2410
    ichi2410 2015/04/02
  • あなたの知らないインターネットの世界

    普段、何気なく使っているインターネット。実はその裏側では、さまざまな仕組みが動いています。身近なようでいて、意外と奥が深い。インターネットの基盤を支える私たちJPRSが、その果てしない世界をご案内します。

    あなたの知らないインターネットの世界
    ichi2410
    ichi2410 2015/04/02
  • TSUTAYA恵比寿ガーデンプレイス店がとんでもないサービスを開始 - 恵比寿新聞

    3月某日。実は恵比寿のランドマークとして今年21周年を迎える ガーデンプレイスと同じ年にできたTSUTAYA恵比寿ガーデンプレイス店に 名指しで呼ばれるという珍事が起こりまして・・・・ あまりに暴れるもんだからお叱りを受けるのかな・・・ちょっと怖い・・・ 通されるがままに奥の部屋へ促され、恐る恐る奥へと移動すると・・・ やだ。これって万引きした人が入れられるような部屋じゃないですか・・・ 奥にはなんだか如何にもアニメ好きの暗そうな人が座っている・・・ TSUTAYA恵比寿ガーデンプレイス店の店長増田さんという方だそうで・・ ちょっと怒ってる・・・ 恵比寿新聞 あの~・・・呼ばれてここに来ました恵比寿新聞ですが・・・ 増田店長 ・・・・あ。。どうも。。初めまして。。。 恵比寿新聞さ~ん。ちょっとお時間よろしいですかぁ 恵比寿新聞 ヒィー――!!すみません!!ずっとゲオ使ってましたごめんなさい

    TSUTAYA恵比寿ガーデンプレイス店がとんでもないサービスを開始 - 恵比寿新聞
    ichi2410
    ichi2410 2015/04/02
  • めぐる・めぐろ | めぐろ観光まちづくり協会

    開催日:2024年6月24日(月) 海福寺・成就院(たこ薬師)・瀧泉寺(目黒不動尊)・林試の森公園など下目黒地域を巡ります。(徒歩約3.0km) 《ト―ネット》を知っていますか? -入門編- アンコール

    ichi2410
    ichi2410 2015/04/02
  • 英語を学習できるソーシャルゲームの作り方 - しっきーのブログ

    【】(ページ内リンクです) 要約> 序文> ソーシャルゲームのフォーマット> 「学習」をゲームにするために 無理やり分割する> 学習内容とゲームの機能を結びつける> 誰でも成功(計画→実行→達成)できるようにする> 惰性を組み込む> 学習のインセンティブを作り出す 英語(語学)だからできること> 勝算はあるのか?> フォーマットの拡張と学習ゲームの未来> おしらせ 要約 「英語を学習できるソーシャルゲーム」の作り方を説明しながら、「ゲーム」と「学習」を結びつける方法について書いていく。 基的な発想は既存のソシャゲの中身を「英語」にすることだが、それが「学習ゲーム」であるためには、ゲーム内のキャラクターのみならず「プレイヤー自身のステータス」を明確に定めなければならない。そのため、学習内容を無理やり分割してデータベースをつくる作業が必要になる。 キャラクターのスキルやクエストの構成を考える

    英語を学習できるソーシャルゲームの作り方 - しっきーのブログ
    ichi2410
    ichi2410 2015/04/02
  • はてなに新しい仲間が増えました! - はてな2代目社長のブログ

    2015年4月1日に、新卒採用の3名と中途採用の4名の合計7名の入社がありました。 全体朝会で人事から紹介があり、ひとことずつ喋っていただきましたが、はてなでのこれからにかける思いが他の社員にも伝わって、良い雰囲気で4月をスタートすることができました。4月1日はエイプリルフールということで、ちょっとした冗談を口走って人事の担当が青ざめるというお茶目なワンシーンもうちの会社らしいなと思います。こういう空気感は大切にしていきたいです。 新卒氏が最初の挨拶で、「卒業できなかったので後で人事と相談させてください」というエイプリールフールネタを出して人事の人がガチでビビる、というすごい朝会だった。— だいくしー (@daiksy) April 1, 2015 朝会のあと、最近入社された方にも参加してもらい、「ようこそはてなへ!」というタイトルでお話をさせていただきました。はてな歴史やミッション、そ

    はてなに新しい仲間が増えました! - はてな2代目社長のブログ
    ichi2410
    ichi2410 2015/04/02
  • なるほど。JR西日本が始めた酔っ払い線路転落防止策が海外で話題

    なるほど。JR西日が始めた酔っ払い線路転落防止策が海外で話題2015.04.01 19:0013,406 satomi 春はお花見。酔っ払いがホームから落ちるシーズンですね。 シーズン到来に先駆けてJR西日が今年こそは!と新大阪駅のホームでちょっとした「デザインのひと工夫」を始め、海外からも「へ~」の声が集まっています。 神戸新聞が伝えた国土交通省の統計によりますと、酔客の鉄道人身事故は全国で2013年までの10年間で4倍に激増中なのだとか。そこでJR西日の安全研究所ではこの2年で京阪神、大阪市交通局の防犯カメラに残った事故映像136件を見て、酔客が線路に転落したり電車に接触するまでの動きを調べてみました。 ふつう「酔っ払いの転落事故」と聞いてみんながイメージするのは、「線路と平行にちどり足で歩いていて足を踏み外す」パターンですよね? ところがいざ調べてみるとそれは意外にも少なく、約

    なるほど。JR西日本が始めた酔っ払い線路転落防止策が海外で話題
    ichi2410
    ichi2410 2015/04/02