西南学院大学経済学部 演習1 講義ノート 講義ページ: http://courses.wshito.com/semi1/2020-datascience/index.html ***ビューワで文字化けするときはビューワ画面を最大化すると治ることがあります***
![Rデータ処理入門](https://cdn-ak-scissors.b.st-hatena.com/image/square/32b86b256a20089a18c95b86017c0a7b7b87e792/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fr-150227090028-conversion-gate02-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
dplyr tidyr dplyr::tbl_df(iris) dplyr::glimpse(iris) utils::View(iris) V Source: local data frame [150 x 5] Sepal.Length Sepal.Width Petal.Length 1 5.1 3.5 1.4 2 4.9 3.0 1.4 3 4.7 3.2 1.3 4 4.6 3.1 1.5 5 5.0 3.6 1.4 .. ... ... ... Variables not shown: Petal.Width (dbl), Species (fctr) dplyr::%>% . %>% : x %>% f(y) f(x, y) y %>% f(x, ., z) f(x, y, z ) - tidy : Tidy Data - R Tidy data R R ( ) ( ) ti
A layer combines data, aesthetic mapping, a geom (geometric object), a stat (statistical transformation), and a position adjustment. Typically, you will create layers using a geom_ function, overriding the default position and stat if needed. layer_geoms Layer geometry display geom_abline() geom_hline() geom_vline() Reference lines: horizontal, vertical, and diagonal geom_bar() geom_col() stat_cou
著者の松浦さんから「StanとRでベイズ統計モデリング」をいただきました。ありがとうございます! 書籍では Stan の R バインディングである RStan を利用していますが、Stan には Python 用の PyStan もあります。松浦さんが書籍 5.1節の PyStan での実行例を書かれています。 statmodeling.hatenablog.com 補足 PyStan については過去にも書いた内容があります。 sinhrks.hatenablog.com 同じように、「StanとRでベイズ統計モデリング」の内容を Python で実施してみました。 11.3 ゼロ過剰ポアソン分布 以降、書籍 "11.3節 ゼロ過剰ポアソン分布" の流れに沿って Python のスクリプトを記載します。ロジックや処理自体の説明は書籍をご参照ください。データと Stan のスクリプトは Gi
これの続き。よく使う集約/変換処理もまとめておく。 準備 library(dplyr) library(tidyr) (df <- dplyr::tbl_df(iris)) # Source: local data frame [150 x 5] # # Sepal.Length Sepal.Width Petal.Length Petal.Width Species # 1 5.1 3.5 1.4 0.2 setosa # 2 4.9 3.0 1.4 0.2 setosa # 3 4.7 3.2 1.3 0.2 setosa # .. ... ... ... ... ... グルーピング/集約 ある列の値ごとに集計 Species 列ごとに Sepal.Length 列の合計を算出する場合、 df %>% dplyr::group_by(Species) %>% dplyr::summa
「コードレビューをキメると品質も上がるし自分のレベルも上がるので最高」みたいな論が巷を賑わせていて、以前はそういうイケてる制度を指をくわえてみるのみだったのだけれど、最近職場と、それと個人的に関わったプロジェクトでコードレビュー制を無理矢理交渉して導入してみた結果、世間のイケてる書籍やエントリから得られる情報とはまた少し違う知見が得られたので書いてみる。 割と泥臭かったり、あまり希望に溢れてたりはしない感じのエントリなのでそういうのは期待しないほうがいいです。 準備 些末なコードレビューを極力避けるために、コードの規約やスタイルについてはlintとフォーマッターを用意した。 他は無策。 結論 結論から言うと、理想的な運用は出来なかったものの、コードレビューについて世間で言われるような成果(作業を共有する意識、レベルの向上)は得られた。良かった。 ぶっちゃけ僕なんかが浅はかな考えで導入しても
トヨタのコンパクトミニバン、「シエンタ」が激しく売れている! 今から注文を入れても、直近の納期はトヨタ発表で2016年1月下旬(ハイブリッド&ガソリン共に同じ)。大量生産可能なコンパクトカーなのに納期が5ヶ月というのだから驚く。 発売1ヶ月で5万台を受注し、その後もオーダーが続いているそうな。なんでこんなに売れているのか? ■オートックワン8月の新車売れ筋ランキング ~新型シエンタが先月に続き1位を獲得~ デビュー直後は「カッコ悪い」とか「高すぎる」という意見も少なくなかった。デザインについては同業者の中でも厳しい評価が目立ったほど。 ちなみに思ったことをそのまんま書く私といえば、シエンタのデザインについては甘い評価を下してます。個性的で面白いと思っていた次第。 女性ユーザーの中には、フロントバンパー横の切れ上がり(歌舞伎の隈取り風)のことを「牙」と評する人も居るなど、違和感を覚えた人も
3本立て開発者インタビュー その1 システム編 2015年5月28日の発売から、全世界で“イカ旋風”を巻き起こしている、任天堂のWii U用ソフト『Splatoon(スプラトゥーン)』。こまめなブキ、ステージの追加に加え、先日の大型アップデートの実施、そして、全国大会“スプラトゥーン甲子園”の開催と、その勢いは留まることを知らない。週刊ファミ通2015年8月6日号(2015年7月23日発売)では、ユーザーアンケート結果などを含んだ『スプラトゥーン』の大型特集を掲載し、とくに開発者インタビューでは大きな反響をいただいた。しかし、実際のインタビューは編集部の『スプラトゥーン』が好きすぎる担当がこぞって話をうかがったため、誌面では掲載しきれない話が山ほどあったのだ! そこで今回は特別に、誌面では掲載できなかった部分も補った、増補改訂版のインタビューをお届けする。なお、インタビューは2015年6月
『60万人が結果を出した「ネイティブ思考」英語勉強法』(ダン上野Jr.著、あさ出版)のもとになっているのは、「スーパーエルマーシリーズ」。60万人以上が利用し、TOEIC®リスニング満点や英検1級の人が続出している勉強法だそうです。同シリーズを展開する東京SIM外語研究所所長である著者は、英語学習について次のように主張しています。 英語の習得に必要なのは「時間」ではありません。大切なのは「正しい学習方法で勉強すること」です。(「はじめに」より) 多くの日本人が英語を話せないのは、「間違った勉強方法」が英語の上達を妨げてきたからなのだとか。そして、この場合の「間違った勉強方法」とは、私たちが学校で教わった「返り読み」。「英語の語順」を崩し、日本語の語順に置き換えて理解する読み方のことです。 (1)I(7)saw(6)the painting(2)which she(4)had bought(
PDFファイルをご覧いただくためには、Adobe Reader(無償)が必要です。 Adobe ReaderはAdobe Readerのダウンロードページよりダウンロードできます。
統計基礎用語集(和英編) 『わかりやすい統計学』より 英和編 「Excel 統計方法解説辞典」 日頃有用なキーワード100 各種用語集 数学 mathematics 算術 arithmetic 幾何学 geometry 代数 algebra 微積分 calculus 解析学 analysis 確率論 probability theory 和 sum 差 difference 積 product 商 quotient 加法 addition 減法 subtraction 乗法 multiplication 除法 division 符号 sign 正 positive 負 negative 整数 integers 自然数 natural numbers 分数 fractions 分子 numerator 分母 denominator 総和 summation 定数 constant 係数 co
Multilingual Glossary of Statistical Terms -Japanese version-
非接触ICカード ウォルマートで使われているEPC RFID タグ RFID(英: radio frequency identification)は「無線周波数を介したタグからの識別情報読み取りおよびタグとの通信」という概念である[1]。 概要[編集] タグは物へと付与され、その物の識別情報を有している。例えばシャツの値札タグはバーコード部分に商品識別情報を有しており、バーコードリーダーによる光通信でそれを読み出せる。もしタグが自ら電波を発してそれに識別情報がのっていれば、無線通信を介したタグの読み取り・タグとの情報伝達が可能になる。これがRFIDである。対応するタグをRFタグ(英: RF tag)という[2]。 RFタグの例として非接触型ICカード(乗車カード、電子マネー、社員証)、無線ICタグ(値札)などが挙げられる[3]。また規格の例としてFeliCaが挙げられる。 狭義では、タグと
IoTの発展に伴い重要となるのが、規格の標準化だ。過去にIoTの黎明期の技術ともいえるRFID(無線自動識別装置)の標準化を主導した人物が、教訓を示す。本誌2015年4月号特集「IoTの衝撃」関連記事。 15年ほど前、IoT(Internet of Things:モノのインターネット)に通じる最初の本格的なプロジェクトの1つが始動した。マサチューセッツ工科大学(MIT)にAuto-IDセンターが設立されたのが1999年。これが後に、研究者と推進者から成るグローバル規模のコンソーシアム、Auto-IDラボへと発展した。新旧両組織の目標はRFID(radio-frequency identification devices:無線自動識別装置)を研究し、その実用化を促進することだった。 また1999年は、"Internet of Things"という用語が初めて使われ記録された年でもある。モノ同
中古マンションのリノベーションサービス「リノベる。」を運営するリノベるは9月3日、2016年に開始する予定のスマートハウス事業の構想を説明した。同社がスマートハウスで実現したいことは、(1)生活のスマート化、(2)煩雑な書類の管理、(3)困った時はプロに相談できる、の3つだ。 まず「生活のスマート化」については、家具や建具をすべてインターネットにつなぐことで、人間が操作しなくても快適な空間を保ってくれる状況にする。また、端末に搭載されたセンサによって住民が気づかない異常を検知できるようにする。さらにインターネット経由で次々と新しい機能が追加されていくというものだ。 「煩雑な書類の管理」は、自宅で埋もれてしまいがちな重要書類がまとまっていること、導入した設備の型番や仕様を検索できること、リノベーションする前の写真や図面を確認できることなどだ。「困った時はプロに相談できる」は、その名の通り家に
自民、公明両党は7日、2017年4月に消費税率を8%から10%に引き上げるのに合わせ、酒を除く飲食料品の2%分を購入後に消費者に戻す「還付制度」の導入について、大筋で了承した。購入時点で税率が低くなっている欧州などでの「軽減税率」とは異なる仕組みで、今後、両党は詳細な制度設計に入る。 制度案は財務省がまとめた。与党側の説明によると、例えば、1千円の飲食料品の買い物をすると消費税10%分を加えて1100円を支払うが、そのうち増税分の2%に当たる20円が後で戻ってくる仕組みだ。来年1月から始まるマイナンバー(社会保障・税番号)のカードを店の機械に通すことなどで戻る金額が記録され続け、一定時期にまとめて、登録した金融機関に振り込まれる構想だ。購入時にレシートなどでいくら還付されるかわかるようにするという。 戻す額の合計に上限を設けることで、より多く買った人には事実上の所得制限がかかる方向で検討。
グーグルの旧ロゴは14,000バイトもあったのに、新ロゴはたった305バイトなのはどうして?2015.09.07 17:3021,350 SHIORI そんなに違うの? グーグルの新ロゴが発表され、旧ロゴのファイルの大きさは14,000バイトだったのに対し、新ロゴはたった305バイトになったそうです。どうしてそこまで変わるのか? UIデザイナーのIlya YakubovichさんがQ&AサイトQuoraでわかりやすく解説してくれています。 グーグルの古いロゴにはローマン体のフォントが採用されていて、セリフと呼ばれる飾り(線の端にちょこんと付いてるやつ)あるため、ベジエ曲線を使わないと作れないデザインでした。その結果、ロゴ全体でのアンカーポイントは100箇所。ファイルの大きさは6KB(6,380バイト)になり、圧縮しても2KB(2,145バイト)といったところです。 一方シンプルになった新し
前回の記事で友利奈緒判定botを作ったのを紹介したところ、いろんな人から試してもらうことができました。集計したところ正解率としては90%程度を出していました。 この前集計した時の混同行列はこんな感じでした。最近投稿数が増えすぎて集計したくないです……。 しかし、第4世代のネットワークになっても「さすがにこれはないだろう」というような間違いを続けています。 .@dolicas_ 友利奈緒です(72%) pic.twitter.com/U9l93GVgIS— まほろ(稼働中) (@mitra_sun22) 2015, 9月 5 .@DEGwer3456 友利奈緒です(99%) pic.twitter.com/8Yum498g4E— まほろ(稼働中) (@mitra_sun22) September 6, 2015 Deep Learningは性能がいいということで最近もてはやされていますが、こ
「BABYMETAL(ベビーメタル)」というグループをご存じだろうか。17歳のSU-METAL(中元すず香)、16歳のYUIMETAL(水野由結)、MOAMETAL(菊地最愛)という3人の女性から成る。「アイドル」「カワイイ」といった日本発の文化と、欧米を中心に世界的に根強い人気を集める音楽ジャンル「ヘビーメタル」との「融合」をコンセプトに2010年に結成された。 実はこのベビーメタルは、今、世界の音楽シーンで最も注目を集めている日本人音楽グループなのである。パフォーマンスのレベルの高さやコンセプトの斬新さが高く評価されており、特に海外では「アイドル」という枠組みでは捉えられなくなっている。その人気の秘密を探ると、日本文化の輸出、いわゆるクール・ジャパンの新しい可能性が見えてくるように思う。 ベビーメタルは2014年に無料動画サイト「YouTube」に配信された楽曲「ギミチョコ!!(Gim
8月の頭からディープラーニングを実装していたのを、先日、プレゼンしてきました。 プログラマのための数学勉強会@福岡 - connpass ぼくの実装した最弱のディープラーニング from なおき きしだ ※追記 2023/4/12 SpeakerDeckにも置いてます https://speakerdeck.com/kishida/weakest-deep-learning-i-implemented GPU対応したり、ドロップアウトとかミニバッチとかいろいろ実装して、結構つよくなってます。 ちゃんと学習してくれないこと以外は。 ソースはこんな感じになってきています。 https://github.com/kishida/neuralnet/tree/CorrectOperationAsCCN GPU対応にはaparapiを使っています。JavaでGPUコードが書けるスグレモノです。 ap
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く