# インポート from pandas import DataFrame # tsvの読み込み dframe = pd.read_csv('data.tsv', delimiter='\t', header=None) # カラム名変更 dframe.columns = ['hoge', 'fuga'] # カラムを落として別のDataFrame作成 dframe2 = dframe[[0, 1]] # カラム名が文字列で付いてたら、dframe[['hoge', 'fuga']]で。 # 重複行削除 dframe3 = dframe2.drop_duplicates() # 行数調査 len(dframe3) # DataFrameの数値の先頭X文字を切り取って新しいカラムとして使う # sliceカラムを追加し、そこに、hoge(float型)の先頭4文字を挿入 dframe4['sl
アイドル様 僕はアイドル様が好きなのですが、そのアイドル愛が歪んで、某個人配信プラットフォームでアイドル様の配信の分析をしています。個人的に、秋元康氏プロデュースのアイドル様に興味があります。究極の目標はアイドル様の人気の数値化と、某総選挙順位や選抜の予測です。ただし、某個人配信プラットフォームを全く利用しないランカーさんも存在するため、そのあたりは知りません。 STU48とは STU48(エスティーユー フォーティーエイト)は、秋元康のプロデュースにより、2017年に誕生した瀬戸内7県を拠点とする日本の女性アイドルグループ。AKB48グループを構成するグループのひとつである。出典:wikipedia 公式サイト メンバー一覧はプロフィールで見れます。かわいい。 一般人の認知度はものすごく低く、劇場となるはずの船の予定も未定、2ndシングルの発売も延期となりましたが2019年2月に決定と、
目的 x軸方向(時間方向)にずれたデータを1つのヒートマップ上に並べて表示したい. そのために,データの整形を行う. 状況 複数のセンサからデータをサンプリング サンプリング周期は同じ 取得タイミングがずれている データ数が異なる Ex.) 分散システムになっていて,それぞれのデータが中央に送られてくる. ので,一筋縄ではいきません. データ整形からプロットまで データの読み込み(作成) pd.read_csv() とかで読むけど,今回はダミーデータを使用します. # 時間のズレを作る time_A = np.arange(5, step=0.01) time_B = np.arange(5.1, step=0.01) # 適当にばらつかせる time_A += list(map(int, np.random.normal(scale=0.01, size=len(time_A)))) t
初投稿です。お手柔らかにお願いします! 今日は、kaggleのタイタニックでとあるkernelsを読んでいたところ、 Seabornというライブラリを使った、相関係数行列の作成があったので詳しく見ていきたいと思います。 参考: https://www.kaggle.com/arthurtok/introduction-to-ensembling-stacking-in-python 環境:kaggleのkernel(仮想環境) 相関係数行列、書けると何が嬉しいの? 機械学習において余計なパラメータは計算リソースが増える・過学習の可能性が増えるので、 減らしたいものです。 相関が強い二つパラメータは、片方のパラメータで説明できてしまうので、 必要が薄いのです。 相関係数行列を表示すると、パラメータ毎の相関が一発でわかるので、 パラメータ選定の助けになります。 seabornとは? seabo
概要 共同研究のアルバイトでデータサイエンスっぽいことをすることになったので,忘れないようメモとして残すことにします. 企業さんから(詳しくは書けませんが)あるデータログを頂きました.それに対して処理を行っていきます. jupyter-notebook Jupyter-notebookを使おうと思います. 自分はanaconda環境を使用しているので, conda install jupyter でJupyter-notebookをインストール.使用したいディレクトリに移動して jupyter notebook でWebブラウザからPythonのプログラムを実行できるツールが立ち上がる. 画面右上にある[New]のボタンから[Python3]を選択して準備完了. あとはセルにコードを書いて,[Shift]+[Enter]で実行可能. パッケージ Pythonを使ったデータ解析,操作でよく使
やりたいこと / Purpose Seabornでヒートマップを描くとき、項目の並び順を自由にカスタマイズしたい。 You may want to order entries arbitrarily as you like when drawing a heatmap with seaborn. Here's how to do that. データ準備 / Data preparation はじめに元データを用意します。ここでは、三箇所の場所で四種類の動物を目撃した回数をデータにします。 Prepare a dataset to visualize first. Suppose you went out to three different places and counted how many times you saw some animal species.
導入 まだ、私は機械学習を学び始めて2ヶ月ぐらいです。 最近Kaggleで学んだ知識を実践しようと取り組んでおり、どういった学習方法がいいのかなーって調べていたら 「KaggleのKenel読むといいよ!!」 ってあったので見てみたのですが 意味不明なコードで書かれたKernelばっかやん😡 そういうわけでなんとかして、初心者向けの簡単なコードで書かれたカーネルを見つけたので紹介していこうと思います。 ちなみにコンペはtkm2261さんのYoutube動画の影響を受けてPorto Seguro'sをやってます。 このコンペはデータが綺麗で、自然言語処理の知識とかも入らないのでtitanicやった後はこのコンペをやることをおすすめします! カーネルに関しては見つけ次第順次追加していく予定です。 もし、初心者におすすめのカーネルがあるよーって方はコメントしてくだされば追加するのでよろしくお願
はじめに 3月末に大学でデータ分析系の研究室に配属され、何か手頃なデータで遊んで見たいなぁ〜と思っていたところこんな素晴らしい記事を偶然発見。 Spotifyの76,000曲の属性データを分析した結果、J-RockはRockというよりむしろPunkだった **Spotify**は無料(!)で使えるApple Musicのような定額音楽ストリーミングサービスです。 ↑Spotify の Web Player 前々からSpotifyはかなり使っているのですが、APIの存在はこの記事で初めて知りました。取得できるオーディオ解析のデータの一つ一つもかなり面白そうだったので、これを使う手はない!ということで実際に触って見ました。 今回はSpotifyの曲の情報を取得するAPIを使い、データサイエンティスト一年生かつトラックメイカー四年生の観点から、色々頑張ってみようと思います。 目標 今回の目標は以
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く