タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

rとpythonに関するbob3のブックマーク (5)

  • おそらく先がない5つのプログラミング言語? - YAMDAS現更新履歴

    おそらく先がない5つのプログラミング言語、といういろいろと怒りをかいそうな記事だが、どうせワタシが愛する C 言語なんかがまたやり玉に挙がってるんだろうと見たら、一番最初に Ruby が挙がっている…… この記事は TIOBE や RedMonk のプログラミング言語ランキングに Dice 独自の求人票情報を加味してるようだが、Ruby は落ち目という認識らしい。うーむ。 それ以外には Haskell、Objective-C、R、そして Perl が挙げられていて、この手の記事の定番といえる PerlSwift 誕生後やはり定番である Objective-C はそうですかという感じだが、ビッグデータの時代に人気を高めた R 言語ですら、Python に追いやられつつあるというのはそうなんでしょうね。 それにしても Ruby が先がないという意見には異論が出るだろう。ネタ元は Slashd

    おそらく先がない5つのプログラミング言語? - YAMDAS現更新履歴
    bob3
    bob3 2019/08/05
    はいはい、Rは滅びる、滅びる。
  • Plotlyを使う人にも家族がいることを、私たちは忘れていません。 - Qiita

    はじめに スーパーでブロッコリーを見るとPlotlyを連想する病気にかかっています。 自分の作業用によく使うPlotlyの使い方をまとめたので公開します。 実際にグリグリ動かしたい方はkaggleのkernelにアップしてるのでそちらでグリグリしてください。 https://www.kaggle.com/kageyama/how-to-use-plotly ※ちなみにPlotlyの3Dグラフをグリグリしたことがない人は、是非とも一度グリグリした方がいい。感動する。 データロード データはseabornから iris,titanic,flightsの3つを適宜使用する。 import numpy as np import pandas as pd import plotly as py from plotly.offline import init_notebook_mode, iplot

    Plotlyを使う人にも家族がいることを、私たちは忘れていません。 - Qiita
    bob3
    bob3 2019/06/17
    Rでggplotly使えば分かりやすく書けますよ。/>コーディングが結構煩雑になりやすい。
  • Python で大量のファイルを並列で速く読み込む - Qiita

    from glob import glob files = glob('data/*.csv') len(files) # 10000 この 1万件の CSV ファイルを Pandas DataFrame として読み込みたい。 ちなみに検証用のデータは以下のようにして生成した。 (3列 x 10,000行 の CSV ファイル 10,000 個) import numpy as np import pandas as pd row_n = 10000 col_n = 3 columns = [f'col{i}' for i in range(col_n)] for i in range(10000): df = pd.DataFrame(np.random.randn(row_n, col_n), columns=columns) df.to_csv(f'data/{i:04}.csv',

    Python で大量のファイルを並列で速く読み込む - Qiita
    bob3
    bob3 2019/06/05
    rで試してみよう。vroom::vroom()使えば結構速いはず。
  • データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust) - Qiita

    データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust)Pythonpandasデータ分析データ可視化pandas-profiling Pythonのpandas-profilingと、pixiedustの2つのライブラリを使うと、データの集計・グラフの作成が、感動的なほど早く終わることを実感したので共有します。 Excelでデータ集計・グラフ作成した場合と比較すると、体感で100倍くらい早く終わります(誇張ではなく) Pythonで爆速でデータ集計する方法(体感所要時間:5分) 前提: 以下の環境が整備されていることは、前提とします。 Pythonのインストール(約30分) データ分析に必要な各種ライブラリのインストール(約30分) →numpy, matplotlib, pandas, jupyter など →Anac

    データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust) - Qiita
    bob3
    bob3 2019/04/28
    だから、R使えってば。
  • reticulateパッケージでPythonを使う - Qiita

    概要 reticulateパッケージはPythonを活用するRのパッケージ reticulateパッケージの使い方とライブラリ利用例を実行結果を提示して確認 試したライブラリはSentence Piece, Pytorch, AllenNLPなどは動作している (記事ではRを「パッケージ」とPythonを「ライブラリ」という風に書き分けています) 前書き 有用なライブラリがPythonで開発されているため使いたくなりますが、Pythonはわからない・書けないというRユーザーは未だに多くいらっしゃいます。 しかしながら、すでにあるPythonライブラリの関数にデータを適用した結果だけが欲しいのであれば、reticulateパッケージで事足りてしまうようです。 同様のパッケージには以前に紹介したPythonInRやrPythonなどがありますが、reticulateがリリースされてからは私は

    reticulateパッケージでPythonを使う - Qiita
    bob3
    bob3 2018/11/12
    Rからpythonを使う。
  • 1