[B! r][python] xiangzeのブックマーク

xiangze id:xiangze

rとpythonに関するxiangzeのブックマーク (13)

CZI – Essential Open Source Software for Science
xiangze 2022/11/11
programming

R

Python

datascience
リンク
Yuta Kanzawa, Data Scientist
xiangze 2021/01/01
R

python
リンク
Posit
We make data science available to everyone, regardless of your economic means.
xiangze 2018/07/30
r

python

rstudio
リンク
Python と R の違い (データフレーム編)
本ページでは、前編に引き続いて、Ajay Ohri 氏のスライド、”Python for R Users” からデータフレームの取り扱いにおける Python と R の関数の対応表を紹介します。データフレームの作成 R Python
xiangze 2016/08/30
R

pandas

python
リンク
Introducing Apache Arrow: A Fast, Interoperable In-Memory Columnar Data Structure Standard - Cloudera Blog
Introducing Apache Arrow: A Fast, Interoperable In-Memory Columnar Data Structure Standard Engineers from across the Apache Hadoop community are collaborating to establish Arrow as a de-facto standard for columnar in-memory processing and interchange. Here’s how it works. Apache Arrow is an in-memory data structure specification for use by engineers building data systems. It has several key benefi
xiangze 2016/04/02
python

r
リンク
Microsoft Machine Learning Studio (classic)
Machine Learning Studio (classic) will be retired by 31 August 2024 – transition to Azure Machine Learning Azure Machine Learning now provides rich, consolidated capabilities for model training and deploying, we'll retire the older Machine Learning Studio (classic) service on 31 August 2024. Please transition to using Azure Machine Learning by that date. From now through 31 August 2024, you can co
xiangze 2015/02/21
機械学習

r

python
リンク
R と python との感想 - ryamadaのコンピュータ・数学メモ
年末年始にpythonをいじってみたデータ解析の面からRとpythonを比較した記事がいくつかあり、pythonでRの代りになる、という意見もあれば、Rの統計解析にとって代わりきることはないだろう、という意見もあるようだったこの記事あたりに肯く人が多いのかと思ったその他の参考記事は、こちらやこちら,こちら,こちら,こちら Rを使った６年くらいの経歴と、パイソンをいじった「たったの１週間」の体感で思うのは、 (1) Rの「積極的ユーザ」とパイソンの「積極的ユーザ」は少しタイプが違うので、今後もある程度のすみわけが続きそう、ということ。 (2) 融合領域のデータ解析をするなら、二つのユーザ文化が提供してくれるそれぞれを使うために、両方を使っておくとよいことがありそうだということ。どういう点でそれを感じたか、というと(あくまでも、勝手な印象ですが…) (1) Rの関数・パッケージの解説文
xiangze 2015/01/02
R

python
リンク
ネットワーク可視化プラットフォームCytoscapeの現状まとめ - Qiita
Cytoscapeとは？ Cytoscapeとは、欧米の研究機関によって開発されているオープンソースのネットワーク可視化ソフトウェアプラットフォームです。ネットワーク（数学の用語ではグラフ）可視化ソフトウェアとは、要するにデータを分析して、最終的には以下の様な描画を行うものです。元となる情報は基本的に何でも良いので、以下の様な分野で利用されています: 遺伝子ネットワーク分析（主な開発目的です）ソーシャルネットワーク分析（日本語でも幾つか著作のあるJames Fowler教授にも協力していただいています）コンピュータ・ネットワークの可視化とセキュリティ分析オントロジー等、グラフ構造を持つデータの可視化このソフトウェアはもう10年以上も開発が続いています。私もカリフォルニア大学のチームの一員として、かなり初期から開発に加わっておりますが、私の努力不足もあり、日本語のドキュメントはとて
xiangze 2014/08/19
可視化

network

R

python
リンク
RPy2でpythonからRを呼び出して計算（基本〜線形回帰まで） - My Life as a Mock Quant
インストール〜基本操作〜線形回帰まで。まずはaptでインストール。 sudo aptitude install python2.6-rpy2ubuntu便利。パッケージのインポート＆rに対するインターフェイスオブジェクトを生成。基本的にこのオブジェクトを介してRを操る。 import rpy2.robjects as robj r = robj.rまずRからπの値を取得してみる。 ()だとRのコードとして評価される。 []だとRのオブジェクトを取得する。という点に注意。 print(r('pi')) print(r['pi']) は.でもある程度代用できるけど、Rの関数・変数名にはちょいちょい.が入ってくるのでを使っておくのが無難。上述のように()を使えばRのコードを評価できる。 Rの関数オブジェクトを定義してそれを使って値を計算してみる。 #値を2乗する関数 r('f <- f
xiangze 2014/02/11
r

python
リンク
はてなブックマーク記事のレコメンドシステムを作成　PythonによるはてなAPIの活用とRによるモデルベースレコメンド - データ分析がしたい
私は情報収集にはてなブックマークを多用しており、暇な時は結構な割合ではてなブックマークで記事を探してます。しかし、はてなブックマークは最新の記事を探すのは便利ですが、過去の記事を探すにはいまいち使えません。個人的には多少過去の記事でも自分が興味を持っている分野に関しては、レコメンドして欲しいと感じてます。ありがたいことにはてなはAPIを公開しており、はてなブックマークの情報を比較的簡単に取得できます。そこでこのAPIを利用して自分に合った記事を見つけるようなレコメンド機能をRとPythonで作成してみたいと思います。利用するデータは、はてな APIを使って収集します。具体的には、はてなブックマークフィードを利用して自分のブックマークしているURLを取得し、そのURLをブックマークしているユーザをエントリー情報取得APIを用いて抽出し、そのユーザのブックマークしているURLを収集します。こ
xiangze 2013/07/08
R

データマイニング

python

はてな

機械学習
リンク
Earth Mover's Distance (EMD) - 人工知能に関する断創録
Earth Mover's Distance (EMD) について調べたことを整理しておきます。EMDは、ユークリッド距離のような距離尺度の一つで、二つの分布の間の距離を測ることができます。言語処理ではあまり聞いたことなかったのですが、画像処理や音声処理では比較的有名な距離尺度のようです。 EMDが使える問題設定は下図のようになります。 EMDは特徴量と重みの集合（シグネチャと呼ぶ）で与えられる分布Pと分布Qの間の距離です。ここで、特徴量間では距離が定義されているのが前提です。特徴量がベクトルのときはユークリッド距離、特徴量が確率分布のときはカルバック・ライブラー距離（情報量）などです。EMDは、特徴量の集合が2つ与えられたときに、1個1個の特徴量間の距離をもとに、特徴量集合間の距離を求められるんですね。これはすごい。重みは具体的な応用によって使い方が変わりますが、その特徴量の重要度を
xiangze 2012/08/22
algorithm

python

R
リンク
hadoopの話とpythonでデータマイニングをする話 - gumi Engineer’s Blog
gumiの粟飯原です。データマイニングやってます。しかしながら最近はあまりデータをいじる時間がなく社内でプレゼンばかりする日々で、社内でも私がなにやってるのかわからないというもっぱらの評判。そこで今回は一応データ解析もやってはいるんだよということを内外に主張するためにもデータマイニングの話をしようと思います。アプリの基本的な日々の統計データ取得などは別の方々はやられているので、私からはhadoopを使った大規模解析の話や、そこで得られたデータを分析する環境の話をしたいと思います。コードを併記した具体例などは今回載せられないのですが、今後また紹介していければと思います。大規模データの解析日々のログ解析やDB解析はcronによる処理で毎朝レポーティングを行っているのですが、新しい情報を過去のアクセスログからまとめてどかんと取得したいと言う時はHadoopによる大規模解析を実行しています
xiangze 2012/08/06
python

R

datamining

Hadoop
リンク
Igraph
"Click here if you are not redirected automatically"?
xiangze 2011/02/17
igraph

library

python

R
リンク
1