サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Wikipedia
www.trifields.jp
Ubuntu18.04で、任意のバージョンのNode.js環境を構築する方法をお伝えいたします。 aptコマンドによりNode.jsをインストールしようとすると、かなり古いバージョンがインストールされます。 そのため、最新または任意のバージョンをインストールするときは、PPA(personal package archive)からインストールする方法などがありますが、その中でも最も簡単だと思われるnというNodeのバージョン管理を用いた方法をご紹介します。 手順の流れとしては、次のようになります。 aptコマンドから、Ubuntuリポジトリのnodejs(Node.js本体)とnpm(Nodeのパッケージ管理)をインストール npmコマンドから、Nodeのバージョン管理を行う「n」パッケージをインストール nコマンドから、任意のバージョンのNode.jsをインストール apt-getコマン
Rの文字列ベクトルで、文字列を指定して要素を削除する方法をお伝えする。 通常、ベクトルの要素を削除する場合は、次のように添字にマイナスを付加して削除する。 > s <- c("吾輩は", "猫である。", "名前は", "まだ無い。") > # 1番目の要素を削除 > s[-1] [1] "猫である。" "名前は" "まだ無い。" > # 1番目から2番目の要素を削除 > s[-1:-2] [1] "名前は" "まだ無い。" > # 1番目と3番目の要素を削除 > s[c(-1, -3)] [1] "猫である。" "まだ無い。" 文字列を指定して要素を直接削除する場合は、which関数を利用し指定した文字列の添字を取得してから、マイナスを付加して削除すれば良い。具体的には次のようになる。 > s <- c("吾輩は", "猫である。", "名前は", "まだ無い。") > # 「吾輩は」を
WindowsにMariaDBをインストールする手順についてお伝えいたします。 ファイルのダウンロード MariaDBのインストールファイルをダウンロードするために、次のサイトに移動します。 MariaDB.org – Supporting continuity and open collaboration 「Download」をクリックします。 「Download」をクリックします。 「Download 10.2.8 Stable Now!」をクリックします。ダウンロードの時期によっては、MariaDBのバージョンがここでお伝えしたものと異なる可能性が高いですが、基本的には安定板であるStableを選択した方が良いと思います。 32bit版のインストールファイルか64bit版のインストールファイルかを選択します。ご使用のOS状況に合わせてクリックしてください。 名前などを訊かれますが、ス
Ubuntu14.04環境で、Python3と日本語構文・格・照応解析システムKNPを用いて係る語と受ける語のペアを抽出する方法をご紹介する。 係り受け構造を抽出するPython3のソースコードは次である。 from pyknp import KNP def select_normalization_representative_notation(fstring): """ 正規化代表表記を抽出します """ begin = fstring.find('正規化代表表記:') end = fstring.find('/', begin + 1) return fstring[begin + len('正規化代表表記:') : end] def select_dependency_structure(line): """係り受け構造を抽出します """ # KNP knp = KNP(opti
TensorFlowのチュートリアルMNIST For ML Beginnersを試してみる。 プログラミングの世界では、最初に「Hello World」と表示される非常に小さいプログラムを書くことが伝統となっている。 機械学習では、この「Hello World」の代わりに、MNISTを実行するのが伝統のようだ。 MNISTは、手書きの数字の画像のデータセットである。 ここでの目的は、手書きの数字の画像がどのような数字かを予測するモデルを構築することである。 input_data.pyの取得 最初に、tensorflow/input_data.py at r0.8 · tensorflow/tensorflow · GitHubから、表示されているコードをコピーして、適当なテキストエディタにペーストして、input_data.pyとして保存しておく。 このinput_data.pyは、デー
K-means法(K平均法)を用いてクラスタリングする場合は、あらかじめクラスタ数を指定しなければならない。 このときのクラスタ数をどのように決めてよいか迷ったことはないだろうか。 ここでは、K-means法のクラスタ数を機械的に決定する方法をお伝えする。 K-means法のクラスタ数を機械的に決定するために用いるのが、Gap統計量である。 Gap統計量を用いたクラスタ数の決定のアイディアを簡単にご紹介すると、クラスタ数1、2、・・・と順に、一様分布から作成されたクラスタ内の距離の平均と元データのクラスタ内の距離の平均とを比べて、より密集しているクラスタ数を採用するという方法である。 詳しくは、Estimating the number of clusters in a data set via the gap statisticを参考にしてほしい。 ここからは、Rを用いて具体的に見ていこ
Pythonと日本語係り受け解析器であるCaboChaを用いて係る語と受ける語のペアを抽出する方法をご紹介する。 環境:Ubuntu14.04 Pythonツールのインストール PythonからCaboChaを扱うために、CaboChaに付属しているPythonのsetup.pyをインストールする。 これはPython2系専用であることに注意する。 cabocha – Yet Another Japanese Dependency Structure Analyzer – Google Project Hostingからcabocha-0.68.tar.bz2をダウンロードして、解凍した後、「cabocha-0.68/python」ディレクトリに移動後、以下のコマンドを実行して、インストールする。 $ sudo python setup.py install 「/usr/local/lib
Python3でmatplotlibを用いて、箱ひげ図を表示する方法をお伝えする。 Ubuntu14.04環境で動作することを確認している。 一つ注意点として、日本語に対応させるために、ここでは「IPAexGothic」を用いている。 import matplotlib as mpl import matplotlib.pyplot as plt import random # データの作成 uniform = [] gauss = [] for i in range(0, 10000): uniform.append(random.uniform(50, 100)) gauss.append(random.gauss(75, 5)) data = [uniform, gauss] # 日本語対応 mpl.rcParams['font.family'] = 'IPAexGothic' fi
Wikipediaのデータファイルをプレーンテキストに変換する方法を備忘記録として記しておく。 Wikipedia日本語版のデータファイルは以下のサイトからダウンロードできる。 ウィキペディア日本語版 Wikipediaのデータファイルをプレーンテキストに変換するPythonプログラム「WikiExtractor」を以下のサイトからダウンロードする。 Wikipedia Extractor – Medialab 使い方は、適当なディレクトリを作成し、以下のコマンドでそのディレクトリに変換したプレーンテキストを保存する。プレーンテキストの容量はデフォルトでだいたい500KBごとに分割される。 $ mkdir extracted $ bzip2 -dc jawiki-latest-pages-articles.xml.bz2 | python WikiExtractor.py -o extra
ABC分析は売上に関する経営戦略を立てるうえで、最も基本となる分析手法である。ABC分析とは、販売管理、顧客管理で使われる分析の一つで、ある期間で対象を重要度によって分類することにより現状を把握し易くする分析手法だ。 それでは早速解説していく。 ABC分析の手順 期間を過去一年間、対象を商品、重要度を売上とした場合を例に取り、ABC分析を行う手順を説明していく。 各商品の過去一年間の売上を計算し、売上を降順に並び替えて、各商品の売上の合計にしめる構成比を計算し、降順に構成比を累積する。そして70%または80%のところと90%のところに線を引く。ここでは、70%のところに線を引き、商品1~3までをAランク、商品4~8までをBランク、商品9~15までをCランクとした。これで完成だ。 言葉で説明するよりも、以下の図を見ていただいたほうが一目瞭然だろう。各商品の過去一年間の売上さえ分かっていれば、
MeCabは各種スクリプト言語(perl、ruby、python、Java)から、各言語バイディングで利用できるようになっている。 しかし、Pythonで用意されているのはPython2系のもので、残念ながらPython3系では使えない。 そこで、ここでは用意されているPython2系バイディングをPython3系に変換して使用する方法をお伝えする。 MeCabのインストール まずは、MeCabをインストールするため、次のコマンドを実行する。 辞書はIPA(utf-8)を選択した。 $ sudo apt-get install mecab mecab-ipadic-utf8 インストールが完了したら、MeCabのバージョンを確認しておく。 $ mecab -v mecab of 0.996 swigとlibmecab-devのインストール MeCabが用意している各言語バイディングはSWI
顧客満足度調査とは、顧客に対して提供している商品やサービスに対して、顧客がどれだけ満足しているか、または不満を持っているか、満足している点はどこか、不満を持っている点はどこかなどをアンケートなどにより調査することだ。 顧客満足度調査の結果は、各項目ごとに平均値を出したり、棒グラフやレーダーチャートにすることが多い。 もし、あなたが顧客満足度調査の結果を見て、「ある項目が10点満点で平均3点なので、ここを改善する」といった判断の下し方をしている場合は注意して欲しい。なぜならば、ただ点数が低いからと改善しても、全体の満足度にどの程度貢献できるのか未知数だからだ。本質的な事は、その項目の改善ではなく、全体的な顧客満足度を上げることにある。 つまり、顧客満足度調査の結果から導かれる最も重要な情報は、全体的な顧客満足度を上げるためには、どの項目から改善していくのが最も効率が良いかを把握でき、優先順位
CakePHPのプラグイン・パッケージのサイトで公開されているプラグイン・パッケージの一覧をGoogle翻訳を使用させていただき機械的に翻訳したものとあわせてご紹介する。プラグイン・パッケージの情報は2017年04月01日時点のものであることに注意していただきたい。何かのお役に立てれば幸いだ。 1.3 2.x 3.x 3.x 2.x API Creation Admin Interface Anti-spam Application Asset Handling Authentication Authorization Background Processing Caching Categorization Configuration Controller Datasources Deployment Developer Tools Email Error Handling Example
ApacheとWildflyを連携する方法を3つの手順でご紹介する。Jboss AsがWildflyとなってまだ日が浅いためかサーバ上でWildflyをstandaloneで立ち上げて別のクライアントパソコンからブラウザでアクセスするための日本語での情報が少なく感じた。この記事があなたの参考になっていただければ幸いだ。 サーバ環境は以下の通りで、apacheはapt-getによりインストールした。UbuntuでApacheをapt-getによりインストールした場合、Ubuntu流のディレクトリ構成となるらしく、ここでの解説はこのディレクトリ構成をもとにしている。Wildflyはhttp://www.wildfly.org/よりダウンロードして適当なディレクトリに解凍してある。また、ApacheとWildflyは同一パソコン上にある。 Ubuntu server 12.04 LTS Apac
UbuntuにRをインストールするための手順をお伝えする。 Ubuntuのバージョン確認 Ubuntuのバージョンを確認するために、端末を起動し(ショートカットキー:Ctrl+Alt+t)、以下のコマンドを実行する。 DISTRIB_CODENAMEの行を控えておこう。下の内容では「trusty」の部分を控えておく。 $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=14.04 DISTRIB_CODENAME=trusty DISTRIB_DESCRIPTION="Ubuntu 14.04.1 LTS" ミラーサイトの選定 次に、ダウンロード元のミラーサイトを決めなければいけない。ミラーサイトの一覧「CRAN Mirrors」で現在利用可能なミラーサイトを確認したほうが良い。なぜならば、ミラーサイトが時々変更されてしまうため
これから検定統計量はT=2.125となる。 これは、自由度(4-1)=3のカイ二乗分布に従うので、有意水準を0.05とするとカイ二乗値は7.81473となる。 エクセルでこの値を求めるときは、CHIINV関数を使えば良い。 CHIINV(確率,自由度) 今回の例では、セルに「=CHIINV(0.05,3)」を入力する。 T=2.125<7.81473から棄却域に入らないので帰無仮説H0を棄てられない。 よって、調査結果は統計的にA型が40%、B型が20%、O型が30%、AB型が10%であるといえる。 Rで計算する Rで適合度検定を行う場合は、次のようになる。 > chisq.test(c(47, 18, 27, 8), p = c(0.4, 0.2, 0.3, 0.1)) Chi-squared test for given probabilities data: c(47, 18, 27
決定木とは、分類ルールを木構造で表したものである。分類したいデータを目的変数(従属変数)、分類するために用いるデータを説明変数(独立変数)という。目的変数がカテゴリデータなどの場合は「分類木」、連続値などの量的データの場合は「回帰木」と呼ばれる。 決定木の最大のメリットは、結果にグラフを用いることができるため、視覚的に確認できることである。 ここでは、R言語の「rpart」パッケージを用いて決定木について見ていこう。サンプルデータとして、Rに標準で含まれている「Titanic」を使わせていただいた。このサンプルデータはタイタニック号の乗客の属性情報と生死の情報が含まれている。生死を分けた要因を属性情報から分類するとどのようになるのかを見ていく。 まずは必要となるパッケージのインストールとロードを行う。「rpart」パッケージは決定木を行うためのものだが、「rpart.plot」と「part
オープンソースソフトウェアの地図情報システムの一つであるQGIS(Quantum GIS)のプラグインの一覧をご紹介します。英語での説明文をgoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。プラグインを探す参考にしていただければ幸いです。 パッケージ確認日:2024/07/01 パッケージ数:2150 3D City Builder Generate 3D models of urban areas using DEM. DEM を使用して都市部の 3D モデルを生成します。 3DCityDB Tools Tools to visualize and manipulate CityGML data stored in the 3D City Database 3D都市データベースに保存されたCityGMLデータの視覚化と操作のためのツール AcATaMa AcATaM
UCI machine learning repositoryで公開されているデータセットの一覧をご紹介します。英語での要約(abstract)をgoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。データセットのサンプルを探す参考にしていただければ幸いです。 掲載内容は2024年07月01日の情報で、データセット数は645です。 Breast Cancer This breast cancer domain was obtained from the University Medical Centre, Institute of Oncology, Ljubljana, Yugoslavia. This is one of three domains provided by the Oncology Institute that has repeatedly appea
SlideShareで公開されているR言語関係の資料をまとめてみたのでご紹介する。全てを網羅しているわけではないが、あなたのお役に立てれば幸いだ。 Rによる医療統計2015 第1部 医療統計の基礎知識 前編 2015-12-18 / 70 slides Rによる医療統計2015 第1部 後半 2015-12-18 / 57 slides Rによる医療統計2015 第2部 統計法の選び方 2015-12-18 / 65 slides Rによる医療統計2015 第3部 Rの実践 2015-12-18 / 119 slides Rによる医療統計2015 2015-12-13 / 311 slides R使いがSparkを使ったら 2015-12-07 / 28 slides rstanで個人のパラメーターを推定した話 2015-12-05 / 19 slides Rの導入とRStudio事始め(
Pythonでpyqueryパッケージを用いて、ウェブスクレイピングを行う方法をご紹介する。ウェブ上には様々なデータがあるが、必要なデータがいつもファイルとしてダウンロードできるとは限らない。ここでご紹介する方法は、htmlファイルを直接解析して、必要な情報を取得するという方法である。 それでは、さっそく見ていこう。 Ubuntu 16.04LTSの場合の準備 Ubuntu 16.04では、python3系がデフォルトになった。そして、このpyqueryパッケージが標準のリポジトリに入ったので、次のコマンドでインストールが完了する。 $ suto apt-get install python3-pyquery Ubuntu 14.04LTSの場合の準備 まずはPythonパッケージ管理ソフトのpipをインストールする。UbuntuではPython2系とPython3系ではアプリケーションが
PyPIで公開されているパッケージのうち、科学技術関連のパッケージの一覧をご紹介します。 具体的には、次のフィルターによりパッケージを抽出しました。 Intended Audience :: Science/Research Topic :: Scientific/Engineering 英語での説明文をgoogle翻訳を使用させていただき機械的に翻訳したものを追加しております。 パッケージを探す参考にしていただければ幸いです。 パッケージ確認日:2024/06/01 パッケージ数:7085 a2pm(1.2.0) Adaptative Perturbation Pattern Method 適応的摂動パターン法 aaanalysis(0.1.5) Python framework for interpretable protein prediction 解釈可能なタンパク質予測のためのP
R言語をインストールした際に、標準として準備されているサンプルデータの一覧をご紹介する。英語での説明文をBing翻訳またはGoogle翻訳を使用させていただいて翻訳したものを掲載した。サンプルデータを探す参考にしていただければ幸いだ。 標準で使用できるサンプルデータ AirPassengers Monthly Airline Passenger Numbers 1949-1960 1949年-1960 年の毎月の航空旅客数 The classic Box & Jenkins airline data. Monthly totals of international airline passengers, 1949 to 1960. クラシック ボックス & ジェンキンス航空会社のデータです。1949年から 1960年の国際線旅客数 の毎月の合計。 > str(AirPassengers)
CRANに登録されているパッケージ数は膨大です。そこで、いくつかのグループにパッケージを分類し整理されたCRAN Tack Views というサイトがあります。ここでは、英語での説明文を機械翻訳を交えて日本語化に翻訳したものを掲載しました。 ActuarialScience (日本語訳) Agricultural Science農業 Agriculture (日本語訳) Agricultural Science農業 Bayesian Inference (日本語訳) Bayesian Inferenceベイズ推論 CausalInference (日本語訳) Causal Inference因果推論 Chemometrics and Computational Physics (日本語訳) Chemometrics and Computational Physicsケモメトリックスと計算物
データセット作成 ここでは、データセット作成に関する説明をいたします。 当サービスは、お客様より質問紙またはExcel、CSVなどの入力済みデータをお預かりし、ご要望に沿った形でデータセットを作成してご提供いたします。 データセットは、E 続きを読む 受託データ分析 ここでは、受託データ分析に関する説明をいたします。 当サービスは、お客様よりExcelまたはCSVなどの入力済みデータをお預かりし、ご要望に沿った統計解析または機械学習の提案および分析、結果報告書を提供いたします。 続きを読む データ分析の相談 ここでは統計解析または機械学習によるデータ分析の相談に関する説明をいたします。 当サービスは、お客様が抱えるデータの前処理またはデータ分析手法、結果の解釈および考察などのお悩みに対して、情報を提供いたします。 当サービス 続きを読む
このタスクビューに対する提案や改良は、GitHubのissueやpull request、またはメンテナのアドレスに電子メールで送ってください。詳しくはContributing guideをご覧ください。 このタスクビューのパッケージは、ctvパッケージを使用して自動的にインストールすることができます。例えば ctv::install.views(“HighPerformanceComputing”, coreOnly = TRUE)は全てのコアパッケージをインストールし、 ctv::update.views(“HighPerformanceComputing”)はまだインストールされていない最新状態のパッケージを全てインストールします。詳しくはCRAN Task View Initiativeをご覧ください。 この CRAN タスクビューには、R によるハイパフォーマンスコンピューティン
CRANで公開されているR言語のパッケージの一覧をご紹介します。英語でのパッケージの短い説明文はBing翻訳またはGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。何かのお役に立てれば幸いです。 パッケージ確認日:2024/05/01 パッケージ数:20640 また、パッケージをお探しの方は「R言語 CRAN Task Views」「R言語CRANパッケージ検索」も参考にしていただければ幸いです。 A3 Accurate, Adaptable, and Accessible Error Metrics for Predictive Models 予測モデルのための、正確、適応、およびアクセス可能なエラーメトリック AalenJohansen Conditional Aalen-Johansen Estimation 条件付きアーレン-ヨハンセン推定法 AATtools
このページを最初にブックマークしてみませんか?
『データサイエンス - 統計解析・機械学習 | トライフィールズ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く