顧客テーブルの性別には"男性"と"女性"という属性がありますが、ここでは、それらの値を数値に対応させてフィールドに格納しています。値が1の場合は男性、値が2の場合は女性を意味します。 性別のように、いくつかの決まった文字列が複数のレコードで繰り返し使われる場合、一般的に、その文字列を数値と対応させて、フィールドには数値の方を格納するといった方法がよく使われます。理由としては、文字列で管理するよりも、数値で管理したほうがデータ容量が少なくて済み、検索処理で発生する負荷を軽減させることができるからです。 SELECT命令文で全レコードを選択 SELECT命令文を使ってテーブルに登録された全レコードを選択する場合は、SELECTの後に続くアスタリスク( * )を指定し、FROMで表示対象のテーブル名を指定します。 SELECT * FROM テーブル名; アスタリスク( * )は全フィールドを意
pixivのタグ頻度から考えるラブライブのカップリングが面白かったので、自分もネットワーク解析をやってみようと思いました。ネットワーク関係で最初に思い浮かんだのがTwitterのフォロワーのつながりを調べてみようと思います。 やること フォロワー同士のフォロー関係を調べる フォロー関係をネットワーク図で書く コード フォロワー同士が相互フォローにある場合二人のフォロワーの間には何らかのつながりがあることが予想されます。そこでそのつながりを見てやることでいくつかのグループが出てくるのではないかと期待できそうです。 Twitterの分析をする場合、いつもはTweepyを使っているのですが妙に遅く感じたのでPython で Twitter API にアクセスを参考にJSONをそのままリクエストします。対象はフォロワーの少ない自分のbot@mitra_sun22としました。 #!/usr/bin/
オライリーの『実践機械学習システム』を読んでいたところ、文書のクラスタリングの話が出てきたので、以前国連総会の決議文書をword2vecにぶち込んでみたことをふと思い出す。 同じコーパスを使って別の手法を使ったらどうなるのか、ということで、今回は上の本の中に出てきたKMeans法で文書のクラスタリングを試してみることにする。とはいえ基本的には本に書いているコードのコピペ…。 なお、コーパスとしては第48回〜第68回総会までの決議文書を使って、第69回の文書がちゃんと分類されるかどうかを試してみることにする。 #文書ファイルの参照用 import glob #文書のベクトル化 from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import Tfid
2014.12.6. Nagoya.R #12 外国語教育研究の仮想データを用いてRのlme4パッケージやlmerTestパッケージを使ってみるというような主旨の発表です。 slideshare上から無料でダウンロードできなくなってしまったので,speakerdeckにも同じ資料をあげました。ダウンロードされたい方,広告がうっとおしいという方は下記のURLからどうぞ。 https://speakerdeck.com/tam07pb915/an-introduction-to-lme Read less
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く