総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 自然言語で記述された文で、 感情価というか情緒的意味の分析なんかしたいと思ったのですが、Rではどうやるのでしょうか? 因子分析は多変量の潜在的因子...直接出てこない要因を見つけ出す為の分析です。 自然言語には限りませんがこういう場合は因子分析が採用される事は多いと思います。以前はこれにどんな価値があるのか良く分かって無かったんですが、ようやく少し分かってきたと思います。 実際は種類があり、 ・探索的因子分析 通常、因子分析はこちらを指すと思います。。 ・確認的因子分析 の場合は、 先にモデルを作っておく、共分散構造
小説家になろうのアレとか、他にもそういう空想地図たくさんあるんですが、 あまり科学的に正しくない地形だと思ってるんですよ。 では、科学的に正しい地形生成とは、 まず、プレートテクトニクスから考えると... 太平洋の土台と変動 根建心具 鹿児島大学 南太平洋海域調査研究報告 Occasional papers 31, 1998 地球上の陸地は超大陸⇔分裂を繰り返してきた というモデルです。 最も、海洋プレートと大陸プレートって何か決定的な違いがあるんでしょうか? 大陸プレートの方が比重が軽いから、プレート衝突部では海洋プレートが必ず大陸プレートの下に沈み込む?らしいのですが、新しいプレートが作られる場所は必ず海嶺になってるので、と言う事は、大陸の地層は何十億年もずっと地球の表面にあって、海の地層は若いという事になりそうですが。 いずれにしても地球型惑星では陸地のほとんどは大陸として存在し、島
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 書籍化されてる作品とても多いのですが、一体どんな作品が人気集めるのでしょうか? APIでメタデータを含め収集できますが、しかしAPIパラメータのstが、(1〜2000)なのでは、全部取得なんてどうやっても出来ないのでは... いや、 useridを全部チェックすれば、 一人2000以上投稿してる人がいなければ、全部取得できるのかもしれません。 とりあえず様々な昇順降順で2000件ずつ、 途中で何の原因か分からないのですが止まってたのですが、とりあえずapiで18万件取得できました。 そして、その中には当然重複があるの
どんなツイートはリツイートされるか?2014 時は、デバイスとかしか考えてなかったんですが、 今度はtweetの内容、をじっくり検証する事にしました。 対象はいつも通り https://stream.twitter.com/1.1/statuses/sample.json 期間は 2014/4/26 〜 2014/5/1 ぐらいです。 サンプル中、 "lang":"ja" であったのは 9991 その内リツイートは 2099 リツイートでは無いのは 7892 しかし、このリツイートとは、リツイートされたという意味では無く、リツイートした方なので、同一のtweet(文章)が複数回入ってきたりします。 だから、このリツイートの意味が 単純な確率では無く 期待値のような意味になってくると思うのですが... さてリツイートされるリフト値の降順では
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 大体誰でも考えると思うんですがどのようなタイトルであればブックマークされやすいのでしょうか? 特にSEO業者みたいな人が得意気に解説する事が多いですが、あれは本当でしょうか? 検証してみましょう。 新着はてなブックマーク閾値50 http://b.hatena.ne.jp/entrylist?sort=new&threshold=50&mode=rss これを「たくさんブックマークされるタイトル」にしましょう 期間は、2014-04-17 12:00 〜 2014-04-21 12:00 その総数は、 たったの 36
まず最初にwebsocket使う方法があります。 Androidのカメラ画像をリアルタイムにパソコンから見られる「WSCamera for Android」を作った Androidでwebsocketサーバ立ち上げれば、こういうことができるんですね。 しかしこの構成だとアクセスが集中したらandroid大丈夫なんでしょうか?大丈夫じゃない気がするんですが。 しかしそれはwebsocket サーバを別にすれば、単純な負荷は何とかなります。 webベースならMediaStream APIという手もありますが これもデータはwebsocketを通すので、websocket以外の方法は... WebRTCでそれが出来るそうです。 peer to peer の実装は簡単です。 デモが、その通りだからです。 そして、これはAndroidのchromeでもライブが出来ます。 ブラウザをシャットダウンしな
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 word2vecの勉強しないといけないと思ったので、 Efficient Estimation of Word Representations in Vector Space. Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. Google Inc. In Proceedings of Workshop at ICLR, 2013. We propose two novel model architectures for computing contin
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 ほとんどの場合、時系列分析で対象にされてるのは、経済指標です。 生活保護率の上昇要因−長期時系列データに基づく考察− (独)労働政策研究・研修機構 周燕飛 学習院大学経済学部 鈴木亘 一橋大学経済研究所世代間問題機構ディスカッション・ペーパー 525 図1は、1990年度以降の生活保護受給者数、世帯数の推移をみたものであるが、1992年度ぐらいから両者とも増加の一途をたどっており、2006年度から2008年度にかけてややペースダウンしたものの、2009年度以降は再び、かつてないほどの急増が起きている。2011年3
昨年10月にはtwitterのコンテンツの方をよく見てなかったんですが、 .jsonには 各々tweet(text、source)だけでなくユーザ( 言語、 source 、 フォロー数、フォロワー数、tweet数、お気に入り数 )なども直接見ることができるので、 と、いうことは どんなハードウェア使ってるユーザがどれだけツイートするのか、とか 複合条件下のリツイート傾向とか、も分かりますよ。 https://stream.twitter.com/1.1/statuses/sample.json このsample.jsonが本当に一様なサンプルであるのかはかなり疑問なのですが 2014/1/28〜1/31の間に時間開けてサンプリングしました。 たった10万tweetぐらいで 270MBにもなります。 ........... サンプルが本当に一様ならば、全tweetの内 24215/997
Visual studioに加えてXamarinをインストールするとiOS,Android,windows phone全てに互換性があるアプリケーションが開発できるとかいう話だったので ユーザ登録時に電話番号まで聞かれるんですが、しかし、ユーザ登録しなくても使えるでしょうか? よく確認してなかったんですが 最初はVisual StudioのテンプレートにAndroid,iOSは無かったはずで、Xamarinをインストールすると、自動的にこれらが追加されるんでしょうか XamarinでAndroid apkの作り方 誰も教えてくれないんですが、 プロジェクト ⇒ Publish to testflight の方ではないです。 プロジェクト ⇒ アクティブなコンフィグレーション を、Release の方にします。 そうすると プロジェクト ⇒ Publish Android Applicati
Androidでこれを実行出来るんじゃないかと思ったんですが、123Dでも結局モデルはサーバ側で生成するし 結局、操作性なんかで スマートフォンでは画像撮るだけにしてコンピュータで立体化するのが、 やはり一番なのでは... ところで写真撮影で3Dスキャナのような事をするこれは、写真測量法(Photogrammetry) と、言います。 元々測量のための手法でしたが、3Dスキャンにも応用されています。 Current_suite_of_softwareこのリンクにソフトウェアが... ほとんどのソフトウェアは有料です。無料では大幅に機能が制限されます。 実際に試してみて、ほとんどのソフトウェアがそうなのですが 対象は全方向から写真100枚ぐらいは欲しいみたいです。 5,6枚では到底3次元モデルは作れません... そして、画像はちゃんとピント合わせて撮影したいです。 これが、しっかりピント合っ
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 クラウドソーシングによって最適な価格設定がなされるだろうか?という疑問なのですが、 どうも、良くないことにしかならないような気がするのですが...? クラウドソーシングによる問題解決手法のタスク請負者に関する均衡分析 畠中将徳 京都大学 2010 例えば,請負者が自分の効用のみに関心がある場合を想定すると,請負者の利己的なタスク選択により,特定のタスクに請負者が集中し,効率的なタスク割当が行われない可能性が考えられる. タスクの性質や請負者の能力による効率性への影響が明らかであれば,クラウドソーシングを用いて新たな問
世紀の革命児?稀代の問題児?キーチ、動き出す! 何かに絡め取られ、がんじがらめになって、どうにも抜け出せない多くの悩める人々よ。もう手遅れだ、未来にも何にも期待できない、と諦めてる人々よ。 だけど、個人の怒りこそが、世界を変えることができるはず。 政官財の最重要人物を標的に、キーチと劇団・波羅蜜多はテロ(?)を仕掛けようと準備を急ぐ。今までの友人や仲間を捨ててまで、自らの蛮勇に懸けた主人公染谷輝一の、思いと初恋を描いた第5集。 お前らこそが 俺の敵だったってことだ!! 世の中そんな仕組みでできてる当たり前だとか、 そんなカラクリ知ってるだとか、 誇らしげにぬかす連中が 腐るほどいることに ヘドが出る。 ワルぶって照れるな。 キーチ答えろ。テロか正義か、正義のテロか。 大地震が来ないかなと思ってないか。 誰かがやってくれると思ってないか。 TVやゲームに笑わされるだけで、誰かを笑わすことはな
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 midi2abcをブラウザで実行したかったので、ネイティブアプリケーションでの実装を考えてたんですが、 EmscriptenでCの実行ファイルをjavascriptに変換すればブラウザから直接実行できるようになるではないですか。 Emscriptenのインストールは、 > git clone https://github.com/kripken/emscripten.git これでもう使える状態になってます > cd emscripten > ./emcc のように実行しますが (Emscripten: unknow
要約 2013/02/02から02/06にかけて tweet およびtwitterアカウントのランダムサンプリングを行いその傾向を調べた。 その結果言語別に大きく使われ方が異なるということが分かった。 例えば ・日本語のリツイート率は全ての言語の中で最低である。 ・国別(言語別)にtwitterを利用するデバイスの割合が著しく異なる。 ・一人あたりのtweet数は日本語が最大ではないかと思われるが、アラビア語の方が大きい可能性は否定できない。 ・上位1%のユーザが全体の過半のtweetをしてる。 2012年の統計は、言語別twitterユーザとtweet統計 2012 2013/10の統計 2013/02/02 03:00:00 +0000 〜 2013/02/06 03:00:00 +0000 この96時間のtweetをstreaming API でランダムサンプリング サンプル率ははっ
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 別に(ソーシャル)ゲームに限らず、ユーザのそういった行動ログはweb閲覧履歴など...の形態で蓄積されていたはずで,それに比べてデータ量が大きく増えたわけではないのに、何で今更ビッグデータがどうのこうのと言われているんでしょうか? ソーシャルゲームの会社は口を揃えてユーザの行動ログを分析...マイニングして売り上げ増やしたいと思ってますが、しかしデータマイニングについては基本的に心構えというか、ある種の"覚悟"のようなものが要りますよ。 「ビッグデータがあるので、これを分析して何か面白いことがわからないか」 とか言う
総合研究大学院大学 複合科学研究科 情報学専攻 卒 博士(情報学) 自然言語処理や機械学習、データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 そういうことをやっておいた方が良いみたいなので、使っておこうと思いました。 The Comprehensive R Archive Network linuxで上手くインストールできないなら、 CentOS6.2へのRインストール わたくしはインストールに問題なかったので、あまり見ていません。 R言語でファイル読み込みは、 data00<-read.table("filename") こうするだけです。 csv形式のファイルだったら、 read.csv("filename") read.delim と read.ta
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く