[B! 研究] sea_mountainのブックマーク

カイ２乗分布とは

sea_mountain 2012/01/18

研究

リンク

リンク：論文に死んでも書いてはいけない言葉３０ - 発声練習

追記（2022年7月31日）大元になっている書籍の最新版はこちら Amazon.co.jp: 山内志朗「新版ぎりぎり合格への論文マニュアル」最新版で以下のように述べられている。ごめんなさい。それにまた、「すぐに使えるフレーズ集」（原版「ぎりぎり合格」 pp. 182-188）のところに「論文らしい言い換え」ということで、いろんな例を載せておいた。特にその最後のところにかいた「言い換え一覧」のところが、いろいろとパクられてネットに無断使用されている。そんなに意外ですか？コンパでよく話題にすることでしょ、というノリだったのだが、パクられまくりでいたるところに出てくる。おわびにKindle版を購入しましたのでご容赦ください。本文とっても役に立つ。でも、どちらかというと小論文とかの書き方かな？読書猿Classic: between / beyond readers：こう言い換えろ

sea_mountain 2012/01/04

リンク

機械学習はじめよう記事一覧 | gihyo.jp

sea_mountain 2011/11/27

リンク

GitHub - kyow/tfidf_ja: tfidf_jaは与えられた単語の配列の TF-IDF を算出し、単語をキー、TF-IDF値をバリューとするハッシュテーブルを返却するライブラリです。

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

sea_mountain 2011/11/20

リンク

tf–idf - Wikipedia

In information retrieval, tf–idf (also TF*IDF, TFIDF, TF–IDF, or Tf–idf), short for term frequency–inverse document frequency, is a measure of importance of a word to a document in a collection or corpus, adjusted for the fact that some words appear more frequently in general.[1] It was often used as a weighting factor in searches of information retrieval, text mining, and user modeling. A survey

sea_mountain 2011/11/20

" to give a measure of the importance of the term t within the particular document d."

リンク

単語感情極性対応表

単語感情極性対応表日本語および英語の単語とその感情極性の対応表を、研究目的の利用に限り公開します。感情極性とは、その語が一般的に良い印象を持つか（positive）悪い印象を持つか（negative）を表した二値属性です。例えば、「良い」、「美しい」などはpositiveな極性、「悪い」、「汚い」などはnegativeな極性を持ちます。感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。リソースとして、日本語は「岩波国語辞書（岩波書店）」を、英語はWordNet-1.7.1を使わせていただきました。こちらからダウンロードしてください→[日本語] [英語] フォーマットは、各行が一単語に対応し、見出し語:読み:品

sea_mountain 2011/11/17

positiveな語の割合…

リンク

PN Table

Semantic Orientations of Words These are the lists of words and their semantic orientations for Japanese and for English. You are welcome to use this resource fro a non-commercial purpose. The semantic orientation of a word indicates whether the word has positive meaning (e.g., beautiful, excellent) or negative meaning (e.g., dirty, inferior). The semantic orientations were automatically computed

sea_mountain 2011/11/03

リンク

日本語評価極性辞書

2. 日本語評価極性辞書（名詞編）評価極性を持つ（複合）名詞，約8千5百表現に対して評価極性情報を付与した，人手によるチェック済みのデータ．名詞の評価極性は概ね以下の基準に従う（東山, 2008）．〜である・になる（評価・感情）主観「○○が〜である・〜になる」ことは，○○をP/Nと評価しているか？ポジティブ：誠実，安寧，親切，中立，名手，英雄，第一人者，幸せネガティブ：弱気，鬱〜である・になる（状態）客観「〜（という状態）になる」ことは良いことか悪いことか？ポジティブ：ネガティブ：ガン〜い（評価・感情）主観「〜い」は良いか悪いか？ポジティブ：美しさネガティブ：弱さ〜する（感情）主観「〜する」は良い感情か，悪い感情か？ポジティブ：感嘆ネガティブ：失望〜する（出来事）「〜する」ことは嬉しいことか嫌なことか？ポジティブ：

sea_mountain 2011/11/03

リンク

A List of Social Tagging Datasets Made Available for Research

In case you are aware of other available datasets, please let me know by leaving a comment on a corresponding blog post. Page updated and maintained by Markus Strohmaier. References [Grahsl 2010] H.P. Grahsl, C. Körner, M. Strohmaier. A Collection of Tagging Datasets Containing Complete Personomies From Heterogeneous Sources. Technical Report, Knowledge Management Institute, Graz University of Tec

sea_mountain 2011/10/03

研究

リンク

Webscope | Yahoo Labs

R1 - Yahoo! Music User Ratings of Musical Artists, version 1.0 (423 MB) This dataset represents a snapshot of the Yahoo! Music community's preferences for various musical artists. The dataset contains over ten million ratings of musical artists given by Yahoo! Music users over the course of a one month period sometime prior to March 2004. Users are represented as meaningless anonymous numbers so t

sea_mountain 2011/09/29

リンク

Webscope | Yahoo Labs

The Yahoo Webscope Program is a reference library of interesting and scientifically useful datasets for non-commercial use by academics and other scientists. All datasets have been reviewed to conform to Yahoo's data protection standards, including strict controls on privacy. We have a number of datasets that we are excited to share with you. Yahoo is pleased to make these datasets available to re

sea_mountain 2011/09/29

研究

リンク

BibSonomy Dataset :: dumps for research purposes

sea_mountain 2011/09/29

研究

リンク

livedoor

sea_mountain 2011/09/29

研究

リンク

Tutorial

チュートリアル等で作成した資料・解説です。参考になった、コメント、感想、気になった点等あればご連絡頂けると幸いです。機械学習入門初心者向けの機械学習入門です。 LIBLINEARを用いた機械学習入門（単語分割）　第一回機械学習を自然言語処理の分類問題に適用する入門ドキュメントです。 LIBLINEARという実装を用いて、自動単語分割モデルの学習を行います。日本語　英語（近日公開できます）言語モデル演習河原研でM1向けに行っている言語モデル演習の資料です。言語モデルの概要単語bi-gramモデル・エントロピー言語モデルの基礎、文字n-gramモデル、単語n-gramモデル、未知語モデルについて扱います。また、言語モデルの評価としてエントロピーとカバレージについて扱います。 PDF KAWAHARA Lab Top Page Back to Yoshino's p

sea_mountain 2011/07/29

リンク

日本語 WordNet (wn-ja)

日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに着想をえて、日本語のワードネットを構築し、オープンで公開します。独立行政法人情報通信研究機構（NICT）では、自然言語処理研究をサポートする一環として、2006年に日本語ワードネットの開発を開始しました。最初の版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

sea_mountain 2011/07/14

研究

リンク

生態学データ解析 - 最尤推定法とは

最尤推定 (さいゆうすいてい): 「最ももっともらしい」パラメーターの推定「尤」の音読みは「ゆう」，訓読みは「もっともらしい (尤もらしい)」です．尤度とは，ある確率論的モデルを仮定しているときに，その観測データが得られる確率 (あるいは確率密度) 簡単には，ある観測データに (あるパラメーターのもとで) 確率論的モデルが「どれぐらいあてはまっているか」を確率で表す尺度です最尤推定とは，尤度を「手持ちの観測データのもとで，あるパラメーター値が得られる確率」とみなして (つまり尤度が未知パラメーターの関数とみなして)，尤度を最大化するようなパラメーター値を探索する推定方法です最尤推定法を使う手順は尤度方程式を作る: 確率論的モデルを作り (データがどういう確率分布に従うか，確率分布のパラメーターの関数型はどうなってるか)，それを数式として定義する……これが尤度方程式である尤度最大

sea_mountain 2011/07/12

尤度

研究

リンク

大規模データを無料で手に入れることのできるサイトまとめ - nokunoの日記

大規模データが公開されているサイトについて以下のQuoraでid:makimotoさんが質問していました。Data: Where can I get large datasets open to the public? - Quora以下、紹介されているサイトの一覧です。一部有料のものもあるようです。UCI Machine Learning RepositoryPublic Data Sets : Amazon Web ServicesCRAWDADno titleCity of Chicago | Data PortalGovLoop | Social Data Network for Governmentdata.gov.uk | Opening up governmentData.Medicare.GovData.Seattle.Gov | Seattle’s Data SiteOp

sea_mountain 2011/06/20

研究

リンク

ソーシャルブックマークデータの時間情報を用いた情報フィルタリングと検索　第2回SBM研究会ログ - ソーシャルメディアマーケティング(SMM).jp

ソーシャルメディアマーケティング.jpではソーシャルメディアを活用したマーケティング手法を解説していきます。SNS、ブログ、ソーシャルブックマークなど周辺ニュースの紹介もしています。ソーシャルブックマークデータの時間情報を用いた情報フィルタリングと検索　慶應義塾大学　上野さんトップの人気エントリーに入るとブクマ数が増えるので、有用度と完全に相関しているわけではない。また、各SBMによって偏りがある。・ブクマ数と時間の関係をグラフ化１．一時的に急激にブクマされてそのあとはあまりブクマされないページ２．長期間にわたってブクマされるタイプのページ・時間情報に基づきWebページの種類を分析まったくタイプが違うことがわかった →ブクマされる期間でページを選別できるのではないか不要な種類のページをフィルタリングできる・ランキングロジック指定したタグにおいてのポイント＝ブクマ数×日

sea_mountain 2011/06/03

研究

リンク

ライブドアがソーシャルブックマークの生データを研究者にCSV形式で無料提供 | Web担当者Forum

インターネット関連事業のライブドアは、同社のソーシャルブックマークサービス「livedoorクリップ」のサイトで公開しているURL、タグ、作成時刻の生データを、研究機関や法人の研究者や個人にCSV形式で無料提供する「EDGE Datasets(エッジデータセット)」のサービスを1月15日開始した、と同日発表した。データ利用は学術目的を前提とし、指定の問い合わせフォームからリクエストした個人にダウンロード用のURLとパスワードを提供する。研究者はEDGE Datasetsによって容易に研究用集計や加工ができ、レコメンデーションやデータマイニングの研究に活かすことができるという。研究機関や大学、大手通信企業などでソーシャルブックマークの研究が進む中、研究には事業者サイトを巡回してクロールする必要があった。同社は研究者らをサポートするためEDGE Datasetsを行うことにした。livedo

sea_mountain 2011/06/03

研究

リンク

Twitterで株式市場を予測：「86.7％の精度」 | WIRED VISION

前の記事　台所で生じる「ホワイトホール」：物理学者が検証 Twitterで株式市場を予測：「86.7％の精度」 2010年10月22日サイエンス・テクノロジーコメント：トラックバック (0) フィードサイエンス・テクノロジー Lisa Grossman Image: flickr/Perpetualtourist2000 ある1日に『Twitter』の世界(Twitter verse)がどのくらい平穏だったかを測定することで、3日後の『ダウ・ジョーンズ工業株価平均』の変化の方向性を86.7％の精度で予測できるという研究成果が発表された。この発見は、(別の研究から派生した)ほとんど偶然によるもので、研究者たち自身が驚いている。インディアナ大学のJohan Bollen准教授(社会科学)らによる研究論文は、プレプリント・サーバー『arXiv.org』に掲載された。これまでの研究によって

sea_mountain 2011/03/14

株式市場

リンク

はてなブックマーク

タグ

関連タグで絞り込む (17)

研究に関するsea_mountainのブックマーク (24)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス