追記(2022年7月31日) 大元になっている書籍の最新版はこちら Amazon.co.jp: 山内 志朗「新版 ぎりぎり合格への論文マニュアル」 最新版で以下のように述べられている。ごめんなさい。 それにまた、「すぐに使えるフレーズ集」(原版「ぎりぎり合格」 pp. 182-188)のところに「論文らしい言い換え」ということで、いろんな例を載せておいた。特にその最後のところにかいた「言い換え一覧」のところが、いろいろとパクられてネットに無断使用されている。そんなに意外ですか?コンパでよく話題にすることでしょ、というノリだったのだが、パクられまくりでいたるところに出てくる。 おわびにKindle版を購入しましたのでご容赦ください。 本文 とっても役に立つ。でも、どちらかというと小論文とかの書き方かな? 読書猿Classic: between / beyond readers:こう言い換えろ
In information retrieval, tf–idf (also TF*IDF, TFIDF, TF–IDF, or Tf–idf), short for term frequency–inverse document frequency, is a measure of importance of a word to a document in a collection or corpus, adjusted for the fact that some words appear more frequently in general.[1] It was often used as a weighting factor in searches of information retrieval, text mining, and user modeling. A survey
単語感情極性対応表 日本語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日本語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日本語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品
Semantic Orientations of Words These are the lists of words and their semantic orientations for Japanese and for English. You are welcome to use this resource fro a non-commercial purpose. The semantic orientation of a word indicates whether the word has positive meaning (e.g., beautiful, excellent) or negative meaning (e.g., dirty, inferior). The semantic orientations were automatically computed
2. 日本語評価極性辞書(名詞編) 評価極性を持つ(複合)名詞,約8千5百表現に対して評価極性情報を付与した,人手によるチェック済みのデータ.名詞の評価極性は概ね以下の基準に従う(東山, 2008). 〜である・になる(評価・感情)主観 「○○が〜である・〜になる」ことは,○○をP/Nと評価しているか? ポジティブ:誠実,安寧,親切,中立,名手,英雄,第一人者,幸せ ネガティブ:弱気,鬱 〜である・になる(状態)客観 「〜(という状態)になる」ことは良いことか悪いことか? ポジティブ: ネガティブ:ガン 〜い(評価・感情)主観 「〜い」は良いか悪いか? ポジティブ:美しさ ネガティブ:弱さ 〜する(感情)主観 「〜する」は良い感情か,悪い感情か? ポジティブ:感嘆 ネガティブ:失望 〜する(出来事) 「〜する」ことは嬉しいことか嫌なことか? ポジティブ:
In case you are aware of other available datasets, please let me know by leaving a comment on a corresponding blog post. Page updated and maintained by Markus Strohmaier. References [Grahsl 2010] H.P. Grahsl, C. Körner, M. Strohmaier. A Collection of Tagging Datasets Containing Complete Personomies From Heterogeneous Sources. Technical Report, Knowledge Management Institute, Graz University of Tec
R1 - Yahoo! Music User Ratings of Musical Artists, version 1.0 (423 MB) This dataset represents a snapshot of the Yahoo! Music community's preferences for various musical artists. The dataset contains over ten million ratings of musical artists given by Yahoo! Music users over the course of a one month period sometime prior to March 2004. Users are represented as meaningless anonymous numbers so t
The Yahoo Webscope Program is a reference library of interesting and scientifically useful datasets for non-commercial use by academics and other scientists. All datasets have been reviewed to conform to Yahoo's data protection standards, including strict controls on privacy. We have a number of datasets that we are excited to share with you. Yahoo is pleased to make these datasets available to re
チュートリアル等で作成した資料・解説です。 参考になった、コメント、感想、気になった点等あればご連絡頂けると幸いです。 機械学習入門 初心者向けの機械学習入門です。 LIBLINEARを用いた機械学習入門(単語分割) 第一回 機械学習を自然言語処理の分類問題に適用する入門ドキュメントです。 LIBLINEARという実装を用いて、自動単語分割モデルの学習を行います。 日本語 英語(近日公開できます) 言語モデル演習 河原研でM1向けに行っている言語モデル演習の資料です。 言語モデルの概要 単語bi-gramモデル・エントロピー 言語モデルの基礎、文字n-gramモデル、単語n-gramモデル、未知語モデルについて扱います。 また、言語モデルの評価としてエントロピーとカバレージについて扱います。 PDF KAWAHARA Lab Top Page Back to Yoshino's p
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日本語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日本語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
最尤推定 (さいゆうすいてい): 「最ももっともらしい」パラメーターの推定 「尤」の音読みは「ゆう」,訓読みは「もっともらしい (尤もらしい)」です. 尤度とは,ある確率論的モデルを仮定しているときに,その観測データが得られる確率 (あるいは確率密度) 簡単には,ある観測データに (あるパラメーターのもとで) 確率論的モデルが「どれぐらいあてはまっているか」を確率で表す尺度です 最尤推定とは,尤度を「手持ちの観測データのもとで,あるパラメーター値が得られる確率」とみなして (つまり尤度が未知パラメーターの関数とみなして),尤度を最大化するようなパラメーター値を探索する推定方法です 最尤推定法を使う手順は 尤度方程式を作る: 確率論的モデルを作り (データがどういう確率分布に従うか,確率分布のパラメーターの関数型はどうなってるか),それを数式として定義する……これが尤度方程式である 尤度最大
大規模データが公開されているサイトについて以下のQuoraでid:makimotoさんが質問していました。Data: Where can I get large datasets open to the public? - Quora以下、紹介されているサイトの一覧です。一部有料のものもあるようです。UCI Machine Learning RepositoryPublic Data Sets : Amazon Web ServicesCRAWDADno titleCity of Chicago | Data PortalGovLoop | Social Data Network for Governmentdata.gov.uk | Opening up governmentData.Medicare.GovData.Seattle.Gov | Seattle’s Data SiteOp
ソーシャルメディアマーケティング.jpではソーシャルメディアを活用したマーケティング手法を解説していきます。SNS、ブログ、ソーシャルブックマークなど周辺ニュースの紹介もしています。 ソーシャルブックマークデータの時間情報を用いた情報フィルタリングと検索 慶應義塾大学 上野さん トップの人気エントリーに入るとブクマ数が増えるので、有用度と完全に相関しているわけではない。また、各SBMによって偏りがある。 ・ブクマ数と時間の関係をグラフ化 1.一時的に急激にブクマされてそのあとはあまりブクマされないページ 2.長期間にわたってブクマされるタイプのページ ・時間情報に基づきWebページの種類を分析 まったくタイプが違うことがわかった →ブクマされる期間でページを選別できるのではないか 不要な種類のページをフィルタリングできる ・ランキングロジック 指定したタグにおいての ポイント=ブクマ数×日
インターネット関連事業のライブドアは、同社のソーシャルブックマークサービス「livedoorクリップ」のサイトで公開しているURL、タグ、作成時刻の生データを、研究機関や法人の研究者や個人にCSV形式で無料提供する「EDGE Datasets(エッジデータセット)」のサービスを1月15日開始した、と同日発表した。データ利用は学術目的を前提とし、指定の問い合わせフォームからリクエストした個人にダウンロード用のURLとパスワードを提供する。 研究者はEDGE Datasetsによって容易に研究用集計や加工ができ、レコメンデーションやデータマイニングの研究に活かすことができるという。研究機関や大学、大手通信企業などでソーシャルブックマークの研究が進む中、研究には事業者サイトを巡回してクロールする必要があった。同社は研究者らをサポートするためEDGE Datasetsを行うことにした。livedo
前の記事 台所で生じる「ホワイトホール」:物理学者が検証 Twitterで株式市場を予測:「86.7%の精度」 2010年10月22日 サイエンス・テクノロジー コメント: トラックバック (0) フィードサイエンス・テクノロジー Lisa Grossman Image: flickr/Perpetualtourist2000 ある1日に『Twitter』の世界(Twitterverse)がどのくらい平穏だったかを測定することで、3日後の『ダウ・ジョーンズ工業株価平均』の変化の方向性を86.7%の精度で予測できるという研究成果が発表された。 この発見は、(別の研究から派生した)ほとんど偶然によるもので、研究者たち自身が驚いている。インディアナ大学のJohan Bollen准教授(社会科学)らによる研究論文は、プレプリント・サーバー『arXiv.org』に掲載された。 これまでの研究によって
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く