研究に関するsumie_n_yのブックマーク (27)

  • FrontPage - M1GP

    M1 Grand Prixとは † M1 Grand Prixは、浅見・川原研、森川研、瀬崎研、喜連川・豊田研のM1およびB4が、クラウドコンピューティング、ユビキタスコンピューティング、センサネットワーク、ソーシャルネットワークなどの名著と思う論文を一つ選び、披露する論文発表会です。 投票の結果、最も面白いと思った論文を紹介した人をグランプリとして表彰します。力の限り面白い研究を選び、紹介してください。 グランプリは 新規性 有効性 手法の完全性 他の研究への波及効果 そもそも説明がわかりやすかったか を基準に選定します。 選んだ論文そのものが面白いのはもちろん、理解力と発表スキルも試されます。 ↑

  • Rakuten Institute of Technology | 楽天技術研究所

    In order to surpass human intelligence, we must first observe and deeply understand the nuances of human behaviors and actions. As the R&D organization of the Rakuten Group, we research and develop technologies and algorithms to create new, valuable services. LEARN MORE In order to surpass human intelligence, we must first observe and deeply understand the nuances of human behaviors and actions. A

    Rakuten Institute of Technology | 楽天技術研究所
  • 俺CiNii

    Strict Standards: Non-static method Configure::getInstance() should not be called statically in /home/sd/public_html/pub/mitan/cp/cake/bootstrap.php on line 38

  • MicrosoftAcademicSearchのすゝめ - くまメモ

    Microsoft Academic Searchみなさん使ってますよね! Microsoft Academic Researchではありません。 研究する上で知らないわけにはいかない情報をまとめて知ることが出来るお役立ち検索サイトです。 http://academic.research.microsoft.com/ こんなトップページを開いて、検索窓から好きな研究者や研究テーマに付いて検索してみましょう。 ここはArt of mutiprocessor programmingの著者であるMaurice先生について検索してみます。 あっさり見つかりましたね。 PublicationやCitationといった数を閲覧できます。想像付くと思いますが、publicationは出版論文数、Citationは被引用数です。 出版論文が242件に対して被引用数7255件でかなりの活躍っぷりが想像されま

    MicrosoftAcademicSearchのすゝめ - くまメモ
  • twitterで自然言語処理 - Preferred Networks Research & Development

    勢い余ってスイカを買ったら、毎日べるハメになってしまいました。海野です。 どんな業界もそうだと思いますが、世の中の流行りものの論文が増えるという面が自然言語処理界隈にもあります。Web、blog、と来て、最近のトレンドはやはりtwitterに代表されるmicro blogでしょうか。今年の言語処理学会の年次大会でtwitterセッションは大盛況でしたが、国際会議でもtwitterを題材として発表が増えています。 数えてみたら、重要国際会議であるACLで6件、EMNLPでも3件、twitterをタイトルに含む発表が今年ありました。ちなみに2010年の会議では1件もありませんでした。そんなわけで、私も今日はそんな流行りに乗っかって、twitter言語処理関連の論文を3つ紹介します。 Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! UsingWord

    twitterで自然言語処理 - Preferred Networks Research & Development
  • Help:画像の表示 - Wikipedia

    各ページにて画像を表示させる方法について説明します。そのためのマークアップの仕方や、また各種の引数の指定による表示の変化を説明します。表示できる画像は、ウィキペディア日語版またはウィキメディア・コモンズに既にアップロードされた画像のみです。アップロードの方法などについては「Help:画像などのファイルのアップロードと利用」を参照してください。 どのような場合にどのような表示方法をとるべきかについては「Wikipedia:画像利用の方針#配置」を参照してください。 編集ツールバーによって入力を補助でき、ファイル名さえわかっていれば複雑なマークアップを覚える必要ありません。「埋め込みファイル」を押し、ファイル名や説明書きをキャプションに入力し、位置などを決定し「ファイル挿入」を押します。サイズ、配置、形式などについては以降の要点などを理解したほうが、うまく表示できるでしょう。 「上級」から複

  • » chasen grammer.cha 辞書に品詞を追加する Blog BBTUNE

    unity, titanium mobile, php, javascript等開発支援行います。お気軽にお問い合わせください。 固有名詞にbbtuneという品詞を入れてみる。 grammer.cha (名詞 (一般) (固有名詞 (一般) (人名 (一般) (姓) (名)) (組織) (bbtune (一般)) (地域 (一般) (国))) これで Noun.bbtune.dicに単語を登録 (品詞 (名詞 固有名詞 bbtune 一般)) ((見出し語 (bbtune 2500)) (読み ビービーチューン) (発音 ビービーチューン) ) connect.chaに追加、今回は地域と全く同じで良いので地域一般と同じ行をbbtuneとして更新 awk '{print $0 ; if($0 ~/地域 一般/){gsub("地域","bbtune",$0);print $0;}}' conn

  • LeaveBehind » ChaSen辞書の語彙を増やす。

  • はてなブログ | 無料ブログを作成しよう

    新米と秋刀魚のわた焼き お刺身用の秋刀魚を買いました。1尾250円です 3枚におろして、秋刀魚のわたに酒、味醂、醤油で調味して1時間ほど漬け込み、グリルで焼きました 秋刀魚のわた焼き わたの、苦味が程よくマイルドに調味され、クセになる味わいです 艶やかな新米と一緒に 自家製お漬物 土…

    はてなブログ | 無料ブログを作成しよう
  • Twitter重要度分析計算(グラフ理論 ソーシャルネットワーク) : 研究開発

    最後に,全ての手法においてランキングを行った際の,それぞれの手法の上位5 人の投稿者ID を表1 に示す.この表1 を見ると,I によるランキングの上位がFF によるランキングの上位と似ていることがわかる. ここからI がFF に大きく左右されていることが見て取れる.また,フォロワー数の多さで並べた順とは違う結果になっている. つまり,フォロワー数の多さでは見つけることのできない投稿者を発見することに成功している. その点で,これらの指標の新たな可能性を示せている.全体を通して, これらの提案手法が従来にはない新たな指標となる可能性を秘めていることがわかった. 改良の余地はあるものの,投稿者の妥当な重要度推定が十分可能であるということを示せたと考えられる. 影響伝播モデルIDMの線形代数表現とTwitter 分析への応用 松村真宏 大阪大学大学院 第17回Webインテリジェンスとインタラク

    Twitter重要度分析計算(グラフ理論 ソーシャルネットワーク) : 研究開発
  • 国立国語研究所の言語コーパス整備計画KOTONOHA

    オンライン公開A オンライン公開B DVD等によるデータ全体の公開 著作権者への謝礼 個人情報の保護 KOTONOHA計画で構築する現代日語書き言葉均衡コーパスは、以下の方法で公開する予定です。 オンライン公開A オンライン公開B DVD等によるデータ全体の公開 公開は、2011年(平成23年)4月以降を予定しています。 オンライン公開A インターネット上でどなたでも利用していただける公開方法です。検索したい語やフレーズを入力すると、それを含む用例を検索して出力します。検索したいジャンル(新聞、雑誌、書籍など)や出版年代を指定する機能を提供しますが、以下のような制約も加えます。 多数の用例が見つかっても、最大で500件までしか出力しません。 出力する文脈の長さは検索対象語の前後それぞれ20文字程度で、収録するサンプルのごく一部にすぎません。 正規表現を用いた複雑な検索文字列の指定はできま

  • 松本研究室 - 奈良先端科学技術大学院大学/情報科学研究科

    自然言語処理学研究室 (松裕治研究室) では† 計算機による自然言語の自動解析・理解にむけて,言語構造の解明と定式化の研究を行っています.あわせて自然言語処理技術の応用についても研究しています. 主な研究内容

  • グラフ理論のサイトと書籍のご紹介 - salmonsnareの日記

    はじめに [更新: 2013/4/22]いくつか更新しました。 [/更新] §1では、グラフ理論のWWW上の資料で「これは良かった。役に立った。」と思えるものをご紹介します。 どちらかというと、グラフアルゴリズムより数学としてのグラフ理論を意識した資料を選びました。 §2では、グラフアルゴリズム等を含むより専門的な書籍をご紹介します。 1. グラフ理論のサイト Reinhard Diestel, Graph Theory Electronic Edition http://diestel-graph-theory.com/basic.html ディーステル先生のグラフ理論のテキストのpdf版です。基礎から応用まで丁寧に書いてあります。 応用についてはほとんど書かれておりませんが、その分数学的な色彩が強いです。 目次 1. The Basics: グラフの基礎です。次数やパス等の基的な定

    グラフ理論のサイトと書籍のご紹介 - salmonsnareの日記
  • 語の共起情報を用いたWeb検索

    概要 現在、Web上の莫大な情報の中から、ユーザが必要な情報を 得る手段として検索エンジンが広く用いられている。 各検索エンジンでは、検索結果を順位付けし、 一般的に評価の高いWebページを検索結果の上位と することで効率化を図っている。 しかし、有用であるということは主観的であるため、 一般的に評価の高いページが誰にでも有用であるとは限らない。 研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを 得ることで、各ユーザの要求により適合した結果を提示する 検索方法を提案する。 従来手法 重要語抽出の従来手法 多くの自然言語文書処理において用いられている 代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。 対象

  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

  • EuphoriaMourning

    ここに至って,またテキストマイニングにとり組む必要が出てきた。現在投稿中の論文のためである。 以前とり組んだテキスト分析は,手法的にはそれほどプロフェッショナルなものではない。以前の方法は, 1. 分析する英文テキストを用意 2. 品詞タグを埋め込む 3. 名詞に注目し,一文中によく連れだって登場する語のペアを特定し,そのリストをつくる(共起語分析) 4. 共起語をネットワーク図に描く という方法であった。だが,当時はまだコンピュータのプロフェッショナルではなかったため,これらの方法はなるべくプログラミングを行わない方向で行われたのである。具体的には,2.の品詞の解析にはBrill Taggerを用い,これを元にMLTPというソフトで共起語をカウント,さらにRでネットワーク図に描画する,という方法であった。この方法では,自分でプログラミングする必要はほとんどないものの(最後のRでほんの少し

    EuphoriaMourning
  • 指定したTwitterアカウントの全ツイートを取得(perl版) | Moonmile Solutions Blog

    Twitterアカウントを指定して、全ての発言(ツイート)を取得するための perl スクリプトです。 目的は、 あなたの彼の浮気調査 でもいいし(笑)、真面目に解析してもいいし。私の場合は、先に書いた「絡ったー」がらみで使う予定です。 twitter api を使うとアクセス制限(1時間に500回ぐらいかな)となるので、公式サイト http://twitter.com/ から直接引っ張ってきます。なので、公式サイトの形式が変わると取れなくなるんですが、ま、ひとまず、こんな感じで取得できるとという例として。 インストールは、 activeperl などをダウンロード wget をダウンロード 分かる人は、cUrl に変更しても ok コマンドラインから perl krmall.pl [アカウント] とすると、 全発言のファイル アカウント.txt 絡む人のファイル アカウント_st.txt

  • Sysomos | Reports and Whitepapers - Social Media Monitoring and Analytics

    Six Degrees of Separation, Twitter Style April 2010 Featured on Techcrunch.com, ReadWriteWeb.com Read Report Online

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • [chasen-users:00327] Re: 英数字 が混在する文字列の扱い

    To: chasen-users@is.aist-nara.ac.jp Subject: [chasen-users:00327] Re: 英数字 が混在する文字列の扱い From: masayu-a@is.aist-nara.ac.jp Date: Sun, 5 Oct 2003 14:51:34 +0900 (JST) Delivered-to: chasen-users@ml.aist-nara.ac.jp Delivered-to: chasen-users@is.aist-nara.ac.jp In-reply-to: Your message of "Sun, 05 Oct 2003 13:40:00 +0900".<20031005134000aoi@mail.pileup.com> List-help: <mailto:chasen-users-ctl@is.aist-na