タグ

研究に関するY_sekkyのブックマーク (29)

  • 豊橋技術科学大学とGunosyの共同研究~産学連携は何をもたらすのか -

    こんにちは、採用広報の市村です。Gunosyでは、2017年より豊橋技術科学大学の吉田光男助教と共同研究を行っています。2018年12月には、チリやシアトルで開催された国際学会「IEEE BigData 2018」にて、クリックベイトやフィルターバブル、エコーチェンバーに関する発表を行いました。今回のGunosiruでは、お二人の共同研究や、企業と大学の産学連携という大きなテーマについてお話を伺います。 ■吉田 光男氏(写真右)/豊橋技術科学大学 助教 筑波大学第三学群卒業、同大学院システム情報工学研究科博士後期課程修了。博士(工学)。学部在学中にロボット型ニュース検索エンジンCeek.jp Newsを開発し、2006年に有限会社てっくてっくを創業。2011年より日学術振興会特別研究員(DC1)、2014年より豊橋技術科学大学大学院工学研究科(情報・知能工学系)助教。現在は教育研究に従事

    豊橋技術科学大学とGunosyの共同研究~産学連携は何をもたらすのか -
  • 自然言語処理×ジャーナリズムな研究まとめ ~ EMNLP2017 Workshopより ~ - Gunosyデータ分析ブログ

    いつものやつ はじめに 各研究の分類 ニュースの品質に関する研究 Predicting News Values from Headline Text and Emotion Incongruent Headline: Yet Another Way to Mislead Your Readers Deception Detection in News Reports in the Russian Language Fake News Detection using Stacked Ensemble of Classidiers From Clickbait to Fake News Detection: An Aproach based Detecting the Stance of Headlines to Articles ニュースとユーザとの関係に関する研究 Predicting U

    自然言語処理×ジャーナリズムな研究まとめ ~ EMNLP2017 Workshopより ~ - Gunosyデータ分析ブログ
    Y_sekky
    Y_sekky 2017/12/19
    是非見ておきたい情報ですね
  • 研究者流 コーディングの極意 言語処理学会第19回年次大会(NLP2013) チュートリアル資料(岡崎担当分)

    言語処理学会第19回年次大会 (NLP2013) チュートリアル資料(岡崎担当分) 岡崎 直観 東北大学大学院情報科学研究科 okazaki at ecei.tohoku.ac.jp http://www.chokkan.org/ @chokkanorg 研究者流 コーディングの極意 1 研究におけるコーディングの極意? • 今回のチュートリアルをきっかけにサーベイ – ソフトウェアエンジニア向けの指南書は存在 – でも,研究者向けの資料は数少ない • 自分が修士課程の頃は完全に我流だった – 複数文書自動要約のプログラムをすべてC++で実装 – *NIXを使うスキルはなく,すべてWindows上で実行 – 今から考えると,無駄だらけの実験作法だった • ほとんどの大学では実験の講義があるが… – 研究のためのコーディング作法は教えてくれない 2 繰り返される残念な光景 • 論文の締切前日

  • http://www5.ocn.ne.jp/~botan/map_g.html

  • デマをデマと見抜けない人はTwitterを使うのは難しい - kisa12012の日記

    Twitterにおけるデマ検出手法を論じた研究が,ついにEMNLP2011に出てきたので紹介します. 論文:Rumor has it: Identifying Misinformation in Microblogs[Qazvinian et al., 2011] Twitter上のデマに関する興味深い統計情報も幾つか含まれているので,興味のある方は一読されると良いかと思います. 概要 噂と噂に関連するツイートを検出すると同時に,その噂の信頼度を推定 様々な特徴量を用いて実験 ツイートの文面を使って分類器を作るだけで,高い精度が実現可能! ただし,アノテートされたツイートを教師データとして使用 背景 マイクロブログ上で噂は急速に広まる デマや誤情報は,企業にとって大きな障害となりうるので自動で特定したい この研究では,以下の手順でデマや誤情報を検出する 特定の噂に関して言及しているツイート

    デマをデマと見抜けない人はTwitterを使うのは難しい - kisa12012の日記
  • 情報検索ことはじめ〜教科書編その2 (2011年決定版) 〜 - シリコンの谷のゾンビ

    しばらく情報検索に関わるブログ記事を書いていなかったけれど,「情報検索ことはじめ〜教科書編〜」から丸2年が経過し,Modern Information Retrievalの第二版が発売されたことで,2011年版を書いてみようと思ったので,ここ2年で発売された情報検索の教科書について書くことにする. あの頃は検索を勉強し始めて8ヶ月のペーペーだったけれど,そのまま加算すると,どうやら2年8ヶ月になるらしい.「まるで成長していない…」とか某安西先生につぶやかれそうな気がするけれど,自分のことは棚に上げて,この2年間に新たに出版された教科書を紹介したいと思う. さて,例によって若輩の主観と独断と偏見にまみれた記事になっています.誤りの指摘,違ったご意見があれば,コメント頂けると幸いです. 情報検索の教科書 この2年で出版された教科書的存在の文献は3冊.それぞれ紹介する.以下の3冊の共通点としては

    情報検索ことはじめ〜教科書編その2 (2011年決定版) 〜 - シリコンの谷のゾンビ
  • livedoor Techブログ : livedoor グルメの DataSet を公開

    櫛井です。 以前 livedoor clip のデータを学術研究用に公開しましたが,おかげさまで,たまに発表等で livedoor clip という名前が引用されているのを見かけるようにもなり感慨深い限りです。 さて,今回は第二弾としまして,livedoor グルメのデータをまとめてダウンロード & 利用可能にしようと思います。 今回はいろいろと余裕がなかったため 豪華なイラスト付きページが用意できませんでした livedoor clip のデータとは違い,定期アップデートはされません。2011年4月22日の時点のデータのみとなります ...が,なにかしら皆様の研究のお役に立てればと思います。 よくありそうな質問と答え ライブドアグルメのユーザですが,自分の個人情報が公開されちゃうってこと?困ります! 公開されるのは,もともとライブドアグルメのサイトで誰でも見れるようになっている情報だけで

  • Adachi Page

    アホでも数学者になれる方法──アホぢからはこわい トップページ アホのための研究法 前書き アホな私が一応数学者になれた。そのノウハウを公開する。サラリーマンを七年半やって脱サラして数学者になろうとするようなことは決して人に勧めるものではない。しかし困難な状況でつかんだノウハウは若い数学者を志す人には、大いに役立つであろう。私の経験で言うと、研究ノートをしっかりつけられるようになれば、大体研究は出来るようになるのであるが、研究ノートをつけること、どうつけたらよいか、など客観的で現実的な方法は、学生時代指導は受けなかった。そのかわりめったやたらと受け売りの精神論をたまわった。私の言う方法は初級から上級まで、自分で効果を検証済みのものばかりである。折りに触れて気づいたことをカードに書き込んでカードボックスにほりこんでいたら800枚以上になった。それをもとにまとめたものを少しずつ書き込んでいっ

  • 専門分野外の論文を査読する - ny23の日記

    先週は,今年の研究が始められていないのを不安に感じつつ,査読をやっていた.ここ数年は,一年辺り,ジャーナルが5,国際会議が10-20ぐらいの分量.数的にはさほど多くはないと思うのだけど,査読する論文のほとんど(80%ぐらい?)が自分の専門分野外のため,一の査読にも最低半日はかかる(関連論文まで確認しだすと数日かかる).専門分野の査読だと,過去に5とか7とか回ってきたときでも,一日かそこらで終った記憶があるので,この差は非常に大きい(ここで言う専門分野の会議とは,自分が論文を出したことがある会議だけでなく,普段論文を読むだけ周辺分野の会議も含む; 過去査読した専門分野外の論文は例えば,P2P framework, image mining, social annotaion, PSO など).専門外の論文の査読コストは専門分野の査読コストの数倍ぐらい,と考えると,専門分野の査読を5

    専門分野外の論文を査読する - ny23の日記
  • johokanri.jp

    johokanri.jp 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • 被引用数による研究評価は絶対数だけでなく相対的な位置を見ることに意味がある(世界大学ランキングと研究評価の新時代:ワールドクラスの大学をめざすために 第2部「大学・研究評価の実際」参加記録) - かたつむりは電子図書館の夢をみるか(はてなブログ版)

    前エントリ*1に引き続き、トムソン・ロイター主催の世界大学ランキングシンポジウム参加記録です。 第2部は「大学・研究評価の実際」と題し、被引用数等のトムソン・ロイターのデータを用いた研究評価の実際についての紹介。 ポイントは「世界平均、分野平均と自分たちを比較する」視点? 以下、例によってイベントのメモですが例のごとくmin2-flyが聞きとれた/理解できた/書きとれた範囲のものなので、事実錯誤等含まれる可能性があります。 間違い等発見された場合にはコメント欄等を通じご指摘いただければ幸いです。 特に今回、ビジュアルを用いた説明についてはメモ取っても全然伝わらなさそうなところもあり、ときどき記述が飛んだりしますがその点はご容赦願います。 では、午後はまずはPhilip Purnellさんのご講演から! THOMSON REUTERS WEB OF SCIENCE: Research Ass

    被引用数による研究評価は絶対数だけでなく相対的な位置を見ることに意味がある(世界大学ランキングと研究評価の新時代:ワールドクラスの大学をめざすために 第2部「大学・研究評価の実際」参加記録) - かたつむりは電子図書館の夢をみるか(はてなブログ版)
  • 良い進捗報告のやり方 - 発声練習

    まとめ 良い進捗報告とは、自分が行っている作業やプロジェクトを順調に進めるのに役立つ手助けが得られやすい報告である 教員にとって良い進捗報告 学生が行っている作業やプロジェクトが自分の研究のプロジェクトの一部であったり、研究室で取り組んでいるプロジェクトの場合とそうでない場合では教員にとって作業の進捗の意味がある程度変わる。前者の場合は、自分のプロジェクトの一環なので、作業やプロジェクトの進捗がそのまま自分のプロジェクトの進捗に反映されるので、より真剣に、場合によっては過剰に干渉して進捗状況を制御しようとする可能性がある。後者の場合は、学生が順調に卒業/修了できるかどうかが興味の焦点になるので、学生が援助を求めてきたならば援助しようという程度の干渉の可能性がある。ここいらへんは指導教員の性格による。 どちらの場合にしても、教員が知りたいのは「どこまで進んでいるか」と「援助は求められていない

    良い進捗報告のやり方 - 発声練習
  • 自然言語処理研究会 - tsubosakaの日記

    id:nokunoさんが主宰する第2回自然言語処理勉強会@東京で"Latent Dirichlet Allocation入門"というタイトルで発表してきました。 内容としては機械学習ライブラリMalletに実装されているLDAのマルチスレッド実装クラスのParallelTopicModelで使われているトピックモデルの技術を紹介するという話でした。 Latent Dirichlet Allocation入門View more presentations from tsubosaka. 当は文章検索への応用とかの話もしたかったのですが準備に時間が足りず断念

    自然言語処理研究会 - tsubosakaの日記
  • Yusuke Yamamoto's Web site » Web系研究のために勉強した書籍群

    いわゆるWeb系というのは研究フィールドのことを意味するので,特にコレといった技術を身につけなければWeb系研究じゃないよね,ってことはない.だからといって何も勉強しなくて良いという訳ではなく,研究テーマに応じて必要な技術というのを認識して自分で学んでいかねばならない. ここでは僕がWeb系の研究を行う上で触れてきたを挙げてみる. 学部生時代 言語と計算 (5) 情報検索と言語処理 徳永 健伸 (著), 辻井 潤一 (編集),東京大学出版会(出版社) 難易度: ☆ 研究室に入ったときに博士学生の先輩に薦められた.タイトルに”言語処理”という言葉が入っているが,自然言語処理の話が載っているわけではない.情報検索の概要の概要が俯瞰できて,情報検索とはなんぞやを全く知らない学生には良い入門書だと思う.テクニカルな内容は少ないので読みやすいが,内容は薄い.情報検索の評価尺度,情報検索のモデル,

  • SEKIYA Takayuki

  • モレスキンで作る研究論文ノート

    最近私のモレスキンの上をシロクマが歩いていきました。これ、私の研究所で作成している「北極」関係のシールなのです。 研究者の生命線の一つは、論文にどれだけついていけているかという情報へのどん欲さです。しかしさまざまなツールがあるにもかかわらず、この情報をアナログなモレスキン手帳に書き取るのは格別の良さがあります。 著者名と題名を書き、その論文で最も重要と思われる点について書き写し、キモとなる図を印刷して貼り付け、次に読みたい論文を列挙しておきます。これだけで、モレスキンが簡易な論文データベースになっていくのだから楽しいものです。 論文ノートをモレスキンにする理由はいくつかあります。 書くことで記憶が定着する: 論文の記憶は「この話題はたしか○○ & ○○ (2005)で…」といった感じで、あやふやですが、それでもある程度は正しく思い出せる必要があります。それを手の記憶ははっきりと記憶してくれ

    モレスキンで作る研究論文ノート
  • Yusuke Yamamoto's Web site » ウェブ研究に取り組む某研究室のターゲット国際会議

    よく驚かれるが情報科学の分野では論文誌よりも国際会議の方が重要.そしてWeb系では何よりもACM主催会議に論文を通すことが大事のようだ(ほとんどの研究者はACM系の論文しかウォッチしていないみたい).山の個人的な印象なので他の方が書かれたページなども参考にして欲しい. WWW 難易度★★★★★.ACM SIGWEB, SIGIR主催のWeb系最高峰の会議.W3Cも開催にかんでいる.正式名称は The International World Wide Web Conference.アイデアの面白さ,手法,しっかりした評価の全部が揃っていないとなかなか通らない.Web検索,Webマイニング(textでもmultimediaでもOK),Webサービス,Web engineering,Browser & interfaceなどなどWebに関するあらゆるトピックが対象となっている.Web系の分野で

  • MIT Subject Listing & Schedule Fall 2024

    Course 1 - Civil and Environmental Engineering Course 2 - Mechanical Engineering Course 3 - Materials Science and Engineering Course 4 - Architecture Course 5 - Chemistry Course 6 - Electrical Engineering and Computer Science Course 7 - Biology Course 8 - Physics Course 9 - Brain and Cognitive Sciences Course 10 - Chemical Engineering Course 11 - Urban Studies and Planning Course 12 - Earth, Atmos

  • googleで賢く探すために最低知っておくべき5つのこと/検索テクニック、ノウハウ、裏技の手前に

    検索オプションや演算子の紹介や「辞典になる」「電卓になる」みたいな機能紹介は省く(これについては、googleのヘルプか、たとえばここhttp://search.web-sun.com/g_help.htmlを参照)。 以下では、基の考え方と、それを受けて、では具体的にどう検索するかを、いくつかの事例をつかって簡単に説明する。 どれも知っている人には当たり前のことばかりだが、このあたりのことをまとめたものは意外に少ないようなので、メモ代わりになるようにまとめてみた。 まとめたのは最低限のものであって、取り上げるべき事項は他にもいろいろあるだろうが、簡素なのがウリということで。 考え方は、googleで検索するときだけでなく、調べもの全般に用いることができると思う。 1.(基)「○○について××が知りたい」→検索語「○○ ××」 [例]富士山の高さが知りたい (考え方) →富士山の高さが

    googleで賢く探すために最低知っておくべき5つのこと/検索テクニック、ノウハウ、裏技の手前に
    Y_sekky
    Y_sekky 2010/10/25
    クローリング手段としてmemo
  • PerlプログラミングTips集(変換編)

    Perlでプログラムをするときに参考となるソース集です。 URLエンコード/デコード処理 URLエンコード処理 CGIにデータを渡す場合、URL(URI)エンコードする必要があります。 URLエンコードすると、特殊な文字や漢字は %xx (xx は16進数) となります。 以下の方法で、変数($arg)の内容をURLエンコードすることができます。 URLエンコードしなければならない文字は使わないのがベストですね。 #!/usr/local/bin/perl $arg = $ARGV[0]; printf("arg=%s\n", $arg); # URLエンコード $arg =~ s/(\W)/sprintf("%%%02X", ord($1))/ego; printf("arg=%s\n", $arg); s/PATTERN/REPLACEMENT/egoで、置換を行なっています。 eは、