タグ

researchに関するglcsのブックマーク (63)

  • 展望台システム

    展望台システム(Panoramic View System) 重要文抽出により、文章要約を行います。 指示的要約と、報知的要約のいずれかを選択して実行することができます。 <動作条件> 日形態素解析器 ChaSenがインストールされていること。 また、実行プログラムの生成にはCコンパイラが必要です。 <ダウンロード> インストールされているChaSenと同じ文字コードのものをダウンロードしてください。 panoeuc.tar.gz(EUCコード) panosjis.tar.gz(SJISコード) コードの違いは、ソースコード内のコメント部分、設定ファイルspeech、サンプルテキストurashima、README内の日語、およびバックスラッシュ記号です。 <更新履歴> 2007/4/5 jread.h:キーワード候補のない文を結合する際の、文の長さのカウントミスを修正 20

  • Rerank.jp

    検索結果中のキーワードを選択し または をクリックすることにより、検索結果を並び変えることができます。 操作方法 検索を実行すると、通常の検索結果に加えて、右側の枠内に検索結果内から抽出されたキーワード群が表示されます。 検索結果のタイトルや要約文、URLの中から好きなキーワードを選択(反転)するか、 右枠内に表示されているキーワードをクリックするととというボタンが現れます。 をクリックすると、そのキーワードを含む検索結果を上位に再ランキングします。 をクリックすると、そのキーワードを含む検索結果を下位に再ランキングします。 以上の操作で、手軽に検索結果を並び変えて閲覧することができます。

  • 犯罪を事前に予知する研究 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 東京大学大学院情報理工学系研究科電子情報学専攻 A教授 の話 「君ら知ってる?犯行予告を検出する政府のプロジェクト あれの話が来るかもしれないんだよね。 だいたいどこの先生もやりたがらないから回ってくるのよ。 あんなの原理的に出来るわけないじゃん。 不可能だよ。 でも"できません"とか言えないから..         」 マイノリティ・リポート 総務省が犯行予告自動収集システムの開発を企画……が、0円で作っちゃった人が登場 スラッシュドット ジャパンのコメントの通りですが「深い技術」を使ったアプローチもなくはないです

    犯罪を事前に予知する研究 : 研究開発
  • MIST Project

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    MIST Project
    glcs
    glcs 2008/10/23
    動画像処理のライブラリ
  • JSTとNIIの連携・協力について

    国立情報学研究所(NII)と科学技術振興機構(JST)は、NIIが運営するNII-ELS(電子図書館)とJSTが運営するJ-STAGE(科学技術情報発信・流通総合システム)及びJournal@rchive(ジャーナルアーカイブ)に関し、電子化の重複を回避し、両法人の連携・協力によりさらに多くの学協会誌等の電子ジャーナル化を推進することを目的とした覚書を締結しました。

  • 日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 | スラド IT

    日立製作所は、任意のキーワードを含む音声を高速に検索する技術を開発、発表した(PC Onlineの記事、ニュースリリース)。リリース文などを見ると、録音データを単純に記号化し、それをベースとして、キーワード検索を行うもののようだ。プレコンパイルしたデータをN-gramでインデックスといったところだろうか(汎用的な音素抽出アルゴリズムが肝になりそうだが、そのアピールはとくない)。 とくに目新しい感じはしないのだが、動画の検索がタグキーワードたよりになっている現状からすると、ちゃんと動くものが出てきて、音声を数値化しておく一般的な方法があるといろいろと利用場面はありそうだ。まずは、検閲需要からあたり?

  • Googleによる新たな知識発見? | スラド

    三菱総研が公開しているコラムサイト、「週刊Take IT Easy」で、「メタ集合知に訊け!」という興味深いコラムと、「成分チェッカー」なるWebアプリケーションが公開されている。 成分チェッカーはGoogleのAJAX Search APIを使って作成されたアプリケーションで、「○○に含まれる△△の割合」を「○○」と「△△」を指定してチェックできるというもの。ネタばらしをすると、Googleの検索結果を利用して風評を分析するだけの単純なアプリケーションなのだが、使い方次第ではけっこう面白い。これまでの脳内メーカーや成分分析系の冗談ツール系とは(Googleのデータを使っているという点で)一線を画す、興味深いものだ。 試しに自民党総裁選を占ってみたところ、麻生太郎が圧倒的人気だった。/.Jの諸兄は何に興味があるだろう? 原理としては、Googleで「○○」を検索してヒットした数と、「○○

  • 情報爆発プロジェクト 検索エンジン基盤 TSUBAKI

    TSUBAKI利用時の良かった点、問題点などご意見を頂けると幸いです。 ご意見は tsubaki あっと nlp.kuee.kyoto-u.ac.jp までお願い致します。

  • 独立行政法人 国立国語研究所:日本語話し言葉コーパス

    『日語話し言葉コーパス』第2刷の受付を開始しました(更新:2008.05.02) 報告書『日語話し言葉コーパスの構築法』がダウンロードできるようになりました。(更新:2008.03.24)

  • CiNii-機関リポジトリ連携、正式運用に

    国立情報学研究所(NII)が、2008年8月から行っていたCiNiiと6大学の機関リポジトリとの連携実験期間を終え、稼動させることを発表しています。あわせて、連携に関する条件と、申し込み用の書類等も公表しています。 CiNiiと機関リポジトリの連携について – 国立情報学研究所 http://www.nii.ac.jp/irp/2008/09/cinii_1.html 参考: CiNiiから機関リポジトリの論文にリンクする実験始まる http://current.ndl.go.jp/node/8509

    CiNii-機関リポジトリ連携、正式運用に
  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 統計処理ソフトウェアRについてのTips

    最終更新: 2008年 8月 27日 (水曜日) 15時35分 このページでは,国際共同研究のオープンソースなプロジェクトで開発され,GNU GPLに従って公開,配布されている高機能な統計ソフトであるRについてのTipsを扱う。 News/更新情報 保管庫1(2004年1月まで) | 保管庫2(2004年2月から) 保管庫内の主なトピック:平方和(SS)|「Rによる統計解析の基礎」(保管庫外だがサポート掲示板|正誤表)|オッズ比 |1.6.0|1.6.1|1.6.2|1.7.0|1.7.1|1.8.0 | 1.8.1|1.9.0|1.9.1|2.0.0|2.0.1|2.1.0|2.1.1|2.2.0|2.2.1|2.3.0|2.3.1|2.4.0|2.4.1|2.5.0|2.5.1|2.6.0|2.6.1|2.6.2|2.7.0 R News Vol.8/1公開(2008年6月5日) ●5

  • ”レンコン”は拳銃 総務省が犯罪検知ソフト開発へ - MSN産経ニュース

    総務省がネット上の殺人予告や、隠語を使った拳銃取引など犯罪の情報を検知し、サイト運営企業へ自動的に知らせる新しいソフトウエアの開発に乗り出すことが20日、分かった。サイト運営企業はネット上の有害情報対策を強化しているものの、監視人員の確保が困難な上、通常の検知ソフトでは、隠語のような特殊言語への対応は困難という。開発は平成21年度から3年程度かけて取り組み、総事業費は十数億円規模を想定している。 開発するソフトは通常の言葉だけでなく、「レンコン=拳銃」など、一般の閲覧者に内容を知られないように使用されている隠語などもデータベース化して盛り込む。また、「自然言語技術」と呼ばれる手法を使い、文章全体の構成から犯罪との関連性を推測する機能も備える。サイト上の情報を犯罪性有りと判断すれば、運営企業へ自動的に知らせ、サイト運営企業は内容を確認した上でその情報を削除する。 総務省は平成21年度予算で、

  • クチコミを見える化する手法が続々と : ITmedia オルタナティブ・ブログ

    記念日協会によると先日の8/2はBuzzの日で来月9/3はクチコミの日のようだ。なぜこの暑いじきにしかも同じような記念日が続くのか、そして11月25日のバイラルの日もあわせて同じような記念日がいくつもある理由は謎だが、実際最近口コミ情報を分析するサービスが増えてきているようだ。 こうしたツールはテキストマイニング技術を使って、ネットのブログやSNS掲示板上に書かれた記事を分析し、頻出単語やそれらの共起度合い、意味解析による好意的なのか否定的なのかの判断をおこなう仕組みになっている。テキストマイニング技術自体は結構前からある技術なのでそんなに目新しくはない。しかしながら最近続々と発表されるツールでは、分析をした結果のレポートや表現方法に各種の趣向を凝らしており、私はこちらの面で注目している。 5月頃に展示会で見かけたプラスアルファ・コンサルティングの「見える化エンジン」というサービスで

    クチコミを見える化する手法が続々と : ITmedia オルタナティブ・ブログ
  • メタ情報をXHTMLに埋め込むRDFa | Web標準Blog | ミツエーリンクス

    6月20日に、RDFa構文仕様の勧告候補が公開されました。順調に進めば、今年中にも勧告されるのではないかと予想しています。 さて、勧告となってはいないものの、試験的にWeb標準仕様 日語訳一覧にRDFaを導入してみました。今回はこのページをサンプルに、簡単なRDFaの解説をしようと思います。 RDFaとは RDFaは、メタ情報をXHTMLで表現する仕様です。RDFをデータモデルに用いることで、より柔軟で多彩なメタ情報を埋め込むことができます。メタ情報を埋め込む方法は何通りかありますが、もっともシンプルなものは、従来のmeta/link要素による指定とほぼ変わりません。 たとえば、ページの説明を記述するとき、XHTMLHTMLではこう記述します。 <meta name="description" content="ページの説明" /> RDFaでは、新しく導入されたproperty属性を

  • シソーラスとオントロジー

    2.2 電子化されたシソーラス キーボードから直接どこでも指定できるので木構造をたどりながら探していく必要はありません。もはや木構造ではなく、網構造になって複数の広義語が持てるようになります。しかしその結果同じ文字列で複数の意味を持つ多義語が区別できない問題がでてきます。例えば木構造で検索したときには、「時間」からたどった「月」(month)と、「天体」からたどった「月」(moon)の二つの異なった意味の語は区別できますが、網構造では区別ができなくなります。 「月」を「天体」の観点でとらえたときはmoon で「時間」の観点でとらえたときはmonthであるとすれば解決できます。 一つのグループに入れる語を多くしすぎるとグループのなかを探すのに時間がかかってしまいます。逆に少なくしようとすると階層が深くなってしまいます。電子化されたシソーラスでは、クリックするだけで、簡単に上下の階層

  • 学術論文を読んで涙が止まらなくなったときの話

    中原淳(東京大学准教授)のブログです。経営学習論、人的資源開発論。「大人の学びを科学する」をテーマに、「企業・組織における人の学習・成長・コミュニケーション」を研究しています。 誰の役にも立たないと思うけど、今日は、僕が、「学術論文を読んで涙が止まらなくなったときの話」をしよう。 今から数ヶ月前、愚息TAKUZOは、数週間、病床にあった。きっかけは熱性痙攣であったが、予後があまりよくなく、点滴とチューブにつながれた、永遠とも感じられる「長い時間」を、彼は病院で過ごすことになった。 生まれて以来、常に一緒にいた親から引き離され、暗く、そして長い夜を、独り過ごす。もっとも辛かったのは、TAKUZO人であることは間違いない。 しかし、僕たち親も、当に心を痛めた。「一生分の心配」を、わずか数週間ですべて経験したような気分であった。 しかも、この間も、仕事は続いている。TAKUZOの入院後、僕た

  • 日本語形態素解析 - Japanese Morphological Analyzer

    Visited: 5294 アルゴリズムによる日形態素解析(Japanese Morphological Analyzer by Algorithm) このプログラムは、テスト・研究用の短いプログラムで、辞書を使わずにアルゴリズムのみで解析しているので、正確な解析はできません。語頭・語末を漢字・カタカナ・平仮名の区別を頼りに解析しているので、平仮名ばかりの文に対応できません。言語解析の困難さがこのプログラムからもお分かりになるでしょう。 正しく解析するには、人間が持っている知識、すなわち日語の規則、辞書、実世界における知識、推論などが必要です。その知識とは膨大な量のものですが、まずは部分的にも妥当な規則、辞書を作ってみることが大切でしょう。アルゴリズムだけからなるこのプログラムとは異なり、今研究中の規則や辞書の構成は言語学的にも妥当と思えるかどうか、という観点から研究しています

  • コレは便利!ブログに「目次」が付けられる

    sponsored 横浜でパン好きが集う「パンのフェス」開催! 参加者をうならせたのは……えっ、ファミリーマート? sponsored 「ASCII BESTBUY AWARD 2023」特別賞受賞の注目スマホが買いの理由を探る! スマホ専門家が3ヵ月使って悟った。スマホは「AQUOS sense8」で大満足な12の理由 sponsored タイプが異なるラインアップ充実で、さまざまな場面に適したタイプの製品が存在する! 音楽を楽しむのみにあらず! ファーウェイのイヤホン5製品はテレワークやジョギング中の利用にも優れた選択肢だ! sponsored 専売デバイスにMSIの新ケース採用PC、2024年のSTORMは新製品が続々登場! sponsored グローバルでも注目を集める日発の取り組み、このタイミングで協業を深化させた理由 SB C&SとDropboxが立ち上げた「Dropbox

    コレは便利!ブログに「目次」が付けられる
  • Google、重複コンテンツ(コピペサイト)の対処方法について解説 ::SEM R (#SEMR)

    Google、重複コンテンツ(コピペサイト)の対処方法について解説 グーグル、重複コンテンツの問題とその対処法について改めて解説。基的にアルゴリズムでオリジナルサイトを自動判定するため、多くのウェブマスターは特別この問題に配慮する必要はない。 公開日時:2008年06月16日 13:10 米Googleは2008年6月9日、近年SEOの領域で話題として取り上げられる機会が多い、重複コンテンツ(duplicate content)問題についてのGoogleの取組みと解決方法について説明した。公式ブログ(Official Google Webmaster Central Blog)にて、検索品質担当チーム・Sven Naumann氏が解説した。 私はブログほかいくつかのコラムで何度も重複コンテンツの問題を取り上げているし、また、この問題と対処方法については米国で開催される各種コンファレンス

    Google、重複コンテンツ(コピペサイト)の対処方法について解説 ::SEM R (#SEMR)