サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ノーベル賞
blog.goo.ne.jp/htakeda0000
4.現在の日本/日本語のLinked Data ここでは日本において大規模にLODあるいはRDFを公開している例をいくつか取り上げる。 4.1 理化学研究所のDB 理化学研究所が運営している公開DBサービスであるサイネス(SciNetS.org)においてはすべてのデータがOWL/RDFとして利用可能である。バイオ系を中心に現在100個以上のデータベースが登録されている。全インスタンス数は約900万件、データサイズは約11TBである。また、サイネスを使って国際的なデータ連携のプロジェクトが行われている(例:マウス表現型データの国際共有化/InterPhenome )。 サイネスではバイオ研究者が求める検索を実現するために通常のSPARQLエンジンではなく、統計処理機能を拡張した独自開発の検索エンジン(GRASE)を採用している。また、RDFのままではウェブブラウザやJavaScriptが直接
3.日本におけるLinked Data化の課題 LOD活動はヨーロッパおよびアメリカにおいて盛んであり、単に情報研究者の活動の域を超えて、個々の分野の専門家や政府などの組織を巻き込む活動になっている。 残念ながら日本ではさほど活動的であるとはいえない。それはなぜなのか、その解決はあるのかというのは本節で述べる。ここで「日本」と呼んでいるのは、日本国内の活動and/or日本語での活動をさしている。もちろんLODは本質的にグローバルであり、こんな区分は本質的でないが、現状を把握するためにはあえて分けて考えてみる。 3.1.情報公開・共有の文化 日本の社会、ことに組織においては前節で説明したような情報公開・共有の重要性は十分に理解されているとはいえない。情報循環は情報の公共性を維持することであり、情報公開・共有はその情報循環を実現する要素として重要であるということが理解されていなければ、情報公開
(現在執筆中の解説記事の草稿です。乞ご意見、コメント) 1. 私たちのLinked Data? Linked Dataはデータの共有の新しい方法として欧米で認知され、実践が進んでいる。日本においてはどうだろうか。セマンティックWeb自体の未普及もあって、まだ認知すらされているとはいえない状況である。日本においてもLinked Dataは可能のだろうか。いやそれ以前にそもそもLinked Dataは日本に必要なのだろうか。 本稿では日本におけるLinked Data化活動を概観する。 まず、前提としてなぜLinked Dataが必要なのかから考察をはじめる。情報共有の問題である。これはLinked Dataだけに関わる問題ではないのだが、Linked Dataというのは情報共有の新しい世界である以上、避けて通れない。その上で、日本あるいは日本語固有の課題を挙げ、どのような解決法があるか考える
9/8にFIT2010という会議で「仮想社会と電子書籍:紙の本はなくなるのか?」なる企画があった。長尾氏(国会図書館)、高野氏(NII)、佐藤氏(Google)、土屋氏(千葉大)がそれぞれTalkを行った。前者3人は実はあまり表題とは関係なく、図書と電子化に関わる話題提供だったが、土屋氏だけは正面から表題の問いに答えていた。 答え:YES。 理由は以下の通り。そもそも電子化云々の前に日本の出版業は衰退産業、右肩下がりになっている。それは負の連鎖ができてしまっているから。いま生き延びているのは再販制度のおかげでかろうじて出版し続けるとOKという仕組みに支えられているだけ。日本の電子書籍は紙の本の出版を前提に考えている。ならば、電子書籍も成立しないだろう。まあメディアの多様化でメディアの一つとして生き延びるだろけど。じゃあ何かできるか?ほとんどないが、情報鎖国でしないかぎりだめでしょうね。 そ
8/20付け産経記事に表題のようなものがあった。 http://sankei.jp.msn.com/affairs/crime/100820/crm1008200131005-n1.htm 趣旨としては国の研究費の報告書がネットで読めないということ。 ”国の科学研究費補助金(科研費)で作成された研究報告書47年分が、限定的な閲覧しかできないうえ、コピーも部分的にしかできない状態にあることが19日、分かった。” って、そもそもそんなことが昨日「発見」されたのですか、と突っ込みたくなるほど、ピンぼけ記事。 あまりにピンぼけすぎる記事なんで、誤解を招かないためにちょっと説明をしたいと思う。 元来、科研費の報告書(一定規模以上の課題の種類)には冊子体の報告書の提出を義務づけていた。この記事でいう「報告書」とはこのことを指している。ちなみに報告書には他にも実績報告書とか別種のものがある。冊子体での報
OR2010 (The 5th International Conference on Open Repositories)に参加してきました。 私はORにははじめて参加です。ほんとは昨年参加するつもりだったのですが、例のインフル騒動でキャンセルせざるをえませんでした。今回はoral1件、poster1件の共著者です。 日本からはNIIから3名、あと3名ぐらいだったかな。 この会議にきて驚いたことはRepositoryが非常に大きな広がりをもって受け止められていることです。もちろん、このコミュニティにおいてもDspaceやEprintが主要なソフトウエアであるように文献を中心とする機関リポジトリ(Institutional Repository)が中心ではあります。しかし、すでにそこからどう展開していくかをみんなが考え、実践していることがわかりました。 KeynoteでのDavid De
旧聞になるがNIIのオープンハウスでの北大の山岸先生の話は大変示唆に富むものであった。 山岸先生にいうように日本社会が安心型社会であることはだいたいに合意するところであろう。安心型社会では社会に人々はいわばロックインされており、それゆえに逃避できないという制約から裏切らないということが期待できる。このため相手を信頼するか否かという判断を下す必要がない。これが実は日本社会が安心型社会だけれども低信頼性社会であるゆえんである。 それを検証する被験者実験ではおもしろい結果が出ている。再参入可能でない設定では、実名(実験ではID固定)にくらべ匿名のほうがよくない結果である。一方、再参入可能な設定の場合は、ポジティブな評価があることがよい結果をもたらしている。 これは現在の日本のネット社会がなぜほかと違い匿名型・ニックネーム型であることのよい説明になっている。アメリカなどの社会においては実社会のその
本とはなにか。 最近、デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会技術ワーキングチーム(ながー)にでています。 懇親会にでて近未来の本である電子書籍の議論を聴講していると、むしろ本とはなんなんだろうと考えてしまいました。電子化してしまえば本なんて言うカテゴリーはなくなってしまうのではないか?そもそも本とは何か?ということに疑問を持ちました。 本が本であるのはまあ物理的な本の存在形態によるところが大きいわけですが、それだけでは未来の本はみえてこないですよね。そこで、思考実験として、物理的な形態になるべく言及せずにいかに本を説明できるか試してみました。いわば本の機能的性質を記述しようというわけです。 (情報内容) 1.含まれる情報は固定されいる 2.分量は10-1000ページ程度である。 3.情報は独立しており、他の情報源に依存しない。 4.主に文字情報である。 5.著
遅ればせながら、明けましておめでとうございます。 新年一つ目の書き込みなので、ちょっとした年頭の所感を書きます。 私は縁あって学術コンテンツサービス研究開発センター長なる仕事を今しています。これはNIIの学術コンテンツサービスの強化や新規開発などを先導するという位置づけのセンターです。 NIIの学術コンテンツサービスのかなりの部分は大学図書館との連携や学会の協力によるもので、いわば「仮想学術図書館」(Virtual Academic Library)として機能しています。NIIは自身で図書や雑誌を管理しているわけではないので、「図書館」ではなくて「仮想図書館」なわけです。 ところが、近年、図書館のデジタル化が急速に進んでいます。デジタル化という意味ではどこの大学図書館も仮想図書館になりつつあります。その変化は急速であり、5-10年後の大学図書館には稀少書をのぞけば本がないなんていうも十分あ
11月30日-12月1日にInternatioal Digital Library R&D Meetingなるものに参加してきました。スタンフォード大学の図書館および学術情報資源部門の長であるMichael Keller氏が企画したもので、オープンな会議ではなく招待ベースのクローズドな会議です。 このミーティングには各国を代表する公共図書館およびアメリカのDigital Libraryが盛んな大学から人が参加していました。参加した各国の公共図書館は以下の通りです。Bibliotheca Alexandrina(エジプト)、National Library of Sweden(スエーデン)、Deutsche Nationalbibliothek(ドイツ)、Bibliothèque national de France(フランス)、The British Library(英国)、Det Kon
ISWC2009 (8th International Semantic Web Conference)がアメリカ、ワシント ンDCで開かれました。場所は空港近くのWestfields Conference Centerというところで、でなんというか陸の孤島です。まあ籠もって議論しようということでしょう。写真の一部はこちら。 登録者は500人強。去年より微減とのこと。参加者の半数はアメリカから。あとイギリス、ドイツ。この3国で3/4。日本は上位9位にはいっていませんでした。研究論文は250件中の43件で相変わらず高倍率です。日本からはたぶんNICTの兼岩さんだけ。 オープニングでおもしろかったのは、応募論文をテキストマイニングした結果を報告したことです。いくつか紹介すると、Ontologyは確率1...つまり必ず入っている?(ほんと?)、Serviceは採択論文の方が顕著に高い(次はここへ
空路で気分が悪くなったり、ロンドンで荷物を失ったり、ブエノスアイレスについたときは結構ヘロヘロでしたが、気を取り直して、Wikimania2009に参加しました。 このWikimania2009というのはいわゆるacademic conferenceではなくて、Wikipediaに関わる様々な人々、すなわちWikipediaの運営者、ユーザコミュニティ の中の人たち、ソフトウエア開発者たちが集まる会議ということです。私はこの 手の会議にははじめて参加しました。とはいえば、会議の雰囲気は普通academic conferenceと大差はありません。 会議の構成もだいたい同じで、Plenary talkが3件、4-5の並列セッションがるという構成です。ただし、セッションの各発表はTEC、CON,COMという印がついていて、それぞれ技術的発表、コンテンツに関する発表、コミュニティに関する発表と仕
人工知能学会誌用の解説記事の草稿です。 今回は「WebアイデンティティとAI」という特集の1つです。この特集、とっても意欲的でぜひ一読の価値があります。 *********** 1. はじめに 本稿ではWebの世界においてモノやコトのアイデンティティはどのように表現されるかについて考察する。ここではモノやコトを一括してエンティティと呼ぶことにする。ご承知のようにWebの世界にはURI (Uniform Resource Identifier) というアイデンティティの手段がある。URIは世界中で一意に同定できかつアクセスもできるという強力なアイデンティティの手段である。URIはこれまでにない強力さと便利さをもっていたため、Webの初期にはURIさえあればアイデンティティの問題は解決できるという楽観的見方もあった。しかし、このアイデンティティURI神話というべきものはすぐさま現実の様々な問題
あとは参加したセッションと気になった発表など。 基本的にsocial network, semanic web, linked dataを中心に聴講。 ちょっとした聴講メモ。 **Social Web** *** Tagommenders: Connecting Users to Items through Tags 233 Shilad Sen, Jesse Vig and John Riedl MovieLensやsocial taggingのデータを使ってrecommendationをするという研究。 Basian Networkなど3種類のアルゴリズムをつかい、総合的に推定。 <よく調べられた研究。> *** Collaborative Filtering for Orkut Communities: Discovery of User Latent Behavior 365 We
WWW2009でMadridに来ています。 思った以上に寒い。 まずLinked Data on the Web Workshop 2009 (LDOW2009)なるものに出ています。 http://events.linkeddata.org/ldow2009/ それを聞きながらちょっとした感想を書きます。 いつもあとでメモを整理して書こうと思うと遅くなってしまうので、メモをオンラインでみせることにします(ああ怠け者)。 こういうのはtwitterでやったほうがいいだろうけど、ちょっとまだなれてないもので、ブログでやっています。 *********** WWW2009 workshop:Linked Data on the Web (LDOW2009) 机上には、Nodalities -The Magazine of the Semantic Web-なるものがおかれ る。 http://
日曜日(2/25)にニコニコ動画データ分析研究発表会なるものに参加してきました。これはいわゆる学会じゃなくてあくまで有志の集まりとということで、趣はずいぶん違います。 まず、発表者の名前は基本がニックネームというかハンドルネームです。本名なのは我々ぐらい :-) 基本、好きなことをしゃべります。研究発表の基本構成なんて気にしません。 でも発表自体は意外なほどまじめで価値のあるものでした。スタイルこそ型破りだけど、中身はきちんと分析しています(まあところどころ、えっ、そこはいじっちゃいけないじゃない、なんてところもありましたが)。 基本はタグ分析ですね。やっぱりタグは扱いやすいし、わかりやすいですしね。とくに「グニャラくん」さんのタグの相関関係分析はとても立派なもので、このまま国際学会に行けそうです。 我々の研究(「はまさき」氏とちょっとひらがなにしてみました)は結構受けたようです(ほっ)。
Wikipediaワークショップは1月22日に東大本郷キャンパスで無事終了しました。結局120名近くの人が集まりました。予想以上の人数で椅子も配付資料の紙も足りなくなって大変でした。やはり、Wikipediaは注目があるようですね。 発表者はまあ研究会の出自もあって知識系の人が多かったですが、情報検索や自然言語処理の人もいました。 全体のトレンドとして面白かったのはみなさん、カテゴリに注目していました。カテゴリをいかに料理できるかが今のところのフォーカスのようです。 ちなみに参加者にアンケートをとりました。「なぜWikipediaを研究するか」「どんな点に注目するのか」「どんな研究分野か」についてです。現在集計中ですので、まとまり次第報告します。 なお、某大手新聞社の人が取材にきていました。実際記事になるかはわかりませんが。
旧聞になりますが,うちの博士課程の学生が研究上でつくっているシステムがある会社のコンペティションで優勝しました. And the winner is: The vision of a future where ordinary people publish structured data このシステムはfreebaseよりfreeでlinked data共有を目指したものです. StYLiD application 興味のある人がアクセスしてください. このコンペティションはLinked Data Planet Conferenceというものに合わせて開催されたもので,せっかくなので本人にこの会議に参加してもらいました. こんな会議が開かれているように(しかも年内にもう1回ある!),Linked Dataはいまビジネスにおいても非常に興味を持たれているようです.研究面ではWWW2008やE
この間研究ミーティングでスパム,とくにsplogが話題になりました.Splogというのはブログ版のspamのことです.ブログを研究対象にしている以上,避けて通れないものです.すでに2005年の時点でアメリカのブログの75%がSplogだという分析があったぐらいです(U. of Marylandのebiquityの調査). 明らかなSplogは機械的にもはじけるのですが,最近中間的なSplogがでてきてこまったものです.特に問題なのが,人のコンテンツを使ったタイプのSplogです. たとえば「...のウワサ」という記事を大量に掲載するサイトです.これ基本的に検索あるいはフィードから該当文字列を含むものをとってきて,それをあたかも自分の記事(あるいはサマリー)のように見せるものです.こんなもの作ってなんかの役に立つのかというと,リンクがアフィリエイトのページに飛ぶようになって,そこで小銭を稼ぐ
#これはとある図書館学系学術誌向けに書いている解説原稿の草稿です.自分の見直しを兼ねてブログ上でも公開します.かなり独断と偏見で書いているふしもありますので,ご意見があればぜひどうぞ. ##goo blogは図が1つしか入らないのでつらいですね.どっかに変えます. Webの進化と情報流通 1.はじめに いまや、World Wide Web(以下Webと呼ぶ)なしの仕事や生活を想像できないぐらいWebは我々の社会活動や生活に深く入り込んでいる。しかし、翻ってみれば、Webが実用に供されるようになって高々10年程度であり、極めて最近のことである。技術の進歩に比べれば社会の仕組みの変化は緩慢であり、いまなおWebによって社会は変わりつつある。一方、Webもさらに質的量的な変化を続けており、ことに近年の変化をWeb 2.0と呼ぶようになっている。本稿ではこのようなWebの変化と社会の変化の係わり合
ちっともBlogを書かなくなった私ですが、とりあえずblog置き場をここから、ResearchMap上に移しました。 http://bit.ly/iM1oeQ 以降はそちらでお会いしましょう。移動1号目としてLOD-LAM Summit参加について書きました。 あけましておめでとうございます。 子供の頃から現実的人間であった私は、1年の抱負を書けといわれて面倒くさいなあと思っていました。でもいまは、これだけ年を取るとむしろ書いておかねばいけないのかあと思うようになりました。 去年は図書館への思いというのを書きました。実際、昨年は図書館に関わる仕事を多くしてきました。僕にとっていい転機でした。さて、今年はどうかというと、ひとつキーワードを挙げようと思います。それは「オープン」。デジタルコンテンツのオープン化というのは社会的にも研究的にも緊急の課題です。微力ながらこのキーワードで社会や研究に貢
セマンティックWebとWeb2.0をつなぐコンセプトして「社会としてのWeb」を語ろうと思って書き始めたのですが,ちっと進まず,そのうちにInterop06は来週に迫ってしまいました. かわりにに,とりあえず資料のテキスト版をつくってみました. ******************************************************************* セマンティックWebとWeb2.0 さまざまな喧騒 Web2.0 ブーム? Web2.0 って何? Web2.0 とセマンティックWeb は同じ目的? Web2.0 はセマンティックWeb を殺す? ところでセマンティックWeb って何? 本講演のねらい セマンティックWeb の立場からセマンティックWeb とWeb2.0 の関係,ひいてはWeb の将来の方向を考える セマンティックWebとWeb2.0 Web2.
なんと「セマンティックWebとWeb2.0」なんて題目の講演をすることになりました.Interop 2006のコンファレンスの「Web環境の進化で変わる情報検索アーキテクチャ」という中です.僕以外はNTTレゾナントの小澤さん,"Web2.0 Book"の小川浩さん,慶応の松村太郎さんという,大変なものです.一般技術者向けなのでわかりやすいテーマということで,コーディネータの奥さんらと話しているうちに,結局はやりのキーワードをいれることになりました. しかし,一体,何を話せばいいのだろう.あわてて真剣に:-)Web2.0の情報収集を始めました.でも集めれば集めるほどわけわかんなくなりますね. まあ,Web2.0に関する”評論”は巷にあふれているわけですが,僕はあくまで研究者(SW研究者?)としての立場として考えていこうと思っています. 現状でわかったこと. まあO'Reillyの論文は結構分
このページを最初にブックマークしてみませんか?
『Takeda's Report』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く