タグ

ブックマーク / xtech.nikkei.com (67)

  • どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup

    Webの全体像を効率よく取り込み,分類する 「YSTのシステムは大まかに三つの機能に分かれます(図2)。最初は世界中のWebページをYSTのシステムに取り込む『クローリング(crawling)』という機能です」(Yahoo! JAPAN,リスティング事業部 検索企画室の宮崎光世氏,以下同)。 取り込むと簡単に言っても,Webページの数は膨大なうえ,更新の頻度や情報の質などがまちまちです。すべてのページに同じようにアクセスしていると非効率なことこの上ありません。そこで,限られた時間で質の良い検索ができるようにするための工夫をしています。例えば,クローリングを繰り返すうちに頻繁に更新されることがわかったページは短いサイクルでチェックし,ほとんど更新のないページはチェックの頻度を落とす,といったことをしているそうです。 ただ,更新の頻度が単に高いだけではダメです。重要性が高いと考えられるWebサ

    どうなっているの?あのソフトの仕組み - 今からでも遅くない!アルゴリズム入門:selfup
  • 「Google Books」を巡る係争でGoogleが勝利、フェアユースの主張が認められる

    Googleの書籍全文検索サービス「Google Books」を巡る著作権侵害訴訟で、米ニューヨーク州南地区連邦地方裁判所は現地時間2013年11月14日、「Google Booksはフェアユースの範囲」とするGoogleの主張を認める判断を下した。 Google Booksは、公共図書館や大学図書館の蔵書をデジタル化し、インターネットで検索・閲覧可能にしたサービス。米国作家協会Authors Guildや出版業界は2005年に、Google Books(当時の名称は「Google Book Search」)が著作権侵害に当たるとして、Googleを提訴。2008年10月にGoogleが一定の金額を払うことなどで和解に合意したが、2011年に地裁が和解の承認を拒否し、訴訟は振り出しに戻った(関連記事:Google Booksめぐる集団訴訟、連邦地裁が修正和解案を認めず)。 2013年9月

    「Google Books」を巡る係争でGoogleが勝利、フェアユースの主張が認められる
  • 【 sed 】 文字列の置換,行の削除を行う

    sedは与えられた文字列を,ルールに従って変換するコマンドだ。例えば,文字列の置換,行の削除といった処理が行える。 変換に利用できるルールには下表「sedの条件式」のような条件式が利用できる。例えば,文字列を挿入したい場合は「a」や「i」の後に挿入する文字列を指定する。文字列を置換したい場合は「s/置換ルール/置換文字/」と実行する。 置換ルールの最初に数値を指定すると,指定した行のみが処理される。例えば,「3d」と指定すると,3行目が削除される。 sedコマンドで実際に変換を行う場合は,変換処理内容は「-e」オプションを指定した後に記述する。また,sedコマンドに指定したファイルの内容を処理する。例えば,source.txt内のLinuxをリナックスに置換したい場合は,次のように実行する。 $ sed -e "s/Linux/リナックス/g" source.txt 結果は標準出力(ディス

    【 sed 】 文字列の置換,行の削除を行う
  • ビッグデータは統計学と矛盾する?

    新しいITキーワードの常として、必ず「反対派」が登場する。最近では「ビッグデータ」が槍玉にあげられており、「・・・だからビッグデータは失敗する」という論調も目立ってきた。 ビッグデータのセミナーや展示会が大賑わいということは、それだけ期待が高いのだろう。IT業界にとって久しぶりの大型キーワードであり、ここ数年、クラウド以外に強烈な話題がなかったIT業界には、活気を取り戻す頼もしい存在なのかもしれない。 折しも、政府の新たなIT戦略として、「行政データを民間に開放し、新ビジネス創出を促す」といった計画が出てきているという。データをどう活かし、ビジネスとして成功させるかが、いまや国家戦略としても問われている。 筆者は猛烈な賛成派でも反対派でもないが、これまでの取材経験からデータを扱う難しさは知っているつもりだ。大量のビッグデータとなると、なおさらである。 筆者の周辺でもビッグデータについて、さ

    ビッグデータは統計学と矛盾する?
  • 「何度押しても消えませんよ」、Twitter上でブラウザー破壊リンクが出回る

    トレンドマイクロは2013年3月22日、TwitterなどのソーシャルメディアでWebブラウザーを利用不可能にするツール(ブラウザークラッシャー、略称ブラクラ)へのリンクを含む投稿が拡散しているとして、注意を呼びかけた。 このリンクをクリックすると、「今度は何度押しても消えませんよw(・∀・)ニヤニヤ」というメッセージボックスが表示され、ブラウザーが動作しなくなる。Windows、iOS、Androidなどプラットフォームを問わずにブラクラとして機能するのが大きな特徴。特に、コンピュータウイルスの脅威が少ないといわれるiPhoneなどのiOSデバイス(関連記事:ウイルス対策ソフトがiPhoneにないのはなぜ?)でも動作することに注意が必要だ(画面)。 このブラクラは、Webブラウザーで動作する「JavaScript」を悪用した単純なもので、現時点では、このブラクラ自体に投稿を自動拡散したり

    「何度押しても消えませんよ」、Twitter上でブラウザー破壊リンクが出回る
  • 55億円無駄に、特許庁の失敗

    政府システム調達における失敗の典型例が、特許庁の基幹系システム刷新プロジェクトだ。5年がかりで臨んだが、結局は55億円を無駄にしただけ。新システムは完成しなかった。失敗の最大の要因は、発注者である特許庁にあった(図1)。関係者の証言から、失敗に至る経過を改めてひもとく。 特許庁は2004年、政府が打ち出した「業務・システム最適化計画」に沿って、特許審査や原保管といった業務を支援する基幹系システムの全面刷新を計画した。システムアーキテクチャーに詳しい情報システム部門のある職員(以下A職員)と、刷新の「可能性調査」を担ったIBMビジネスコンサルティングサービス(現・日IBM)を中心に、調達仕様書を作成した。 業務プロセスを大幅に見直し、2年かかっていた特許審査を半分の1年で完了することを目指した。度重なる改修によって複雑に入り組んだ記録原データベース(DB)の一元化に加え、検索や格納など

    55億円無駄に、特許庁の失敗
  • 富士通、研究業績を容易に公開できる大学向けSaaS型サービスを提供

    富士通は、国内最大の研究者業績データベース「ReaD&Researchmap」から、大学に所属する研究者の業績を容易に公開できるSaaS(software as a service)型のサービス「Ufinity研究者業績サービス」の提供を開始すると発表した。このサービスにより、大学は独自の研究者業績データベースの構築や運用が不要になり、研究者は業績情報の登録や更新を2重に行う必要がなくなるため、作業負荷を軽減できる。

    富士通、研究業績を容易に公開できる大学向けSaaS型サービスを提供
  • 「Googleと比べてみて!」、MicrosoftがBingキャンペーンを開始

    Microsoftは現地時間2012年9月6日、同社の検索エンジン「Bing」が米Googleのものより優れていると主張する「Bing It On」キャンペーンを開始した。Bing.comサイトに設けたテスト画面「Bing It On Challenge」を使って、BingとGoogleの検索結果のクオリティを比較できる。 Bing It On Challengeで検索キーワードを入力し、検索を実行すると、BingとGoogleによる検索結果が左右に分かれて表示される。この二つはどちらの検索結果か分からないようになっており、ユーザーは優れていると思う検索結果の上部にある「RESULTS ON RIGHT」または「RESULTS ON LEFT」のチェックボックスをチェックする。「DRAW」(引き分け)を選ぶこともできる。 このテストを5回行うと、BingとGoogleのどちらを多く選んだ

    「Googleと比べてみて!」、MicrosoftがBingキャンペーンを開始
  • 京大が図書館システム刷新、1画面で電子書籍から他大学の文献まで検索可能

    京都大学は2012年8月20日、新しい図書館情報システム「KULINE」を稼働させた(画面)。新システムでは、650万冊以上ある全ての京大図書館所蔵文献(図書・雑誌・電子ジャーナル・電子ブック・学術情報リポジトリなど)に加えて、他の大学・機関の蔵書や商用データベースなども、1つの画面から検索できる。これにより、学内・学外にある膨大な検索対象の中から、目的の文献を素早く探せるようにした。 新システムでは、1度検索キーワードを入力すると、京大内の全ての文献を対象に検索できる。さらに、タブを切り替えると他大学などの文献も検索対象になる。キーワードにヒットする検索結果が大量にある場合は、絞り込み条件(ファセット)を自動的に提示し、文献にたどり着きやすくした。学生などの利用者が文献に対する書評を投稿したり、関連情報のタグ付けをしたりする「ソーシャル」機能も提供する。 さらに京大は2013年3月をメド

    京大が図書館システム刷新、1画面で電子書籍から他大学の文献まで検索可能
  • WiMAXでどこでも学内LANに接続、追加コストをほとんどかけず構築

    ●UQのモバイルWiMAX網と学内LANを直結してリモートアクセス ●学術情報ネットワーク(SINET4)、学術認証フェデレーションを効果的に活用 京都大学は2012年4月、UQコミュニケーションズ(以下、UQ)と共同で、教職員や学生向けに、UQのモバイルWiMAXサービスのエリア内であればどこからでも学内LANに接続できる無線接続環境を構築した。ポイントは、京都大学側は既存の資産を活用することで、ほとんど追加コストをかけずこれらのネットワークを構築した点だ。 既存の仕組みを効果的に活用 モバイルWiMAX経由で学内LANに接続する仕組みは、企業ネットワークにおけるリモートアクセスの構成とほぼ同じだ。UQのネットワークセンターと学内LANを直結することで実現した。このネットワークセンターと学内LANを結ぶ中継網に、既に利用中の学術情報ネットワーク(SINET4)を流用し、コストを抑えた。通

    WiMAXでどこでも学内LANに接続、追加コストをほとんどかけず構築
  • LibreOffice導入のJA福岡市がMicrosoft Officeからの移行に役立つマニュアルを公開

    写真●JA福岡市が公開した「よく使うCalc&Writerマニュアル」の一部(Writer:表組内での縦位置を調整する方法は?) JA福岡市は2011年12月27日、LibreOfficeの操作に関するよくある質問とその答えをまとめた文書「よく使うCalc&Writerマニュアル」を公開した。LibreOfficeは、OpenOffice.orgから派生したオープンソースのオフィスソフト。JA福岡市はLibreOfficeを導入しており、今後約840万円のコスト削減を見込んでいる(関連記事:JA福岡市がLibreOffice導入、MS Officeから移行で約840万円削減見込む)。 「よく使うCalc&Writerマニュアル」は、LibreOfficeの表計算ソフト「Calc」およびワープロソフト「Writer」使用時に、利用者から質問などがあった事項をまとめたもの。JA福岡市が職員に向

    LibreOffice導入のJA福岡市がMicrosoft Officeからの移行に役立つマニュアルを公開
  • エンドユーザーがExcelを使った業務アプリを作成可能に、富士通グループが開発ツール

    写真●RapidWebSSを使った業務アプリケーションのイメージ。伝票などの記入にはExcelを使う。左側が稟議申請者用の画面、右側が決裁者用の画面。 富士通富士通アプリケーションズは2011年8月10日、Excelを使った業務アプリケーションの開発ソフト「RapidWebSS(ラピッドウェブ エスエス)」を販売開始した。 最大の特徴は、旅費精算、備品借用申請、稟議書や届出の作成と回覧、顧客情報や商談情報の管理といった、事業部門のエンドユーザーがExcelファイルで処理しているような業務を、Webの仕組みを使って業務アプリケーション化できること。 RapidWebSSを使った業務アプリケーションの利用イメージは次のようなもの。利用者はRapidWebSSがインストールされたサーバーに、PCのWebブラウザからアクセス。ブラウザ上にアプリケーション選択メニューが表示される。ここから例えば稟

    エンドユーザーがExcelを使った業務アプリを作成可能に、富士通グループが開発ツール
  • 色や感情などで電子記事を検索できるシステムを凸版印刷が展示---国際電子出版EXPO

    写真1●凸版印刷が参考出品していた電子雑誌向けコンテンツプラットフォーム「Next Choiiist!」。「色」や「動き」などの切り口から記事を検索できるようにする「エモーショナルビューア」を動かしているところ 2011年7月7日から9日までの3日間、東京ビッグサイト電子書籍や電子出版関連の総合展示会「第15回国際電子出版EXPO」が開催された。会場内の一角で注目を集めていたのが、凸版印刷が同社ブースで参考出品していた「Next Choiiist!」(ネクストちょいすと)と呼ぶ現在開発中の次世代コンテンツプラットフォームである(写真1)。 同プラットフォームでは、ユーザーがサービス利用時に登録したプロフィールや趣味・趣向などに基づいて電子雑誌の記事を「お薦め記事」として提案する仕組み(リコメンドシステム)を提供する。電子雑誌1冊丸ごとではなく、より細かくユーザーの好みなどを反映できるよう

    色や感情などで電子記事を検索できるシステムを凸版印刷が展示---国際電子出版EXPO
    xiaodong
    xiaodong 2011/07/12
    「「色」や「動き」「味」「質感」など一般的な検索とは異なる切り口のキーワードを指定して電子雑誌の記事を検索」
  • Googleが東日本大震災のデジタルアーカイブ計画を始動、ストリートビュー技術を活用

    写真●Googleマップのストリートビューの画像撮影に使っている「360度全方向の撮影が可能な特殊カメラ」を搭載した車で東北から北関東の沿岸地域を撮影する グーグルは2011年7月8日、東日大震災の被害状況をデジタルデータとして記録および保存するためのプロジェクト「デジタルアーカイブプロジェクト」をスタートさせたことを発表した。 同プロジェクトでは、デジタルデータの保存方法として「Googleマップのストリートビュー」技術を活用。ストリートビュー向けの画像作成に使っている「360度全方向の撮影が可能な特殊カメラ」を搭載した乗用車を使い、特に地震および津波による被害が大きかった東北地方から北関東の沿岸地域を対象として、現地の被害状況を詳細に撮影する(写真)。撮影期間は3~6カ月を予定している。 グーグルでは、ストリートビュー技術を活用することにより、被災地にいる人に近い目線で被害状況を見る

    Googleが東日本大震災のデジタルアーカイブ計画を始動、ストリートビュー技術を活用
  • 新電子書籍端末やカラーの電子ペーパーが登場――国際電子出版EXPO

    電子書籍の見市「国際電子出版EXPO」が2011年7月7日、東京ビッグサイトで開幕した。7月9日まで開催する。会場には今後さらなる普及が期待されている電子書籍の最新サービスや各種製品などが多数展示されている。電子書籍市場の拡大を占う上でポイントとなりそうな注目の製品やサービスを紹介しよう。 パナソニックは7型の液晶ディスプレイを搭載した電子書籍リーダー「UT-PB1」を展示している。端末にはデュアルコアCPUを搭載。600冊の試用版の電子書籍をプリンストールしているほか、電子書籍配信サービス「楽天イーブックストア」(8月上旬サービス開始予定)に接続して新しいコンテンツを購入できる。同社はかつて「ΣBook」などの電子書籍端末を発売したが、電子書籍端末市場から一度撤退している。今回の新端末で再参入することになる。 米アマゾンの「Kindle」やソニーの「Reader」などに利用されている電

    新電子書籍端末やカラーの電子ペーパーが登場――国際電子出版EXPO
  • 国民一人ひとりの「マイナンバー」

    政府が制度化に取り組んできた、いわゆる「共通番号」が、ようやく一つの節目を迎えた。政府・与党社会保障改革検討部は6月30日に、「社会保障・税番号大綱」を決定した。同大綱はパブリックコメントを反映して修正されるが、基的に「番号法案(仮称)」の原案となるものだ。国民一人ひとりに割り当てた番号を用いることで、これまで実現できなかった国民にとって利便性の高い行政サービスの実現を目指すことになる。 民主党が2009年9月に政権に就いてから2年弱。迷走する政策も目に付く中で、社会保障と税の一体改革は着々と議論が進められてきた。2011年1月には、国民ID制度の導入を推進する高度情報通信ネットワーク社会推進部(IT戦略部)と共同で作業部会を設置。専門家による事務的な検討を加速させたのも奏功した。 国会での法案審議の行方次第ではあるが、政府は3年後の2014年6月に国民一人ひとりに番号を割り当て、

    国民一人ひとりの「マイナンバー」
    xiaodong
    xiaodong 2011/07/09
    著者IDと関連?
  • インテック、Hadoopを使ったシステムの構築・運用サービスを開始

    インテックは2011年2月9日、オープンソースソフトウエア(OSS)の分散バッチ処理ソフト「Hadoop」を使ったシステムの構築・運用サービスを開始すると発表した。同社のデータセンターでHadoopクラスターを運用し、顧客企業がHadoopで構築したシステムをサービスとして利用できるようにする。 今回発表したHadoopを使ったサービスは、同社のエンタープライズ向けクラウドサービス「EINS/SPS」の一つという位置付けである。Hadoopはバッチ処理を複数台のサーバーに分散させる仕組み。そのため大規模なPCサーバークラスターが必要となるが、顧客企業が大規模なクラスターを自社で運用するのは難しいと考え、システム構築だけでなく運用も含めたサービスを開始した。 ウルシステムズが同日OSS化した、Hadoopを使った基幹バッチ処理用ソフトウエアフレームワークである「Asakusa Framewo

    インテック、Hadoopを使ったシステムの構築・運用サービスを開始
  • グーグル発「Hadoop」、日本企業も利用へ

    Hadoopは、グーグルが検索エンジン用に開発したバッチ処理システムを基に開発された、オープンソースソフトだ。グーグルが開発した分散ファイルシステム「Google File System(GFS)」を模した「Hadoop Distributed File System(HD FS)」と、データ処理機構「MapReduce」を模した「Hadoop MapReduce」で構成する。 米国では米VISAや米JPモルガン・チェースのような大手金融機関が、バッチ処理にHadoopを使用する。 そのHadoopがいよいよ、日企業でも使われ始めた。例えば楽天は、ある商品に対するお薦め商品をリストアップする「レコメンド処理」にHadoopを使用する。NTTデータは、全国の渋滞情報をリアルタイムに可視化するシステムの構築にHadoopを採用した。三菱UFJインフォメーションテクノロジーもHadoopを使っ

    グーグル発「Hadoop」、日本企業も利用へ
  • [データセンターの熱管理編]サーバーの間にすき間を空けてはいけない

    データセンターのラックにおいて,上下のサーバーの間にすき間を空けて設置しているのを見かけることがある。すき間を空けることで風通しをよくして,サーバーに熱がこもりにくくなるようにする意図だろう。この方法は一見もっともらしいが,実はデータセンターのラックでやってはいけない。 サーバーは前面から冷気を吸い,背面から熱気を排出する。すき間を空けることこの流れが変わってしまう。図の左部分を見てほしい。これはサーバーの間にすき間を空けた場合に,空気がどう流れるかを表したものだ。背面に排出された熱気が前面に循環してしまっている。サーバーはこの熱気を前面から吸気するため,サーバーに冷気が流れない。つまり冷却できないことになる。この循環が続くと,いずれは熱暴走を起こす危険もあり得る。 熱気の循環を防ぐのに有効なのがブランク・パネルを使うことだ。ブランク・パネルとは,ラックのすき間に取り付けるパネルのことだ。

    [データセンターの熱管理編]サーバーの間にすき間を空けてはいけない
  • Google、電子書籍販売サービス「Google eBooks」を開始

    Googleは米国時間2010年12月6日、電子書籍販売サービス「Google eBooks」の立ち上げを発表した。開設した電子書籍販売サイト「Google eBookstore」では、300万タイトル以上をそろえている。 Google eBooksの電子書籍は、ノートパソコン、タブレット端末、スマートフォン、電子書籍リーダーなどさまざまなデバイスで閲覧できる。購入したコンテンツはGoogleアカウントで保護され、無制限のストレージを利用可能。「GmailのメッセージやPicasaに保存してある写真と同じような感覚で、どこからでも電子書籍にアクセスできる」と同社は説明している。 パソコンで購入、保存、閲覧を行うためのアプリケーション「Google eBooks Web Reader」のほか、米Apple製端末とGoogleのモバイルプラットフォーム「Android」を搭載した端末向けモバ

    Google、電子書籍販売サービス「Google eBooks」を開始