チャリンコ通勤による滝のような汗で、朝からTシャツがシースルーになってしまうmikioです。さて今回は、Tokyo Cabinet(TC)のデータベースを各種のアルゴリズムで圧縮して利用する方法についてご紹介します。 圧縮B+木 B+木とは、比較関数の値による順序が近いレコード群を単一のページにまとめ、各ページにB木(multiway balanced treeの略であり、二分木(binary tree)とは違います)の索引を張ったものです。理論的にはレコードの探索も更新も O(log n) の時間計算量で行え、内部ノード(B木)の操作をキャッシュすると実質的には O(1) の時間計算量で探索や更新が行えるという、かなり安定した性能を備えるデータ構造です。その上、レコードが一定の順序に基づいて並べられているので、数値の範囲検索や文字列の前方一致検索が高速に行えたり、カーソルによって順序に基
完全主義者(自分でやらないと気のすまない人)はだめ。部下を信じるべし。質問はしまくろう。聞くは一時の恥。聞かぬは一生の恥だ。まず軽い成功で、ジャブ。自信がついたら大きな事業を成功させるのだ。つねに、失敗を確認して糧とする。どうしたら成功するかより、どうしたら失敗するかを考える。そして逆を行けば良い。過去形にしてから学ぶ必要は無い。苦手な事をを積極的に行う。オールマイティになるべし。失敗を糧とすることも重要だが、気にしすぎて仕事ができなくなっては意味がない。一日で忘れることができる能力を身につけよう。相手先の社内事情に詳しくなる。「用事は忙しい人に頼め。」忙しい人間ほど、時間のやりくりがうまく、きちんと責任を果たしてくれる。常に仕事を100%こなせば良いということはない。上司が50%しか要求していない重要でない仕事か、120%要求する重要な仕事かを常に判断すべし。縁の下にいてはいけない。縁の
太陽光と水を「燃料」に変換:安価な触媒で 2008年8月 1日 環境 コメント: トラックバック (0) Alexis Madrigal 太陽エネルギーを使って水を分離できる新しい触媒が発見された。 これは、Daniel Nocera教授(化学)をはじめとするマサチューセッツ工科大学(MIT)の研究チームが7月31日(米国時間)に『Science』誌に発表したもので、この触媒を安価な光起電性の太陽電池パネルと組み合わせることで、水を利用して太陽光から作り出したエネルギーを蓄える、安価でシンプルなシステムを作り出せるという[MITのリリースはこちら]。 この研究によって、Nocera教授らは、化石燃料への依存から脱却するための長い道のりを阻む、大きな障害を取り除くことに成功したのかもしれない。多くの再生可能なエネルギー源には供給が安定しないという問題点があるが、今回の発見によりその不安定さが
「Yahoo!ブックマークがはてなブックマークとは桁違いに違う件 - 聴く耳を持たない(片方しか)」を読んで。 ああ、Yahoo!ブックマーク、ありましたね・・・。 Yahoo!ブックマークがリリースされた当時は、その圧倒的なユーザー数に物を言わせてあっとう言う間に他社ソーシャルブックマークサービスを駆逐するか!?などと恐れられていた、、、とかいないとか。どうでしたっけ。 リリース直後しばらくはウォッチしてましたが、あまり目新しい所もなくそのまま見るのをやめてしまったように記憶しています。 人気ブックマーク - Yahoo!ブックマーク Yahoo!ブックマークのブックマーク登録数が多いものを上位200位くらいまでざっと目を通してみましたが、そのほとんどがどこかの公式サイトトップページで、それにいくつかの便利サイトがちらほら食い込んでるという感じでした。ブラウザのブックマークをオンラインに
最近なんですけどブログのことで悩んでいます。悩みはいくつかあります。数えてみたら主に4つでした。それらは本当にどうすれば良いか、なかなか答が出ません。 1つめの悩み「はてブについて」まず悩んでいるのははてブです。これが全く分からない。はてブとは一体何なのでしょうか? よく分かりません。ぼくははてブが好きです。できればブックマークしてほしい。ブックマークコメントも読みたい。それはもちろん、嬉しいコメントであれば嬉しいですが、disりコメントであってもかまいません。よっぽどのはいやですけど、よっぽどのでなければ読みたいです。ブコメの良いところは返事をしなくてもいいところですね。そこが好きです。 はてブ、それが悩みです。どうすればブックマークされるのか、それが全く分かりません。それはもちろん、ブックマークしようと思って頂ければブックマークして頂けるのでしょうけど、そのブックマークしたくなる心理と
京大は出たけれど・・・・・主要な企業における2009年新卒採用活動はほぼ終了し、2010年新卒採用の動きが活発化している今日、就職活動は一生懸命しているにもかかわらず、就職先が見つからない、あるいは、希望の就職先に内定をもらえず不本意な企業に内定し悶々とした日々を過ごしている高学歴大学生がここ京都大学に存在する。超売り手市場と言わる新卒就職市場においても、就職するのに四苦八苦する高学歴就職難民たち。これは、個人の問題ではない社会の問題である。 格差格差と言われるけれど・・・ロスジェネロスジェネという言葉がニートやフリーターなどの言葉と同じくらいに人口に膾炙するようになった。超左翼マガジンと銘打った「ロスジェネ」という雑誌も新たに刊行された。ロスジェネとは、ロストジェネレーションの略であり、就職超氷河期(1990年代という「失われた十年」)に社会へと送り出された20代後半から30代半ばの世代
戦争の心理学という本の抜き書き。 本書の目的は「裁くことでも非難することでもなく、ただ理解すること」。 「パンツを汚す」兵士は珍しくない 警察官や消防士として負傷者の救出に当たっている人は、負傷者の大小便失禁が珍しくないことを知っている 戦闘中の人間にも、大小便失禁は珍しくない。みんな面子にこだわるので、そうしたことは公然と認められず、失禁した兵士は、 自分がどこかおかしいのではないかと思ってしまう 激しい戦闘を体験した兵士のおよそ半分が尿を漏らしたと認め、四分の一近くが大便を漏らしたと認めている にもかかわらず、「パンツを汚した」兵士が出てくる戦争映画は、かつて作られたためしがない。典型的な兵士の姿は、だから嘘に基づいている スターリングラードの戦いから生還したロシアの兵士は、当時の平均年齢70歳に対して、皆40歳前後で死亡したのだという 「気のゆるみ」は正常な反応 ナポレオンは「もっと
今日もいくつかPhotoShareに関するブログエントリーを見つけたのだが、その中でもとてもうれしかったのがこれ。 あとはタイトルを付けて「完了」ボタンをタップするだけ。めちゃくちゃ簡単に投稿できます。【 iPhoneのキラーアプリになりそうな写真共有アプリ「Big Canvas PhotoShare」(もとまかApp Selection 第7回) - もとまかのiPhone・iPod touch戯れ日記より引用】 増井君と一緒にPhotoShareのアーキテクチャの設計した際に、もっとも力を入れたのが「どうやったらこれ以上簡単にすることは不可能なぐらいに簡単に写真を投稿できるようにできるか」という部分。その意味では、「めちゃめちゃ簡単」という言葉は最高の褒め言葉。 この手のアプリを作っていると陥りがちなのが「機能のてんこもり」。特に他のサービスと比較されることを意識し始めてしまうと、「敵
Yahoo! Pipes の charset 問題の文字化けが直らないので回避策を調べてみました。 いずれも reverse proxy 的にヘッダ (だけでもないけど) を書き換えるサービスをオリジンサーバと Pipes の間にはさむ方法です。 xmliconv Pipes の掲示板で紹介してもらいました。http://william.cswiz.org/tool/xmliconv/?url=http://pc.watch.impress.co.jp/sublink/pc.rdf のように使います。 charset だけを書き換えるサービスです。 個人サービスっぽいのでいつまで続くかわかりません。 feed のキャッシュはしないようです。 Google Mashup Editor Google Mashup Editor で公開されているアプリには feed を Atom で提供する機能
ボストンで13年働いた研究者が、アカデミック・キャリアパスで切磋琢磨する方法を発信することをめざします。 2024/02 « 12345678910111213141516171819202122232425262728293031» 2024/04 昨日NIHのプログラム・オフィサーがハーバードを訪れた際に、ランチの席で、政府からのグラント(科学研究費)をとるための戦略を相談する機会がありました。 現在米国の科学研究費が伸び悩み、グラント獲得競争はますます激しくなっています。そのため予備データのたくさんあるリスクが低い(結果を出す確率の高い)と見なされるプロポーサルしか採択されないのではという懸念が研究者コミュニティーに広がっています。 プログラム・オフィサーのコメントによると、NIHの主要なリサーチグラントであるR01を獲得するためには、予備データが十分にある(リスクが低い)ことは言う
先日、smashmediaの河野さんがプロデュースしたcrossreviewを使っています。そんなにヘビーユーザーではないのですが、これは使い続けていけるなあと感じています。Twiiterのように気軽に投稿できる設計や100文字レビューなど目を引くところは多くありますが、自分にとって魅力を感じるのは備忘録として使えるところです。 本を読んだはいいけど内容を忘れている、あるいは読んだことすら忘れてしまうなんて事は誰にでもあること。今であればブログに残しておくということもできますが、書評ブロガーと呼ばれる人ほど、一冊一冊の本にエントリーをするエネルギーを持ち合わせていません。やろうと思えば手段はあるのだけれど実行に移す気が起きない。「せっかく読んだ本の履歴を残しておきたい」というニーズは潜在意識の中に埋もれていたんですね。 ですがcrossreviewはつぶやきに近い気軽な感覚で投稿することが
通信システム構築を手がけるコミューチュアは2008年8月1日、持ち歩き可能な無線LANルーター「PHS-300 Personal Wifi Hotspot」(写真)を8月末にも発売すると明らかにした。この製品は電池で駆動し、携帯電話の電波が届く場所であれば、どこでも無線LANアクセスを可能にする。通常は無線LAN環境がない場所で、無線LANしか通信機能を内蔵しない機器でインターネット接続する用途に向く。 PHS-300はUSBポートを搭載し、イー・モバイルやNTTドコモが提供する第3世代携帯電話の通信モデムを接続できる。さらに1800mAhの大容量電池を内蔵。通信し続ける場合で1時間30分、ほとんど通信しない場合で3時間の連続使用が可能だ。携帯電話の電波と無線LANの電波を変換し、いつでもどこでも無線LANスポットを作り出すような装置となる。 現在、コミューチュアが技術基準適合証明の取得を
第25回 ユーザは使いよう 2008年7月22日 ITデザイン コメント: トラックバック (0) (これまでの増井俊之の「界面潮流」はこちら) 近年のユーザインタフェース開発では「ユーザ中心設計」(User-centered Design)を行なうことが常識になっています。システム設計者の思い込みにもとづいて作られたシステムがユーザにとって使いやすいものになる可能性は低いですが、設計の初期段階からユーザの欲求についてよく検討し、設計の途中段階においても実際にそれが使いやすいかどうかテストを行ないつつ開発を行えば、本当にユーザにとって使いやすいシステムを開発することが可能になります。 ユーザビリティの専門家のJakob Nielsenは以下のような5個の要素を使いやすさの目標としてあげています。 1. 学習しやすさ (Learnability) 2. 効率 (Efficiency) 3.
いつの間にか60万契約達成、高速・低額のイーモバイルが初年度の2倍に ■トピックスの内容 2007年3月末に公約通り30万契約を突破したイーモバイルの契約が2008年6月末で、60万契約を突破した。主に契約数を伸ばしたのは2008年3月期ではあるのだが、その後も順調に契約を伸ばし、2008年度が始まって3ヶ月という短期間で初年度目標の60万契約を突破した。現在でも月間5万契約のペースが続いており、このペースで行けば2008年度末で、100万契約を突破できる算段となる。 ちなみに、イー・モバイル自身が5月に発表した内容では、2009年3月時点では140万契約を目指すのだという。7月には、EMONSTER liteや、低価格テレビ電話端末などを発売した。また、Eee PCとのセット販売で、100円などの販売企画も目白押し。この後、どこまで契約を伸ばしていくかが楽しみだ。 【関連リンク】 ・みん
"Memory allocation" redirects here. For memory allocation in the brain, see Neuronal memory allocation. This article is about memory management in an address space. For management of physical memory, see Memory management (operating systems). This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducin
« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。 竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。 普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab
人気の記事 1「iPad」2024年モデルはどうなる?これまでの予想と個人的な期待 2024年03月11日 2「iPhone」の「盗難デバイスの保護」をすべての場所で有効にする方法 2024年03月11日 3マイナカードのiPhone搭載「もうちょっとお待ちを」--河野大臣が笑顔で言及 2024年03月05日 4「Files by Google」、文書を簡単にスキャンできる新機能を追加 2024年03月08日 5SkyDriveとスズキ、関西万博で飛ばすeVTOL「SKYDRIVE」の製造を開始 2024年03月11日 6AIスマホのデモで実感した「スマホアプリが消える」未来 2024年03月09日 7「Nothing Phone (2a)」--スタイルよりスペック重視の新型スマホを写真で確認 2024年03月08日 8「ChatGPT」、多要素認証が可能に--有効にすべき理由とその方法
要旨か何かを書いているとき、たいていはページ数が限られています。 でも、無理矢理詰め込まなくてはなりません。 そのための方法をいくつか紹介します。 大前提 まず、文章を工夫しましょう。 レイアウトをいじってどうにかしようとする 前に、洗練された文章にすることが必要なのは言うまでもありません。 ただ、読みやすいように気持を込めた文章(構成)まで変えて詰め込むのは 良くないことです。 1. 行間を調節する 行間の倍率を設定できる\baselinestretchという変数がありますので、これを使 う方法です。 この方法が最も効果的で副作用が少ないのでおすすめです。 プリアンブル(\documentclassと\begin{document}の間)に \renewcommand{\baselinestretch}{0.8} とすれば、行間が0.8倍になります。 ページの途中から行間を変えるときは、
共起, ATOK例えば「フルートを吹く」と「布で拭く」。これはそのまま共起用例使ってるんだと思うんですよ。でも、「ぬので ふるーとを ふく」ってのがあったらどうでしょう?あきらかに「ふるーとをふく」が含まれているのに、ちゃんと「ぬのでふく」が共起します。*1これって「布で(*を)拭く」みたいな共起用例を使っているのでしょうか?それ全部網羅的にやるのはちょっと気が遠くなりそうなのですが…。
株式会社ズー (本社:長野県上田市 代表取締役社長:宮島 仁一 www.zoo.co.jp)は、日本語処理技術(形態素解析、係り受け解析)を応用することにより、日本語情報収集能力を飛躍的に高めたWEBブラウザ「スマートブラウザ」を開発いたしました。 「スマートブラウザ」は、独自の高精度日本語形態素解析(※自然言語で書かれた文章を、言語で意味を持つ最小単位に分割する技術)エンジン「言語郎」による日本語の「分かち書き」をすることで、「ホットクリック」、「関連文書検索」、「要約」、「ルビ振り」、「単語出現頻度解析」そして「言語解析」といった、従来のブラウザにはない様々な便利な機能を実装した新型WEBブラウザです。 ホームページ上の文章を自動的に「分かち書き」にし、それぞれの単語や文節をキーワードとする「検索サイト」、「ショッピングサイト」、「辞書サイト」などへの検索が、キーボード入力なしに、ワン
スクリプトが読み込まれるまで画像の読み込みがブロックされている - 同ブログより抜粋 WebページパフォーマンスツールであるYSlowの主要開発者でありYahoo! Exceptional Performanceの開発者であるStoyan Stefanov氏がNon-blocking JavaScript Downloadsというタイトルで、ページの読み込み速度を向上させるテクニックを簡潔にまとめている。これはブロックが発生するJavaScriptの読み込みを並列化することでページの読み込み時間を短縮しようというもの。Webページの読み込み高速化に効果的な手法なのでWebデベロッパは一度目を通しておきたい。 JavaScriptの読み込み中はほかの読み込み処理がブロックされる。これをDOM経由で動的にロードするように書き換えてやれば並列して読み込まれるようになる。Non-blocking
というようなタイトルで本とか出したら話題になりませんかね。 ずっと前から、情報が氾濫なんてしていると思ったことも、感じたこともないし、 そのように認識することが、理解も、納得も、全くできませんでした。 教授はそのように言っていますが、教授に言われてからそう思ったわけではないです。 東京大学大学院情報理工学系研究科電子情報学専攻 A教授 の話 ※この教授は 情報爆発 info-plosion にも名前を連ねています。 「情報は増えていないと思うんだよね。データ量は増えているけど。だいたいさ〜新しい情報はほとんどないわけよ」 「でも〜 "情報は少しずつ増えています" なんて言うと〜研究費もらえないからさ〜 一応こういうことやってるわけだし〜 "情報は爆発的に増えています" なんて言わなきゃならないわけよ。」 ※ もちろん A教授が研究費不正受給とか何かを仄めかしている というわけではありません
Protocol Bufferとは Protocol BufferはもともとGoogle社内で利用されていた技術/ツールだ。今月7日にApache Software License 2.0の下、オープンソースソフトウェアとして公開されたばかりで、本稿執筆時点の最新バージョンは2.0のβ版。正式リリースが2008年8月に行われる予定だ。 Protocol Bufferは、一言で言うと、構造化データをバイト列に変換(シリアライズ)するソフトウェアである。プログラム言語中で用いられるデータ構造をファイルに保存する際や、RPC(Remote Procedure Call)でデータをやり取りする際などに用いられる。 同様の目的で用いられる技術としては、XMLやJavaのオブジェクトシリアライズなどが挙げられる。ただし、Protocol Bufferは、そうした類似技術と比較して、以下のような特徴を備
ボスの教授から聞いた話。中国でも大学進学率が高くなり、その結果として大学院進学も増えた。理工系の大学院の修了要件として外部発表が課せられているらしいのだが、発表場所は少なくともEIとSIに載っていなければならないという縛りがあるらしい。その話を聞いたときにEIとSIがなんなのか分からなかったので恥を忍んで「EIとSIってなんですか?」と尋ねたところ、EI = Engineering Index, SI = Science Indexらしい。 今日、たまたま投稿しようとした国際会議のCall for Paperを読んでいると「この会議に採択された論文の抄録はEIに載りますよ」と記載があった。そういえば、今までEIとかSIとか聞いたこと無いなぁと思いちょっとGoogleで検索。 もともと工学系の情報共有を目的として、Engineering Index というものが作られたようだけれども、それが
さて、モダシンラジオのデータをホスティングしてもらっているSpotify for Podcasters(旧Anchor)の私のページはこちらです。 https://podcasters.spotify.com/pod/show/kazuyoshi-nagasawa このSpotify for PodcastersページのRSSは以下になります。こちらのRSSではenclosureタグなどでlength値などがしっかり入っているのでこれを購読しておくとよいかと思います。 https://anchor.fm/s/66ff2830/podcast/rss ここで聴く!という人は以下のプレイヤーからどうぞ。 んで、これまではGoogle Drive上に保存したmp3ファイルをaudioタグで聞けるようにしていたのですが、Google Driveの仕様がかわったのか以前の方法だとエラーになってしまい
「最近、やる気が出ない」ということがないだろうか。実はやる気が「出ない」のではなく、やる気は何かに「くじかれている」のだ。“やる気をくじく”8つの方法を知れば、やる気のコントロールが可能になる。 今回お話する「やる気をくじく8つの方法」は、20年ほど前に、私が精神科医である野田俊作先生の講演を拝聴し、そのときに触発された考えをベースに、私なりにアレンジしてきたものです。 最近、企業でも学校でも、若い人にやる気がない、元気がないと言われています。中には若い人だけでなく、中高年の人でもやる気が出ない人が多いと聞きます。 「やる気がない」のではなく「やる気がくじかれている」 しかし、アドラー心理学では、やる気がないという発想はしません。基本的に、やる気がない人は存在しないという前提に立っています。では、なぜやる気が出ないかというと、やる気をくじくいろいろな手法を散々やっているから──と考えます。
連載2回目は、ネット時代の要請を受けて、データマイニングを取り巻くツール環境がどのように変化(進化)をしているかを、ご紹介させていただきます。 現在、企業内のDWH(データウェアハウス≒巨大なDB)に蓄積された膨大なデータは、例えればダムに貯められた水です。ただ水門を開け閉めするだけでは、膨大な水量(データ量)が流出してしまい、現実的に意思決定の材料としては機能しません。まさに消防ホースから水を飲むようなもので、受け手の処理能力を軽く超えてしまうのです。そこで、処理が可能な適切な量・質に情報を絞り込んで取り出す「蛇口」が必要となり、その機能がデータマイニングに求められています。 しかし、現実問題として、そのマイニング自体が非常に高度で職人的な作業であるため、属人的な制約をうけることになります。つまり、分析者の能力と人数に限界があるため、結果として処理できる件数とデータ量にもすぐに限界が来て
今日は京都大学の石田先生が言語グリッドについて講演してくれる。 石田先生がいらっしゃる社会情報学研究科というのは、まず実装して動かしてみて、そこで出てきた問題点を解決していく、という方法で研究を進めているそうで、言語グリッドもそういう流れで生まれてきたものだそうだ。 言語グリッドとは一カ所からグリッドに情報を入力するとそれが全体で共有されるような仕組みになっているそうで、いくつかのNPO(医療・災害・教育)と一緒に自然言語処理の技術を活用した活動を展開しているようだ。特に用いられているのは他言語翻訳技術で、用例ベースの多言語診療ツールや多言語チャットで成果を挙げているそうだ。 おもしろかったのはNPOでは自然言語処理の技術をなんとか使おうと熱心にフィードバックしてくれて割とうまくいくのだが、学校でやろうとすると先生は忙しいので専ら消費者の立場でしか参加してくれず、失敗することが多いそうだ。
主要検索エンジンの日本語ページのインデックス数を比較してます。 インデックス数の判定は、それぞれの日本語版ページから日本語ページ限定オプション(2007年9月29日以降2008年6月21日までは、グーグルはウェブ全体)で、「う お が き し ち っ て と に の は へ も ゅ ょ を」のOR検索をした結果により、行なっております。よって、目安でしかありません。 おおむね、毎月の最終土曜日(あるいは、その前週の土曜日)に判定し、その当日又は翌日に更新します。 このページの更新は、更新履歴には記載しません。 インデックス数比較の表 年月日GoogleYahooWindows Live 2008年 9月27日
【特別企画】 ここまで使える! 最新の日本語入力ソフト ATOK 2008 for Mac 2008/07/29 最新の日本語入力ソフトで、どこまで快適な入力ができるのか?「 ATOK 2008 for Mac」を使ってみた2名が実際の使い勝手について語り合った。Mac標準の日本語 入力環境「ことえり」との比較検証と併せてご覧いただこう。 林伸夫(以下、林)●春菜さんは、以前からATOKユーザなんですか? 池澤春菜(以下、池澤)●はい。Macを触り始めた頃からATOKだったと思います。物心ついたときからMacで、ウィンドウズはほとんど触ったことがありませんでした。 林●私は、1984年のMacが日本語に対応したくらいの頃から、自宅で「イージーブリッジ(egbridge)」を使っていました。会社ではATOKも使っていて、2つを比べながら使っている状態でした。最近、イージーブリッジが
Amazon.comは米国時間7月29日、新しいオンライン決済サービス「Checkout by Amazon」と「Amazon Simple Pay」を発表した。同社はその他のオンライン小売店に提供していく。eBayの「PayPal」やGoogleの「Google Checkout」などと競合することになる。 AmazonはCheckout by Amazonを、Amazonの「1クリック」決済オプション、そして送料や売上税、プロモーションを管理するツールを特色とする「完全な決済ソリューション」だとしている。Googleは2006年、同様のオンライン決済システムを発表しているが、アナリストらによると、小売店や消費者の利用はあまり増えていないという。 Amazonが同時に発表したSimple Payは、消費者はその他のウェブサイトで購入時に自分のAmazonアカウント情報を利用して決済できる
米IBMは7月29日、携帯電話に記録したデータを利用する情報管理技術を発表した。「PENSIEVE」(「ハリー・ポッターと炎のゴブレット」に登場する、他人の記憶を追体験できる魔法の水盆「ペンシーブ」にちなんでいる)という愛称を持つこの技術は、ユーザーが携帯電話で記録した画像、音声、テキストなどを利用して、人名、容姿、どこで会ったかなどを思い出す手助けをするという。 この技術は、人間が関連するデータの断片を結び付ける「連想想起」の手法を利用している。PENSIEVEは画像処理、GPS、スマートクラスタリング、文字認識、音声認識、情報検索といった技術を統合し、情報のインデックス化とタグ付けをする。 例えば、あるカンファレンスで誰かに会ったとする。その人の写真と名刺を携帯電話で撮影して持ち帰り、PENSIEVEと同期させると、PENSIEVEはこの2つのデータが同じ時間と場所で記録されたことを認
「Googleの弱点を克服したアルゴリズムによる検索エンジンを世界で初めて実装した」(Preferred Infrastructure 岡野原大輔氏)---リナックス ビジネス イニシアチブ(LBI)は2月8日,Net&Com2007で「Web 2.0時代に向けたLinux活用技術」と題したセミナーを開催,Linuxを活用した新サービスなどに関する発表が行われた。 Weblio:マッシュアップによる遅延はキャッシュで防ぐ ウェブリオ 取締役最高技術責任者 佐々木亨氏は「Weblio辞書検索の秘密-中古Linux機で月間600万PV-」と題した講演を行った。 Weblioは,様々な辞書や百科事典,200以上の辞書を一度に検索できるサイトである。月間600万PVのアクセスがあるが,それに対し軽快な動作を安価に提供するために様々な工夫を凝らしているという。 まずWeblioのサイトはLinuxを
先日7月30日にScience誌に掲載された記事 ”Intrusive personal questions don’t belong in job interviews” に世界的に注目が集まっています。 https://www.sciencemag.org/careers/2020/07/intrusive-personal-questions-don-t-belong-job-interviews - Twitter Search というのも、この記事でははっきりと日本を名指しし、その環境について批判しているからです。 その割には日本国内での扱いは少なく、これでは日本人のみが日本の問題について意識しないという悪循環に陥ってしまうでしょう。 そこで個人的に、記事の日本語訳を行い、ここで公開いたします。 ------------------------------------------
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く