ブックマーク / xtech.nikkei.com (15)

  • コサイン類似度とは? 新しい検索体験を支えるベクトルDBの基本技術を押さえる

    生成AI人工知能)のRAG(検索拡張生成)の導入など企業で使われ始めたベクトルデータベース。その特徴は検索にある。ベクトルデータベースとはどのようなデータベースで、なぜ「意味」で検索できるのか。ベクトルデータベースの基技術についてデータベースの専門家が解説する。(編集部) ベクトルデータベースは自然言語処理などAI技術の発展の中で生まれたデータベースであり、ベクトルの概念を用いてデータを管理するデータベースです。生成AIの登場とともに注目を集め、いまや多くの既存のDBサービスやその応用サービスにベクトルデータベースの機能が組み込まれています。 以下で検索を例にベクトルデータベースの特徴や動作の仕組みを解説します。 ベクトルによる「類似度」の判断 ベクトルデータベースがストアするのは数値の羅列です。単語や文章などの「意味」「文脈」を数値化したデータであり、個々の数値を取り出して意味や違い

    コサイン類似度とは? 新しい検索体験を支えるベクトルDBの基本技術を押さえる
    umasioaji
    umasioaji 2024/08/23
  • データセンター建設が住民の反対で頓挫、大規模化と住宅近接で「迷惑施設」扱い

    千葉県流山市のデータセンター(DC)の建設計画が、地域住民の反対で頓挫した。かつてDCは都心部の商業地域や工業地域に建てられることが多かった。ところが近年は大規模DCが住宅のある郊外地域に作られるようになったことで、住民から「迷惑施設」扱いされている。立地に細心の注意を払わなければ、今後もDC建設は頓挫しかねない。 千葉県流山市:第一種住居地域だった土地に大型DCの建設計画 2023年12月に頓挫したのは、東京都渋谷区に社を置く「流山綜合開発K」という企業が、流鉄流山線流山駅の駅前、流山市役所の目の前にある1万2877平方メートルの土地で進めていた、地上4階・地下1階建てで高さ28メートルのDC建設計画だ。流山綜合開発KはこのDC開発のために設立した特定目的会社だ。 開発区域はもともと「飛地山」と呼ばれていた場所で、ある企業の保養所が建てられ、山は樹木に覆われていた。2018年ごろにマン

    データセンター建設が住民の反対で頓挫、大規模化と住宅近接で「迷惑施設」扱い
    umasioaji
    umasioaji 2024/04/06
  • 「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め

    ビジネスでデータサイエンスを活用するシーンとして、過去データを使って将来を予測するタイプの問題がある。商品販売数や店舗売上高など、折れ線グラフを使って表現するようなデータ(時系列データ)に基づいた時系列分析だ。過去の販売データに基づいて翌月の発注量を決めたり、3年後など中長期の計画を策定したりするのに使う。今回は、この時系列分析に活用しやすい3つのアルゴリズムを見ていこう。 Prophet

    「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め
    umasioaji
    umasioaji 2022/10/07
  • 文化シヤッターのシステム開発頓挫で、日本IBMが19.8億円の賠償を命ぜられた理由

    システム開発の頓挫を巡る、文化シヤッターと日IBMとの間の裁判で、東京地方裁判所は日IBM側に19億8000万円の支払いを命じた。米セールスフォースのPaaSを用いた販売管理システムの構築を目指し、2015年に始めた開発プロジェクトだったが、2017年にストップしていた。東京地裁は開発失敗の原因をどう認定したのか。裁判記録をもとに読み解く。 文化シヤッターが、20年以上前から使用していた販売管理システムを刷新するプロジェクト格的に始動させたのは2015年1月のことだ。日IBMに提案依頼書(RFP)の作成を委託。そのRFPを基に複数ベンダーから提案を受けた上で、日IBMを開発委託先として選定した。 日IBMの提案はシステム構築に米セールスフォースのPaaS(プラットフォーム・アズ・ア・サービス)である「Salesforce1 Platform」を用いるものだった。RFPでは標準

    文化シヤッターのシステム開発頓挫で、日本IBMが19.8億円の賠償を命ぜられた理由
    umasioaji
    umasioaji 2022/07/29
  • VTuber「8000人」殺到、指の動きを再現する凄腕副業エンジニア

    VRエンジニア。1992年生まれ、栃木県出身。筑波大学大学院修了後、DeNA(ディー・エヌ・エー)に入社。XR事業を手がけるhelo(ハロー)を経て、SHOWROOMのVRエンジニア副業としてLuppetの開発を進める。エンジニアを目指したきっかけは、ゲームとものづくりが好きだったから。別名、ねぎぽよし。(撮影:加藤 康) 動画配信サービスYouTubeで活動するバーチャルタレント「VTuber(ブイチューバー)」。3DCGなどのアバターを動かすVTuberに欠かせないのが、仮想空間上で体の動きを再現するモーションキャプチャー技術である。同技術において、VTuber関係者の間で人気を博し、8000以上のライセンスを提供するソフトウエアがある。SHOWROOM 事業部 アライアンス部 プロダクトG 兼 ラペットテクノロジーズ 代表の根岸匠が開発する、「Luppet(ラペット)」だ。 Lup

    VTuber「8000人」殺到、指の動きを再現する凄腕副業エンジニア
    umasioaji
    umasioaji 2021/06/28
  • 逆転敗訴した野村情シスがIBMに送った悲痛なメール、横暴なユーザーを抑えきれず

    委託したシステム開発が頓挫したとして、野村ホールディングス(HD)と野村証券が日IBMを相手取って計約36億円の損害賠償を求めた裁判。プロジェクト失敗はベンダー側に非があるとした2019年3月の一審判決から一転、2021年4月の控訴審判決はユーザー企業側に責任があるとした。工数削減提案に十分に応じなかったり、プロジェクト途中で追加要件を多発したりした野村側の姿勢を東京高裁は問題視し、逆転敗訴の判決を下した。 関連記事 野村HDが日IBMに逆転敗訴の深層、裁判所が問題視した「X氏」の横暴な変更要求 野村HDが日IBMに逆転敗訴のワケ、「工数削減に応じず変更要求を多発」と指摘 東京高裁が特に問題視したのが、システムの仕様を策定するうえで重要な役割を担っていた野村証券のユーザー部門「X氏」の振る舞いだ。 当時、投資顧問事業部(判決文では「投資顧問部」)の次長だったX氏は、パッケージソフトに

    逆転敗訴した野村情シスがIBMに送った悲痛なメール、横暴なユーザーを抑えきれず
    umasioaji
    umasioaji 2021/06/11
  • 誰でも使える「衛星データ」、新型コロナの影響を宇宙からふかん

    読者の皆さんは「人工衛星データ」と聞いたとき、何を思い浮かべるだろうか。多くの人は「最先端」「いろんな事ができそう」というイメージを持ちつつも、「自分では利用できない」「敷居が高い」「専門家だけのもの」という感想を持つことだろう。メディアなどで人工衛星データの活用事例などを見かけることはあっても、自分自身で利用してみようという気にはならないかもしれない。 実は、そんなイメージに反して、現在では誰もが手元のパソコンで人工衛星データを簡単に利用できるようになっている。その原動力は、各種衛星データのオープン化と、衛星データ利用ツールの登場である。 例えば日では、「Tellus(テルース)」というツールが経済産業省の「政府衛星データのオープン&フリー化及びデータ利活用環境整備・データ利用促進事業」の取り組みとして2019年より提供されている。また米Googleグーグル)はバーチャル地球儀システ

    誰でも使える「衛星データ」、新型コロナの影響を宇宙からふかん
    umasioaji
    umasioaji 2020/12/26
  • AI道場「Kaggle」の正体

    AI開発の「道場」といえるデータ分析コンテスト「Kaggle」をAI人材の採用や育成に活用する企業が相次いでいる。日立製作所、ディー・エヌ・エー(DeNA)、Preferred Networksの活用事例を通してKaggleの正体に迫る。 PFNが画像認識コンテストで世界3位の快挙、挑戦で得た果実とは 日を代表するAI人工知能)スタートアップの1社、Preferred Networks(PFN)の有志チームが2019年10月初頭、2つの国際画像認識コンテストで世界トップクラスの成績をたたき出した。 2019.10.15 AI道場「Kaggle」の金メダリストも参加、日立が渾身のDX専門組織 データサイエンスを起点にシステムインテグレーション(SI)を変える――。日立製作所で社会インフラのSI事業を担う社会・通信ソリューション部のデジタルソリューション推進部で新たな挑戦が始まった。 2

    AI道場「Kaggle」の正体
    umasioaji
    umasioaji 2019/10/19
  • 「リクナビ問題」二の舞防げ、プライバシー保護に効く米政府策定のフレームワークに注目

    企業にとってプライバシー保護が重要な経営課題になってきた。欧州連合(EU)が2018年5月に個人データ保護を定めた「一般データ保護規則(GDPR)」を施行し、米国ではカリフォルニア州が2020年1月に同州消費者プライバシー法を施行するなど、違反した際に高額な罰金を科す法の枠組みが整備されてきたからだ。言うまでも無く、プライバシー保護がおろそかになっていると明らかになれば、企業ブランドは失墜を免れない。 では、企業はどう対策すればよいのだろうか。1つの解となり得るフレームワークが米国で完成しようとしている。米国立標準技術研究所(NIST)が公開した「Privacy Framework(PRF)」である。現時点はドラフト版だが2019年内に正式版となる見通しだ。 PRFはプライバシー保護に必要な5つの機能を定義している。「特定、統治、管理、伝達、防御」である。それぞれ、「特定」は企業におけるプ

    「リクナビ問題」二の舞防げ、プライバシー保護に効く米政府策定のフレームワークに注目
    umasioaji
    umasioaji 2019/09/23
  • 「ハッシュ化したから安全」と主張するのをそろそろやめようか

    電子手帳サービス「Lifebear」を提供するライフベアや、予約管理サービス「Coubic」を提供するクービックが2019年3月後半、相次いで情報漏洩を発表した。どちらもサービスのユーザー認証に使うアカウント情報(IDとパスワード)の漏洩を、外部から指摘されて気付いたとしている。 この両社の発表には、気になる内容が含まれていた。 ライフベアは、漏洩したパスワードは「不可逆な暗号化された状態」であり、「それらの情報を使って第三者にログインされることはありません」と断言した。不可逆な暗号化は、ハッシュ化を指すとみられる。 クービックは、パスワードはハッシュ化した状態で漏洩したと説明した。さらにハッシュについて「規則性のない固定長の値を求め、その値によって元のデータを置き換えることで、元のパスワードを読み取れなくする、パスワードの安全な保管で用いられる方法です」と付け加える。

    「ハッシュ化したから安全」と主張するのをそろそろやめようか
    umasioaji
    umasioaji 2019/04/04
  • 「IT棄民」の企業が急増中、見捨てられても気づかない愚 | 日経 xTECH(クロステック)

    「誰からも相手にされない企業、というか、存在すら認知されない企業って日に数多くあるんですよね。そしてどんどん増えている」。最近、ITコンサルタントやITベンダーのマーケティング担当者と話していて、そんな話題がよくのぼる。何の事か分からない読者も多いと思うが、説明の前にそんな企業にレッテルを貼っておく。記事タイトルにある「IT棄民」だ。ITに関して見捨てられた企業のことだ。 そもそも「棄民」とは、政府などに見捨てられた人々のことを指す。もう少し広い意味で使われて「棄民世代」といった言い方もある。就職氷河期でもあった日経済の長期低迷期に社会に出た人たちのことを指し、いわゆる「ロスジェネ世代」である。IT棄民の場合、見捨てられたのは人ではなく企業だ。ITベンダーだけでなく、ある意味、我々のようなIT系メディアからも見捨てられてしまって、最新ITの恩恵を受けられない存在になってしまっているのだ

    「IT棄民」の企業が急増中、見捨てられても気づかない愚 | 日経 xTECH(クロステック)
    umasioaji
    umasioaji 2018/10/01
  • 深層学習の最新テクニック、AIコンペの成績上位5人が披露 | 日経 xTECH(クロステック)

    人工知能学会は2018年6月5日、同学会が主催した画像認識コンペティション「JSAI Cup 2018」の結果を発表し、入賞者5人を表彰した。1位~5位の入賞者が実施したプレゼンテーションを通じ、深層学習(多層のニューラルネットを使った機械学習)で画像認識AIの精度を高める最新のテクニックを紹介しよう。 今回のコンペのテーマは「材の分類」。材の画像データから、タマネギ、きゅうりなど55種類の材料を分類する画像分類器を設計し、正解率の高さを競う。 「タマネギ」「きゅうり」などの正解ラベルが付与された学習用の画像データは1万1995枚、正解ラベルを付与していない評価用のテストデータは3937枚 主催者が提示した学習用の画像データは、協賛のクックパッドが提供した1カテゴリ約290枚×55カテゴリの1万5932枚である。コンペの開催期間は2018年1月22日~3月29日。応募者は121人で、う

    深層学習の最新テクニック、AIコンペの成績上位5人が披露 | 日経 xTECH(クロステック)
    umasioaji
    umasioaji 2018/06/19
    相澤山崎研強し。レシピのレコメンドや出先で冷蔵庫在庫調べるには袋の中まで類推できることが必要ですね。
  • 「サル軍団」にシステム障害を起こさせる、Netflixの驚異的なトラブル撲滅法

    Netflixは、わざと番障害を起こしてすぐ復旧させることを繰り返し、当の障害発生に備える、という驚くべき手法「カオスエンジニアリング」を実践している。 その効果は実証されている。Netflixが全面的に採用しているAmazon Web Services(AWS)で、2017年2月に中核施設の一つ、米バージニア北部リージョン(広域データセンター群)にて大規模障害が起きたとき、別のリージョンに速やかに切り替えたという。 Netflixの先進的な取り組みを紹介するこの特集の最後に、カオスエンジニアリングを取り上げる。

    「サル軍団」にシステム障害を起こさせる、Netflixの驚異的なトラブル撲滅法
    umasioaji
    umasioaji 2018/01/17
  • 関係が泥沼化、京都市が7億5000万円請求するもIT企業は支払い拒否

    京都市が進めていたシステム刷新の稼働が遅延している件で、京都市とシステム開発を受託したシステムズ(東京・品川)の関係が泥沼化している。京都市は開発遅延の責任を巡って2017年10月12日、システムズに対して10月27日までに約7億5000万円の損害賠償を支払うことを求めていた。ところがシステムズはこの支払いに応じなかったことが、日経コンピュータの取材で分かった。京都市とシステムズともに、訴訟に発展する可能性を否定していない。 京都市の情報システム部門に相当する総合企画局情報化推進室は2014年から81億円を投じて、基幹系システムの刷新プロジェクトを進めてきた。この基幹系システムは、国民健康保険や介護保険といった福祉系のほか、徴税、住民基台帳の管理など18業務を担うもの。NEC製メインフレーム上にCOBOLプログラムで構築したシステムで、稼働後約30年が経過している。 福祉系のオンラインシ

    関係が泥沼化、京都市が7億5000万円請求するもIT企業は支払い拒否
    umasioaji
    umasioaji 2017/11/04
  • 「ニッチで攻めれば少ないPVでも儲かる」nanapi古川健介社長

    ページビュー(PV、総閲覧件数)頼みはもう止めよう――。こんな方針を掲げ、黎明期から続くネット業界特有のビジネスモデルから脱却を試みるネット企業が増えている。広告料金で稼ぐために自社のWebサイトに多くの閲覧者を集め、広告のクリック数を高めることに終始する従来手法とは違った世界を模索する。 その一社がコミュニティサイト運営のnanapi(ナナピ)だ。KDDIが2014年10月にスマートフォン向けサービス構想「Syn.」を発表したのに合わせ買収したことで当時話題を呼んだ。社長である古川健介氏は著名な起業家としても知られる。ネット業界のキーマンの言動は、ときに波紋を起こしながらも注目を集めてきた。彼が今目指すのは「少PVでありながら、単価の高い広告」という新しいビジネスモデル。専門性の高いコンテンツで、質の高い読者を集められると意気込んでいる。 6月に「The First Penguin(TF

    「ニッチで攻めれば少ないPVでも儲かる」nanapi古川健介社長
    umasioaji
    umasioaji 2015/10/15
  • 1