タグ

ブックマーク / xtech.nikkei.com (13)

  • コサイン類似度とは? 新しい検索体験を支えるベクトルDBの基本技術を押さえる

    生成AI人工知能)のRAG(検索拡張生成)の導入など企業で使われ始めたベクトルデータベース。その特徴は検索にある。ベクトルデータベースとはどのようなデータベースで、なぜ「意味」で検索できるのか。ベクトルデータベースの基技術についてデータベースの専門家が解説する。(編集部) ベクトルデータベースは自然言語処理などAI技術の発展の中で生まれたデータベースであり、ベクトルの概念を用いてデータを管理するデータベースです。生成AIの登場とともに注目を集め、いまや多くの既存のDBサービスやその応用サービスにベクトルデータベースの機能が組み込まれています。 以下で検索を例にベクトルデータベースの特徴や動作の仕組みを解説します。 ベクトルによる「類似度」の判断 ベクトルデータベースがストアするのは数値の羅列です。単語や文章などの「意味」「文脈」を数値化したデータであり、個々の数値を取り出して意味や違い

    コサイン類似度とは? 新しい検索体験を支えるベクトルDBの基本技術を押さえる
  • セブン&アイの7payはなぜサービス終了に至ったか、「失敗学」の方法で分析した

    DX(デジタルトランスフォーメーション)で失敗している企業は多い。筆者はIT関連の開発に長年携わっており、「失敗学」の経験を基に『DX失敗学 なぜ成果を生まないのか』(日経BP)を上梓(じょうし)した。今回は、その方法で実際のプロジェクトが失敗した真因を探ってみる。題材とするのはセブン&アイ・ホールディングス(以下セブン&アイ)の「7pay(セブンペイ)」だ。 7payはセブン&アイが2019年7月1日に始めたスマートフォンによるバーコード決済のサービス。2万店舗を超えるセブンイレブン店舗で利用できるようにした。既存のセブン-イレブンアプリに支払い機能を付加したもので、アプリトップ画面から最少2タップで利用登録できるという簡単さを売りにした。当初の予定では、2019年10月以降に外部加盟店での利用も始め、2020年からはセブン&アイグループ各社のアプリとの連携を図っていく予定だったが約3カ

    セブン&アイの7payはなぜサービス終了に至ったか、「失敗学」の方法で分析した
  • キャベツ食い荒らすガをレーザーで撃墜、急所を狙い1発で仕留める

    国連が2022年7月に発表した「世界人口推計(World Population Prospects:WPP)2022」によれば、2050年の世界人口は約97億人(中間値)と、2021年よりも約18億人増加する見通しだ。国連糧農業機関(FAO)の推定によると、この増加と富裕化を続ける人口を養うために、2050年までに農業生産量を現在より60%も増やす必要があるという。かなり大きな数字である。 一方で、FAOによると、世界の用作物の最大40%が、植物病害虫の被害によって失われており、これによる農産物貿易の損失は、年間2200億ドル以上にのぼるという。農業生産量を大幅に増やすためにも病害虫被害の低減は喫緊の課題になっている。 これまで病害虫の駆除には、主に化学合成農薬が用いられてきたが、近年は病害虫が「薬剤抵抗性」を持つようになり、農薬が効かなくなってきたことが指摘されている。薬剤抵抗性とは

    キャベツ食い荒らすガをレーザーで撃墜、急所を狙い1発で仕留める
  • JAL「6600円セール」中止を招いたシステム障害の原因判明、負荷は想定の2.5倍

    航空(JAL)で2023年3月9日に発生したシステム障害の原因が判明した。大規模セールに伴いWebサイトへのアクセスが事前想定の2.5倍に達し、負荷分散装置(ロードバランサー)が処理性能の限界を超えて停止。予約系基幹システムに連なるオンプレミス(自社保有)のサーバーも過負荷に耐えられなかった。一連のトラブルでは、アクセス集中を見越したWebサイトの設計や大規模セールに向けた部門連携といった点にも課題があることが明らかになった。 同社は「JALスマイルキャンペーン」と題したセールの一環で、3月9日午前0時から国内線全路線を6600円で販売するセールを予定していた。セール開始直前の3月8日午後11時50分ごろから、同社Webサイトがアクセス集中によりつながりにくくなり、同時にセール以外の航空券の予約・発券なども手続きしづらくなった。この状態が9日昼すぎまで解消せず、JALは同日午後2時にセ

    JAL「6600円セール」中止を招いたシステム障害の原因判明、負荷は想定の2.5倍
  • スプラトゥーン3の通信に欠かせない、UDPとNAT越えを理解しよう

    2022年9月9日、「スプラトゥーン3」が発売されました。とても楽しみにしていたのですぐに買いました。発売から1月半ほどたってこの文章を書いていますが、いろいろなステージで様々なブキを使ってインクを塗り合い楽しくプレーしています。ちなみに今のウデマエはS+30になったところです。 この特集は、人気のスプラトゥーン3を通して、最新の通信技術の基を学んでしまおうというものです。前半の今回はスプラトゥーン3を含むオンラインゲームの通信技術を解説します。後半となる次回は、実際にスプラトゥーン3のパケットをキャプチャーして、それらの通信技術が実際にどのように使われるのかを見ていきます。 なお記載内容については、筆者や編集部独自の考察や推測によるものであり、任天堂の公式見解ではないことを明記しておきます。 オンラインゲームを実現する通信技術、UDPとは 一般的なコンピューターが通信を行う主な方法にT

    スプラトゥーン3の通信に欠かせない、UDPとNAT越えを理解しよう
  • 「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め

    ビジネスでデータサイエンスを活用するシーンとして、過去データを使って将来を予測するタイプの問題がある。商品販売数や店舗売上高など、折れ線グラフを使って表現するようなデータ(時系列データ)に基づいた時系列分析だ。過去の販売データに基づいて翌月の発注量を決めたり、3年後など中長期の計画を策定したりするのに使う。今回は、この時系列分析に活用しやすい3つのアルゴリズムを見ていこう。 Prophet

    「時系列分析」にはグーグルやフェイスブックが考案した最新手法がお薦め
  • ストレージの空き容量不足を一気に解消、気付きにくい不要なファイルを削除する

    パソコンの症状 ストレージの空きが少ない HDDやSSDは、空き領域が少なくなると速度は低下しやすい。 HDDは高速に回転する磁気ディスクに、データを読み書きする仕組み。磁気ディスクの外周と内周で、データの読み書き速度が異なり、内周よりも外周の方が高速にデータを読み書きできる。そのため、データが何も書き込まれていないHDDであれば、高速な外周から使う仕組みだが、空き領域が少なくなるにつれ、外周よりも低速な内周を使うしかなく速度が低下する。 SSDが搭載するフラッシュメモリーは、大きなブロック単位でしかデータの削除や上書きができない。エクスプローラー上でファイルを削除しても、実際にはフラッシュメモリー上に削除したデータがそのまま残り、使用不可の領域に切り替える。 長期間利用して使用不可の領域が増えると、SSDはデータを再配置し、ブロック単位で使用不可の領域を削除して空き領域を確保する。その動

    ストレージの空き容量不足を一気に解消、気付きにくい不要なファイルを削除する
  • ライブラリーに頼らずAIを自作、手を動かすことで理解が進む

    仕事や学業で人工知能AI)の知識が必要なことが増えてきた。AIを支える中心的な技術機械学習だ。特集では、AI歴史と全体像から基的な機械学習アルゴリズムのPython実装までを幅広く解説する。 機械学習のアルゴリズムは難しい…という印象をもたれがちですが、基的なアルゴリズムは比較的シンプルなので、それほど難しくありません。 そこでこのPart 3では、scikit-learnなどのAIライブラリを使わずに、Pythonで線形回帰とk平均法を実現する方法を説明します。これらのアルゴリズムの実装方法はいくつかありますが、ここでは基的な仕組みがよくわかるように、簡易的な方法で実装することにします。 線形回帰を実装してみよう 線形回帰の中でも最もシンプルな「単回帰」を実装してみます。 単回帰では、最小二乗法を使って、散布図の各データからの距離の2乗の総和を最小にする直線の式を求めます(

    ライブラリーに頼らずAIを自作、手を動かすことで理解が進む
  • 「今後はPaaSとSaaSが主戦場」、さくらインターネットがガバクラへ攻勢

    さくらインターネットは行政機関を対象としたクラウド事業の強化に向け、中央省庁や地方自治体に特化した営業や支援を手掛ける組織を2022年初めに新設する。同社クラウドサービスは2021年12月中に「政府情報システムのためのセキュリティ評価制度(ISMAP、イスマップ)」に登録されるとみられる。デジタル庁が整備し中央省庁や自治体が共同利用する「ガバメントクラウド」をはじめとした行政機関向けクラウド市場に攻勢をかける。 ガバクラは「国内企業がなくてよいのか」 さくらインターネットが2022年初めに新設する組織では、中央省庁や自治体への営業や運用支援のほか、関連する情報の収集や公共政策の調査などトータルで対応する。当初は5人程度の規模でスタートする。2022年度以降は、現在社内向けに展開しているクラウドサービス利用者向けの教育プログラムを行政機関などに対しても提供する。 同社ではこれまで、2018年

    「今後はPaaSとSaaSが主戦場」、さくらインターネットがガバクラへ攻勢
  • サカタのタネが「ラズパイ」でビニールハウスのIoT化に挑む理由

    「タネ屋」を自称する種苗大手のサカタのタネだが、タネの持つポテンシャルを最大限に発揮できる環境作りにも力を入れている。ワビットと共同開発し、2021年3月に格提供を始めた環境制御システムのソフトウエア「Arsprout Pi(アルスプラウト パイ)」もその一つ。農業の省力化を支援することで、持続可能な農業の確立への貢献を目指す。 Arsprout Piは、ビニールハウス内の温度や湿度、二酸化炭素濃度といった環境を自動的に制御する環境制御システムを、小型ボードPCの「Raspberry Pi」(ラズベリーパイ、通称ラズパイ)によって実現するソフトだ。 そもそも植物を栽培するうえでは、温度や湿度、日射量などハウス内の様々な環境が影響する。野菜の収量を最大化するには、温度などの環境要素をモニタリングし、最適な環境が保たれるようにハウスの設備をコントロールする必要がある。 例えば、温度が低い時に

    サカタのタネが「ラズパイ」でビニールハウスのIoT化に挑む理由
  • マニュアルを「我が事」と思わない経営者、ならばシステム化の前にあの会社に学べ

    経営者の中には「マニュアル」という言葉に違和感を覚え、自分の関わることではないと考える人が少なくない。その言葉には、社員を型にはめるイメージがあり、創造性を損なう印象があって、経営者として積極的に関わる気持ちが起きないのだろう。 しかし「マニュアルは使うものではなく、作るもの」だったら、どうだろうか。「無印良品」「MUJI」のブランドで世界的に有名な良品計画を一時の38億円の赤字から復活させ、世界に飛躍させた元社長・会長の松井忠三さんがそう語っていると知ったとき、衝撃を受けた。赤字からのV字回復の秘訣もマニュアル作りにあったというのも新鮮な驚きだった。 松井さんの著書『無印良品は、仕組みが9割』(KADOKAWA刊)によると、無印良品には店舗で使う「MUJIGRAM」というマニュアルがあり、部には「業務基準書」と呼ばれるマニュアルがあるそうだ。MUJIGRAMは2000ページあり、業務基

    マニュアルを「我が事」と思わない経営者、ならばシステム化の前にあの会社に学べ
  • 「AIをどう習得したのか教えて」と大募集し、技術者から集まった記事49本を紹介

    日経 xTECH内に人工知能AI)専門チャネル「ビジネスAI」を2019年10月に立ち上げたのを機に、知識共有サイト「Qiita」上でAI機械学習の記事を同年12月に募集したところ、49もの記事が集まった。投稿いただいた皆さん、ありがとうございました。 今回、ビジネスAIの編集担当として私が設定した「お題」は以下の3つ。各テーマについて日経 xTECHがQiitaアドベントカレンダーのスポンサーとなり、2019年12月1日~25日まで1日1ずつ記事を募集した。 AI道場「Kaggle」への道 機械学習をどう学んだか 機械学習ツールを掘り下げる この結果、機械学習を独習するお薦めの書籍やサービス、Kaggleなどの機械学習コンペに入門する方法など、AI機械学習に興味があるエンジニアにとって大いに参考になる記事が集まった。投稿者の属性についても「ゴリゴリの文系」や「おじさんSE」「中

    「AIをどう習得したのか教えて」と大募集し、技術者から集まった記事49本を紹介
  • 「脱VBA」の道筋がついに見えた、ExcelデータをPythonで抽出・加工する方法

    Excelデータをプログラムで扱うのなら、VBA(Visual Basic for Applications)を使うべし」。多くの人はそう思っているでしょう。もちろんVBAMicrosoft Officeのソフトを操るのにとても便利なプログラミング言語ですが、弱点もあります。 その1つが、Officeにしばられてしまうこと。業務に必要なデータ量がExcelや「Access」のカバーする範囲で収まらなくなったら、もう扱えません。 また互換性の問題から、Windows上で書かれたVBAのソースコードは基的に、macOSLinuxでは動かせません。VBAはプログラミング初心者にとって理解しやすい一方で、コードが冗長になりがちという側面もあります。 今からプログラミングを学んで業務を自動化したいなら、筆者はPythonをお薦めします。Pythonはシンプルで勉強しやすく、ライブラリーが豊富

    「脱VBA」の道筋がついに見えた、ExcelデータをPythonで抽出・加工する方法
  • 1