生成AI(人工知能)のRAG(検索拡張生成)の導入など企業で使われ始めたベクトルデータベース。その特徴は検索にある。ベクトルデータベースとはどのようなデータベースで、なぜ「意味」で検索できるのか。ベクトルデータベースの基本技術についてデータベースの専門家が解説する。
対話型AIサービス「ChatGPT」で使われている自然言語モデルの核になっている技術が「Transformer」だ。自然言語処理を例に、Transformerの仕組みを解説する。 ニューラルネットワークの基礎を理解したところで、ここからは自然言語処理(NLP)の基礎を解説することにしましょう。お待たせしました。いよいよChatGPTの仕組みに近づいてきました。 最初は、単語の意味をコンピュータに理解させる仕組みの説明をします。 自然言語処理は、文章の分割から ここに、ある文章があったとします。この文章の意味や、単語の意味をコンピュータに理解させるには、どのようにしたらよいでしょうか? そう、まずは前述の画像認識と同様ですね。文章を細かく分割して、どこが単語なのかをわかるようにするのです。 では、前処理として、入力された文章を単語に分割します(図7の(1))。次に、分割した単語を列挙します。
30以上のメディアが1つに『日経BP Insight』 「日経ビジネス電子版」「日経クロステック」など日経BPの専門メディアが発信する情報を一つのプラットフォームに集約した法人サービス。戦略策定に必要となる情報を、経営、技術、マーケティングなど分野を横断して閲覧、検索できます。 ただいま無料トライアル受付中
対話型AIサービス「ChatGPT」で使われている自然言語モデルの核になっている技術が「Transformer」だ。自然言語処理を例に、Transformerの仕組みを解説する。 実は、エンコーダーとデコーダーに用いられている「RNN」(Recurrent Neural Network)には、欠点があります。それは、長い文章が苦手だということです。 なぜ苦手かというと、以下の2つのポイントからそのように言えます。 (1)RNNでは、翻訳元文章全体の特徴を記憶できるサイズが固定されている。そのため、文章が長くなり単語の数が増えるほど、エンコーダーにおいて、文章の前の方で出現した単語の意味が薄まってしまう。 (2)RNNでは、単語を1つずつニューラルネットワークで処理する。そのため、単語の数が多くなればなるほど処理時間がかかってしまう。 ですので、RNNが持つこうした欠点を解消するための仕組み
対話型AIサービス「ChatGPT」で使われている自然言語モデルの核になっている技術が「Transformer」だ。自然言語処理を例に、Transformerの仕組みを解説する。 すっかり市民権を得た対話型AIサービス「ChatGPT」。ChatGPTで用いられている自然言語モデルが「GPT」(Generative Pre-trained Transformer)です。いわゆる「大規模言語モデル」(LLM:Large Language Model)の1つであり、本稿執筆時点(2023年12月)の最新バージョンは「GPT-4 Turbo」です。バージョンを追うごとに、精度向上などの進化を遂げてきました。 このGPTの核となるディープラーニング(深層学習)のモデルが「Transformer」です。前述のGPTの正式名称を見直すと、「T」はTransformerのTであることがわかります。このネ
大規模言語モデル(LLM)の弱点であるハルシネーション(幻覚)への対策として、最も期待されているのはRAG(Retrieval-Augmented Generation、検索拡張生成)だ。RAGに強みを持つカナダのスタートアップ、Cohere(コーヒア)のNick Frosst(ニック・フロスト)共同創業者は、RAGの高度化に「Rerank(再順位付け)」という技術が欠かせないと指摘する。 RAGはLLMに対して、事前学習した知識だけでなく外部の知識情報も参照させてテキストを生成させる手法だ。RAGを活用すれば、企業の内部情報に基づいた回答をLLMに生成させることも可能であるため、LLMがデタラメな回答を出力するハルシネーションへの対策として有望視されている。 LLMと検索を組み合わせるのが「RAG」 RAGは「検索拡張生成」というネーミングが示すとおり、LLMに参照させる知識情報の選択に
生成AI(人工知能)をシステム構築に活用する取り組みが進んできた。ソースコードの自動生成やテストの効率化、運用自動化などカバー範囲は広く、省力化や品質向上といった成果を上げている。今回は国産SIベンダーの取り組みを見よう。 前回の記事 IBMが生成AIでモダナイズ、COBOLを「JaBOL」ではなくネーティブJavaへ変換 富士通の子会社であるRidgelinez(リッジラインズ)は、生成AI「Azure Open AI」を社内で検証し、システム構築に関わるタスクへの適用について向き不向きをまとめた。Ridgelinez 執行役員 Partner Enabling&Integrationの伊藤清隆氏は「富士通グループの出島として、新たなテクノロジーをスピード感を持って検証し、顧客やグループへ還元する」と、同社の取り組み姿勢を説明する。 生成AIに向くタスクは何か コードの自動生成については
NTTデータは法人向けシステム構築に生成AI(人工知能)を本格導入する。生成AIを利用したシステム開発手法やツール群を社内で整備し、2024年度から国内外の開発部門に展開する。 NTTデータは業務システム開発に携わるエンジニアが国内と海外を合わせて約10万人在籍する。生成AIを使う開発手法を全エンジニアに習得させ、営業など関係する職種も含めて全社員19万5000人が利用できる体制を目指す。 既に実証では開発工数を7割削減できたなど大きな成果事例が出ているという。システム構築の生産性が大幅に向上すると、受注できる案件を増やせる一方で、案件の単価や顧客単価が下がりかねない矛盾も抱える。システム構築の受注金額は、必要な工数を積算して算定根拠にする「人月型」の契約が主流だからだ。NTTデータは「課題を整理して、成果報酬型など顧客と新たな契約形態も検討を進める」(担当する技術革新統括本部システム技術
米Facebook(フェイスブック、現Meta)などが発表したDiem計画(旧称Libra)は、ステーブルコイン規制の国際的な議論を活発化させた。計画は事実上撤回されたが、暗号資産市場では企業やスマートコントラクトによりDiemとは別種のステーブルコインが相当量発行され、パブリックブロックチェーン上の分散型金融での取引に用いられている。 ステーブルコインには、発行主体の種類、流通するネットワーク、価格安定の仕組みなどに様々なバリエーションがある。また、期待されるメリットやリスクも、バリエーションにより異なってくる。本稿では、代表的なステーブルコインの特徴や仕組みを解説し、そのメリットやリスクに関する国際的な議論を紹介するとともに、決済サービスにおける役割と課題について考察する[1]。 暗号資産取引で利用が進むステーブルコイン ステーブルコインの定義は多様だが、本稿では便宜上、「支払いや投資
DX(デジタルトランスフォーメーション)ではシステム開発のスピード向上が求められる。そこで注目されているのが、システム開発をサポートし効率化するAI(人工知能)のツールだ。プロジェクトの進行を支援したり、コーディングなどの開発工程やテスト工程を支援したりするAIが、開発の現場に続々と投入されている。 システム開発のスピードを上げるには、プロジェクトマネジャーやプロジェクト・マネジメント・オフィス(PMO)によるマネジメントが重要だ。プロジェクトマネジャーやPMOはプロジェクトごとの進捗を管理するだけでなく、人材を適切に配置したり、開発の障害になりそうなリスクを把握したりする。こうした業務をいかにきめ細かく行うかによって、システム開発のスピードが変わる。そこで始まったのが、プロジェクトマネジャーやPMOを支援するAIの活用だ。以下で、日立製作所とTISの取り組みを中心に紹介する。 チケットの
2021年から2022年にかけ、NFT(非代替性トークン)をめぐる話題が一般メディアで相次ぎ取り上げられている。2021年3月には米国人アーティストのデジタルアート作品にひもづいたNFTが競売にかけられ、約75億円(当時の為替換算)という高額で落札されて世間を驚かせた。 NFT(Non-Fungible Token)とは、ブロックチェーン上で扱われる、一意であり代替不可能なトークンを実現する技術である。 元来、Bitcoin(ビットコイン)をはじめとした従来の暗号資産トークンの実装では、 それぞれのトークンは同一のものだった。例えば、Bitcoinは1BTC(Bitcoinの通貨単位)であれば、どのトークンであっても1BTCという同一のものとみなされる。 一方NFTは、それぞれのトークンをそれぞれ別のものとして識別可能にする。 こうしたNFTの特性を活用することで、デジタルアートやゲームの
最近、Web3について解説したある入門書が「間違いだらけ」とネットで話題になっていた。他社の出版物なので書名を挙げるのは控えるが、検索すればすぐに見つかるはずだ。怪しい出版社の書籍ではなく、インターネット関連の書籍には定評のある技術系出版社が出版したものだ。 ネットでは、この書籍内でイーサリアムをOSと呼んでいたり、TCP/IPやHTTPといったプロトコルを米Googleや米Amazon.comが独占していると書いたりしている点が問題視されていた。これを見て私は当初、「よくある自転車置き場の議論ではないか」と思った。 自転車置き場の議論とは、知識が足りない人は本質的な議論ができず、自分が理解できる範囲のどうでもいい議論しかできないことを指す。この書籍に関していうと「Web3の仕組みを理解できないから、自分に理解できる範囲で揚げ足取りをしているだけではないか」と思ったのだ。 確かにイーサリア
実用化にはまだ遠い量子コンピューターをいかに強い産業に育て、メリットを享受するか。関連技術や人材、知見が世界中の企業や研究機関などに散在する中、これらを効果的に集合・マッチングさせて育てることが重要だ。2022年7月13、14日に東京で開催された「Q2B22 Tokyo」でも産官学の連携が大きなテーマになった。 量子コンピューターは現在、実用化を目指してハードウエアやソフトウエアの開発が進められている状況だが、それと並行して量子コンピューターの応用領域などを開拓する「社会実装」の動きが、各国政府や民間企業の集まりである産業化コンソーシアムの手によって始まっている。 2030年までに国内の量子技術利用者を1000万人に Q2B22 Tokyoの基調講演には、慶応義塾の伊藤公平塾長が登壇。伊藤塾長が策定に関与し、政府が2022年4月に発表した「量子未来社会ビジョン」について解説した。伊藤塾長は
マイクロサービスの活用はネット企業が中心だったが、今や一般企業にも広まりつつある。その原動力は、システムを俊敏に変更したい、保守性を高めたいというニーズの高まりだ。ふくおかフィナンシャルグループ傘下の「みんなの銀行」の事例でメリットを見よう。 「競合のフィンテック企業はクラウドに素早くシステムを構築し、プロダクトを磨き上げる。同じ土俵のクラウドに乗り、アジャイル(俊敏)に改善していく」。スマートフォン専業銀行、みんなの銀行の宮本昌明執行役員CIO(最高情報責任者)はGoogle Cloud上に一から構築した勘定系を含む銀行システムのコンセプトをこう話す。 システムの俊敏な変更を可能にするために選んだのが「マイクロサービスアーキテクチャー」だ。比較的小さなサービスをAPI(アプリケーション・プログラミング・インターフェース)経由などで疎結合に連携させて、一連の処理を実現する。従来に比べてサー
今から10年ほど前の2013年、筆者は六本木のダイニングバー「The Pink Cow」に入り浸っていた。多国籍の料理や酒を楽しむため……ではなく、そこに集う暗号資産(仮想通貨)Bitcoin(ビットコイン)ファンに話を聞くためだ。 銀行を介さず自らデジタル通貨を管理し、店で決済できるBitcoinの可能性に、誰もが興奮していた。ブロックチェーンを使えば、銀行や国家から独立したDecentralized(非中心、非中央集権)なマネーを運営できる。そんな魅力に引かれていた。 そして2022年。DeFi(分散型金融)やNFT(非代替性トークン)、DAO(分散型自律組織)などに代表される「Web 3.0(Web3)」のブームにおいても、やはり人々を引き付けたのは非中心という考え方だった。「Web 1.0やWeb 2.0は中央集権的だが、Web 3.0は非中心になる」といわれるようになった。 とは
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く