米Databricksは、分散処理フレームワーク「Apache Spark」を自然言語である英語で操作可能にする「English SDK for Apache Spark」を6月29日(現地時間)に公開した。Apache SparkとEnglish SDK for Apache SparkはどちらもApache 2.0ライセンスで公開しているオープンソース・ソフトウェア。 English SDK for Apache Sparkは、Pythonプログラムの中に英語で記述した指示を組み込むことで、Apache Sparkを操作可能にする開発者キット。大きく分けて、データ収集、データフレームの操作、ユーザー定義関数の作成、キャッシングの4種類の機能を提供する。どの機能においても生成AIの力を利用している。 データ収集機能は、Webから必要なデータを検索して、Apache Sparkのデータフレ