コロナ時代におけるデータサイエンティストの育成と、日常業務におけるメリット/デメリット:データサイエンスのイベントレポート コロナ禍で日常業務や大学講義がオンライン&リモート化した人は多いだろう。そのメリットとデメリットは何か? デメリットを解消するために、どのような工夫をするとよいのか? データサイエンティスト人材の育成はコロナ禍でどういう状況なのか? データサイエンティスト協会主催Webセミナーにおけるパネルディスカッションの一部内容を紹介する。
Microsoftのセキュリティインシデントレスポンスチームは2020年10月7日(米国時間)、クラウドセキュリティに関するベストプラクティスを紹介した。 Microsoftの検知/対応チーム(DART)とカスタマーサービスサポート(CSS)のセキュリティチームはユーザーのインシデントを調査する際、インターネットから攻撃を受けた仮想マシン(VM)を目にすることが多いのだという。 クラウドセキュリティの責任共有モデルでは、クラウドプロバイダーとユーザーがどのレイヤーに責任を持つのか理解しておく必要がある。 今回のベストプラクティスでは、クラウドプロバイダーと顧客の責任共有モデルが適用される対象の1つとしてVMを取り上げ、「Microsoft Azure」でVMを含むワークロードを保護するための7つの手法を紹介した。 (1)Azure DefenderのAzureセキュリティスコアをガイドとし
オンラインイベント「GTC 2020」の基調講演からNVIDIAの今後の方向性を探ってみる。以前のPCゲーム向けのグラフィックスカードベンダーではない、データセンター向けのソリューションや自動運転などのさまざまな方向性が示されている。 2020年10月5日から9日まで、NVIDIAが「GTC(GPU Technology Conference) 2020」という催し物をオンラインでやっていた(GTC 2020の基調講演は、「GTC 2020 基調講演」で無料視聴可能。日本語字幕あり)。NVIDIAが「GTC 2020をやっていた」というのは少々語弊があって、「リアルタイム」の参加は終わっているが、参加費を払って(99ドル)登録してあれば、2020年10月中は後追いで視聴できるようになっている。1000以上のセッションがあるということなので、多分、一人で全てを視聴することは不可能だろう。 筆
WSL 2がWindows 10バージョン1903と同1909でも利用可能に 「Windows 10 May 2020 Update」(バージョン2004)で提供開始された「WSL 2」が、「Windows 10 May 2019 Update」(バージョン1903)と同「November 2019 Update」(バージョン1909)でも利用可能になった。 WSLでのGUIアプリサポートの最新情報 MicrosoftはWSLでGUIアプリケーションをサポートする作業を進めている。初期プレビュー版の社内リリースが近づいており、「Windows Insider Program」で数カ月以内に、プレビューリリースを提供開始する見通しだ。 次の動画は、社内ビルドを使ってWSLでGUIアプリケーションを動かした様子だ。WSLが多様なアプリケーションをサポートする予定であることが分かる。Linux環
セキュリティ製品/サービスを「Microsoft Defender」ブランドに統一:Microsoft Azure最新機能フォローアップ(122) Microsoftは2020年9月に開催した仮想カンファレンス「Ignite 2020」で、Microsoft AzureとMicrosoft 365(旧称、Office 365)の“Threat Protection”や“Advanced Threat Protection(ATP)”として知られる一連のサービスの名称変更を発表しました。以前の名称から大きく変更されることになるため、今後、順次行われることになるであろう管理UIへの反映や、オンラインまたはオフラインのドキュメントの参照の際には注意してください。 Microsoft Azure最新機能フォローアップ 「Threat Protection」の大幅なサービス名変更を実施 Micros
元エンジニア、ローコードで新サービスを次々と開発 必要最低限のコーディングで素早く成果物を生み出すことができる「ローコード開発」。エンジニア不足が深刻化し、ビジネス環境も激しく変化する中、限られたリソースでスピード感を持った開発を推進できるとあって現場での活用が広がり始めている。 ローコード開発の効果を知るために今回紹介するのが、新型コロナウイルス感染症(COVID-19)が拡大する兆しを見せる中で、急増する市民のニーズをいち早く察知し、情報公開を中心とした新しいサービスを次々と内製、リリースした神戸市だ。 2020年4月7日に緊急事態宣言が発令されると、5月20日には「新型コロナの健康相談チャットボット」をリリース。WebサイトにPCやスマートフォンからアクセスすると「感染者と濃厚接触がありますか?」「渡航歴はありますか?」といった定型の質問が投げ掛けられるので、それに「はい」「いいえ」
ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナー アナリストらのブログサイト「Gartner Blog Network」から、@IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。 「サーバレスコンピューティング」は、誤解されやすい用語だ。この技術は、インフラのプロビジョニングや管理を不要にするが、決してサーバの必要性をなくすわけではない。市場に、「サーバレスコンピューティングとは何か」や、企業でサーバレスコンピューティングを導入するメリットについて、いまだに混乱があるのは驚きではない。 サーバレスコンピューティングは、適切なユースケースに適用すれば、アジリティ、弾力性、費用対効果を向上させる次世代技術だ。このため、クラウドコンピュ
Kubernetes採用はもう当たり前、American Expressは次の段階に進みつつある:100%OSSでクラウドネイティブへ(1/2 ページ) 金融大手のAmerican Expressは、コンテナ環境上で多数のアプリケーションが稼働するだけでは満足していない。社内の開発・運用体制をさらに変えていくために新たなプロジェクトを進めつつある。このプロジェクトでは何をやろうとしているのか。 金融機関や通信会社といった規制業種における、Kubernetesの採用が進んでいる。American Expressは現在、Kubernetes環境で数百のアプリケーションを稼働しているといい、コンテナの採用に関しては既に最初のハードルを越えている。 同社は今、次の段階に向け、新たなプロジェクトを進行中だ。現在のコンテナ環境をさらに「クラウドネイティブ化」することを目指している。この取り組みのため、
用語「モラベックのパラドックス」について説明。機械学習モデルを含むAI(人工知能)やロボット工学において、大人が行うような高度な知性に基づく推論よりも、1歳児が行うような本能に基づく運動スキルや知覚を身に付ける方がはるかに難しい、という定説を示す。 連載目次 用語解説 モラベックのパラドックス(Moravec's paradox)とは、機械学習モデルを含むAI(人工知能)やロボット工学において、例えば「明日の販売数量を予測する」「将棋を指す」といった大人が行うような高度な知性に基づく推論よりも、例えば「おもちゃをつかむ」「興味深いものに注意を払う」といった1歳児が行うような本能に基づく運動スキルや知覚を身に付ける方がはるかに計算資源を要する(つまり難しい)、というパラドックス(逆説)のこと(図1)。例えば人間にとって、高度な大学数学を計算するよりも、近所の公園をランニングする方がはるかに簡
2020年6月15日、一般社団法人データサイエンティスト協会(以下、データサイエンティスト協会)は、データサイエンス初学者が構造化データの集計・加工を効率的に学べる演習環境「データサイエンス100本ノック(構造化データ加工編)」を、「GitHub」で無償公開した。公開直後からデータサイエンスに関わる技術者の間で大きな話題を集め、その内容や利用法を紹介するコンテンツがネット上で数多く公開された。 このデータサイエンス100本ノックの「生みの親」ともいえるのが、データ解析設計事務所の森谷和弘氏だ。同氏はフリーランスのデータサイエンティストとして活動する傍ら、データアナリティクスラボの取締役CTO(最高技術責任者)として、データサイエンティスト人材を一から育成して企業に派遣する事業に携わっている。 本稿では、データサイエンス100本ノックのこだわったポイントや活用するためのコツ、今後の展望につい
Google Cloudは2020年9月1日(米国時間)、機械学習モデルを利用したアプリケーション開発の苦痛を減らし、プロトタイプ開発を迅速に進める方法を公式ブログで紹介した。 概要は以下の通り。 トレーニング済みモデルを使用する 機械学習プロジェクトで最も時間がかかり、苦痛な部分の一つは、機械学習アルゴリズムに学習させるラベル付きデータを収集することだ。だが、多くの一般的なユースケースでは、機械学習モデルを一から構築する必要はなくなっている。誰かが構築、調整、メンテナンスした学習済みの機械学習モデルを利用できるためだ。Google Cloudが提供する「Cloud AI API」はその一例だ。Cloud AI APIを使えば、次のような作業に機械学習を適用できる。 音声および動画ファイルのテキスト変換 ドキュメント内のテキストの理解 構造化ドキュメント(フォームや請求書のような)の解析
今回の目的 前回までに全結合型のオートエンコーダー、CNNを利用した畳み込みオートエンコーダー、それから学習を高速に行えるようにGPUを使用する方法などを見てきました。 ところで、オートエンコーダーが持つエンコーダーで元画像を縮小(次元削減)して、それをデコーダーで復元することはどんなことで役に立つのでしょうか。一般には異常検知やノイズ削減などがオートエンコーダーの用途として挙げられています。そこで、今回は、MNISTの手書き文字を例に異常検知とはどんなものなのか、その本当に表面的な部分だけを見てみることにします。 「異常検知」とは、数多くのデータの中から、他のデータとは異なる特徴を持つデータを見つけ出すことです。例えば、工場で生産されたネジを考えてみましょう。製造されたネジの多くは何の問題もなく、製品として出荷できるものです。しかし、その中のごく一部には、傷があったり、先端が曲がっていた
連載目次 データセット解説 ImageNetは、1400万枚以上もあるほど大規模な、「カラー写真」の教師ラベル付き画像データベースである。その教師ラベルは、WordNet階層*1に基づいて付与されている。スタンフォード大学のフェイフェイ・リ(Fei-Fei Li)氏を中心とした研究グループが管理しており、世界中の研究者や教育/学びに役立ててもらうためのリソースとして公開されている。 *1 WordNetとは、英語の語彙(ごい)データベースであり、synsetと呼ばれる「同義語(synonyms)セット」がツリー階層構造でグループを形成しながら定義されているのが特徴である。ImageNetでは2万以上のsynsetが採用されている。 ImageNetの歴史的な重要性 ImageNetは、歴史的に非常に有名である。2012年に開催されたImageNetの大規模画像認識コンペ「ILSVRC(Im
しかし、この畳み込みオートエンコーダーの学習には約50分かかりました。同じ100エポックの全結合型オートエンコーダーでは学習には1時間半がかかり、その復元画像もたいしたものではなかったことを考えると、これは大きな進歩ではあります。が、もう少し高速にはならないものでしょうか。 そこで出てくるのが、CPUのような複雑な処理は苦手かもしれませんが、単純な数値計算を高速に行ってくれるGPUです。ニューラルネットワークでは、単純な計算が大量に実行されることから、GPUを使うことで、処理の高速化が見込めます。 そこで今回は、PyTorchでGoogle Colab環境上のGPUを使い、畳み込みオートエンコーダーの学習を高速化してみたいと思います。その過程で、Google ColabでGPUを使うための設定、PyTorchでGPUを使うためのホントにホントの基礎部分について学んでいきましょう。なお、今回
本連載では、2019年7月の「Cloud Native Days Tokyo 2019」でCo-chairを務めた青山真也氏と草間一人氏に、クラウドネイティブに関してじっくり語ってもらった対談の内容を、4回に分けて掲載している。前回の「クラウドネイティブは、どう誤解されているか」に続き、今回は第2回として、「CNCFのCloud Native Trail Mapを、クラウドネイティブ活動の指針としてどう考えるか」をテーマとした部分をお届けする。 Cloud Native Trail Mapのアプローチはいいが…… ――クラウドネイティブを目指すと決めた人たちが次に考えるのは、「ツール、製品、技術として何を採用するか」ということだと思います。これを考えるための材料として、Cloud Native Computing Foundation(CNCF)の「Cloud Native Trail M
日本の政府系のオープンデータで一番有名なのが「e-Stat」である。統計学やデータサイエンスに携わるもの/学ぶものであれば、名前は聞いたことがあるだろう。かつては各省庁がバラバラに管理&公開していた公的データを、一カ所に集めて誰でも簡単に利用できるようにしたサイトである(2008年から運用が開始され、2018年にリニューアルされた)。 統計分野は多岐にわたり、「国土・気象」「人口・世帯」「労働・賃金」「農林水産業」「鉱工業」「商業・サービス業」「企業・家計・経済」「住宅・土地・建設」「エネルギー・水」「運輸・観光」「情報通信・科学技術」「教育・文化・スポーツ・生活」「行財政」「司法・安全・環境」「社会保障・衛生」「国際」「その他」という17分野が提供されている。データセットは、条件指定によるフィルタリングやグラフ化が行える。例えば人口ピラミッドのグラフも簡単に作成できる。 また、もちろん無
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く