タグ

ブックマーク / atmarkit.itmedia.co.jp (28)

  • 「Pythonのデータ解析処理を最大16倍高速化するソフトウェア」をNECが無償で提供

    NEC2023年10月19日、Pythonによるデータ解析処理を高速化するソフトウェア「FireDucks」を無償提供すると発表した。これは新エネルギー・産業技術総合開発機構(NEDO)の支援を受けて開発したもので、NECは「データサイエンティストの業務時間を短縮するだけでなく、省電力化やCO2削減など、環境課題解決にも貢献する」としている。 import文を1行書き換えるだけで利用可能 FireDucksは、テーブルデータの分析で標準的なライブラリ「pandas」を使って作成されたプログラムを高速化する。高速化の度合いについてNECは「平均で約5倍、最大16倍高速化する」としている。高速化実現のポイントは「全コアの並列活用」と「処理の最小化」だ。 関連記事 無料で「実践的なデータサイエンス」を学べるオンライン演習を開講 総務省 総務省は、データサイエンスのオンライン講座「社会人のための

    「Pythonのデータ解析処理を最大16倍高速化するソフトウェア」をNECが無償で提供
    xiangze
    xiangze 2023/10/21
  • 「Stable Diffusion」で生成された画像とプロンプトがどのくらい似ているのかを確認してみよう

    「Stable Diffusion」で生成された画像とプロンプトがどのくらい似ているのかを確認してみよう:Stable Diffusion入門

    「Stable Diffusion」で生成された画像とプロンプトがどのくらい似ているのかを確認してみよう
    xiangze
    xiangze 2022/12/10
  • 「Gensim」による機械学習を使った自然言語分析の基本――「NLTK」「潜在的ディリクレ配分法(LDA)」「Word2vec」とは

    「Gensim」による機械学習を使った自然言語分析の基――「NLTK」「潜在的ディリクレ配分法(LDA)」「Word2vec」とは:Pythonで始める機械学習入門(9)(1/2 ページ) 最近流行の機械学習/Deep Learningを試してみたいという人のために、Pythonを使った機械学習について主要なライブラリ/ツールの使い方を中心に解説する連載。今回は機械学習を使った自然言語分析のライブラリ「Gensim」について解説します。 プログラミング言語「Python」は機械学習の分野で広く使われており、最近の機械学習/Deep Learningの流行により使う人が増えているかと思います。一方で、「機械学習に興味を持ったので自分でも試してみたいけど、どこから手を付けていいのか」という話もよく聞きます。連載「Pythonで始める機械学習入門」では、そのような人をターゲットに、Pytho

    「Gensim」による機械学習を使った自然言語分析の基本――「NLTK」「潜在的ディリクレ配分法(LDA)」「Word2vec」とは
  • 完全なLinuxがWindows 10上で稼働する? 「WSL 2」とは

    完全なLinuxWindows 10上で稼働する? 「WSL 2」とは:Windows 10 The Latest MicrosoftBuild 2019でWSLの強化版「WSL 2」を発表した。WSL 2は、現行のWSLと何が違うのかだろうか。Microsoftの開発者向けBlog「Devblog」で公開された情報から、WSL 2の概要を解説する。 連載目次 2019年5月に米国シアトルで開催されたMicrosoftの開発者向けイベント「Build 2019」で、現在のWindows Subsystem for Linux(WSL)を強化した「WSL 2」が発表された(Microsoft Devblog「Announcing WSL 2」「WSL 2 Post BUILD FAQ)。稿では、発表されたWSL 2のアーキテクチャを紹介しつつ、その特徴や現行のWSL(以下区別のためにW

    完全なLinuxがWindows 10上で稼働する? 「WSL 2」とは
  • リクルート事例で分かる数理最適化入門

    リクルートにおける数理最適化の応用事例を通じて、数理最適化とは何か、どのようにビジネスに応用できるのかを紹介する連載。最終回は趣向を変え、リクルートのデータサイエンティストが大阪大学の梅谷俊治教授に数理最適化を活用する上でのポイントを聞いた。

    リクルート事例で分かる数理最適化入門
    xiangze
    xiangze 2022/11/20
  • Python 3.10の新機能:「構造的パターンマッチ」とは

    ネストしたコンテキストマネジャーの簡潔な記述 分かりやすくなったエラーメッセージ デバッグやプロファイリング用に提供される行番号がより正確なものに 構造的パターンマッチ ファイル操作などでエンコーディングを明示しなかった際にEncodingWarning警告クラスを送出するようにオプトイン可能 「|」演算子を使用したユニオン型の指定 パラメーター仕様変数 型エイリアス ユーザー定義の型ガード 稿では、これらの新機能の中で新しく追加された構造的パターンマッチ(match~case文)について見ていくことにする。なお、構造的パターンマッチについてはPEP 634、PEP 635、PEP 636で詳しく述べられている。 match~case文の概要 match~case文の構文を以下に示す。なお、「match」と「case」はソフトキーワードであり、構造的パターンマッチを行う文脈でのみキーワー

    Python 3.10の新機能:「構造的パターンマッチ」とは
  • ついに完成「Windows Terminal」の機能と使い方まとめ

    Windows Terminalの画面 Windows Terminalは、コンソールアプリケーションのための新しいターミナルアプリ。cmd.exeやPowerShellなどの「シェル」を登録して、背景などをカスタマイズできる。この画面右側や下の領域(ペイン)に模様が見られるのは、背景がFluent Design用のGUI部品Acrylicで透過しているためだ。 Microsoftがオープンソースソフトウェアとして開発を進めている「Windows Terminal」の正式リリース版となるVer.1.0が配布された。Microsoftが開催している開発者向けのイベント「Microsoft Build 2020」に合わせて公開されたようだ。 原稿執筆時点で公開されているのは、v1.0.1401.0で、日時間の2020年5月20日に公開された。既にMicrosoft Storeからダウンロード

    ついに完成「Windows Terminal」の機能と使い方まとめ
  • Microsoft365Rが公開、「365」をR言語から操作できる

    Microsoftは2021年2月9日(米国時間)、R言語を使ってクラウドサービススイート「Microsoft 365」を操作するためのオープンソースパッケージ「Microsoft365R」を発表した。Rは、統計解析やその可視化などに役立つオープンソースのプログラミング言語とランタイム環境だ。 Microsoft365Rは「AzureGraph」パッケージで提供されるMicrosoft Graph APIを拡張し、「Microsoft SharePoint」と「Microsoft OneDrive」に対する軽量で強力なインタフェースを提供する。今後は「Microsoft Teams」と「Microsoft Outlook」もサポートする見込みだ。Teamsチャネルへのポストや、Outlookによる電子メール送信が可能になるという。 Microsoft365Rは、CRAN(The Compr

    Microsoft365Rが公開、「365」をR言語から操作できる
    xiangze
    xiangze 2021/02/17
  • マルチバックエンドKerasの終焉、tf.kerasに一本化

    マルチバックエンドKerasの終焉、tf.kerasに一化:TensorFlow 2+Keras(tf.keras)入門 Kerasの公式サイト「keras.io」が完全リニューアル。Kerasのインストール方法やkerasモジュールのインポート方法に関する説明が変わった。「tf.kerasに一化」とはどういうことなのかを解説する。

    マルチバックエンドKerasの終焉、tf.kerasに一本化
  • TensorFlow入門

    TensorFlowを使ってディープラーニングの基礎が体験できる連載。TensorFlowの概要から、インストール方法、CNN/RNNモデルの実装体験、TensorBoardの使い方までを解説する。 全8回【完結】 ( 3時間30分) 必須条件: 機械学習の基礎知識が必要です(※「深層学習 入門」参照)。 自前のPCか、クラウド環境を使う必要があります。GPUがなくてもOKです(TensorFlowのCPU版/GPU版、両対応です)。GPUを使う場合、事前に環境を構築してください(※「環境構築 入門」参照)。 WindowsmacOS/Ubuntuに対応しています。 高校レベルの数学の知識が必要ですが、理解できなくても体験可能。 こんな方にお勧め: ディープラーニングを体験してみたい方 TensorFlowを体験し、その基礎知識を身に付けたい方 CNN(畳み込みニューラルネットワーク)を

    TensorFlow入門
  • @IT:Javaパフォーマンスチューニング 第3回

    記事は、HP-UX Developer Edgeに掲載された記事を株式会社アットマーク・アイティおよび記事の筆者が独自の判断のもとに加筆・修正したものです。 今回は、Javaにおけるヒープ・メモリ管理の詳細を説明します。JVMのヒープ・メモリの中で、新しいオブジェクトと古いオブジェクトがどのように配置されるかを理解することで、ヒープ・メモリが有効に利用されているか否かを判断することができます。また、JVMが出力するガベージ・コレクションのログを解析し、オプションの指定によってヒープ・メモリのサイズを適切にチューニングする方法を紹介します。 Java ヒープ・メモリの構造 Javaにおけるガベージ・コレクションのメカニズムを理解するには、まずヒープ・メモリの構造を知っておく必要があります。 図1は、JVM におけるヒープ・メモリの構造を示したものです。この図が示すように、ヒープ・メモリの

    @IT:Javaパフォーマンスチューニング 第3回
  • 第1回 OpenCVとは? 最新3.0の新機能概要とモジュール構成

    ご注意:記事は、@IT/Deep Insider編集部(デジタルアドバンテージ社)が「www.buildinsider.net」というサイトから、内容を改変することなく、そのまま「@IT」へと転載したものです。このため用字用語の統一ルールなどは@ITのそれとは一致しません。あらかじめご了承ください。 1. OpenCV 1.1 OpenCVとは OpenCV(正式名称: Open Source Computer Vision Library)は、オープンソースのコンピューター・ビジョン・ライブラリです。コンピューターで画像や動画を処理するのに必要な、さまざま機能が実装されており、BSDライセンスで配布されていることから学術用途だけでなく商用目的でも利用できます。加えて、マルチプラットフォーム対応されているため、幅広い場面で利用されていることが特徴です。 OpenCVは、Intelで開発さ

    第1回 OpenCVとは? 最新3.0の新機能概要とモジュール構成
  • IoTデータの「出会い系サイト」? EverySenseが目指すもの

    2015年8月下旬、クラウドファンディングサイト「Makuake」で、小型環境センサーのファンディングプロジェクトが始まった。米国の著名工業デザイン企業にデザインを依頼したといい、温度、気圧、湿度、照度、紫外線、加速度センサーなどが機能ブロックとして用意されていて、無線LANでデータをアップロードできる。別途、新たなセンサーデバイスをつくるための、開発ボードもある。 だが、このプロジェクトを立ち上げた企業、EverySenseの最終的な目的は、センサーデバイスの販売ではない。IoT(Internet of Things)データのマーケットプレイスだという。同社は2015年秋に、サービスを提供開始する予定だ。 EverySense CEOの真野浩氏は、同社がやろうとしているのは「分かりやすく言えば出会い系サイト」だと話す。誤解されるきらいがなくはない表現だが、自らはデータを仕入れて売るのでは

    IoTデータの「出会い系サイト」? EverySenseが目指すもの
    xiangze
    xiangze 2015/09/27
  • ちょっと変わったLisp入門 - @IT

    Lispの一種であるScheme。いくつかある処理系の中でも気軽にスクリプトを書けるGaucheでLispの世界を体験してみよう(編集部) 「Gaucheでメタプログラミング」と題して、これからGaucheを使ったプログラミングの連載を書かせていただきます吉田裕美です。よろしくお願いいたします。 Gaucheとは 今回の連載で取り上げるGaucheはハワイ在住の日ハッカー、川合史朗さんが作った、Lispの一種であるSchemeのオープンソース処理系です。 Gaucheの特徴は、PerlRubyのように気軽に使える軽い処理系だということです。Perl同様に正規表現や文字列操作が行え、ちょっとしたツールの作成にも使えます。しかし、非常に強力なCommon Lisp風オブジェクトシステムを持ち、Lispならではのマクロに加え、Webやグラフィックスなどの豊富なライブラリも持っているので実用

    ちょっと変わったLisp入門 - @IT
  • .NET開発における非同期処理の基礎と歴史

    連載:C# 5.0&VB 11.0新機能「async/await非同期メソッド」入門 第1回 .NET開発における非同期処理の基礎と歴史 鈴木 孝明 2012/08/31 ■.NET Frameworkにおける非同期処理実装技術歴史 それでは、.NET Frameworkがこれまでに提供してきた非同期処理実装技術の進化の歩みについて、復習も兼ねながら見ていこう。大まかにいうとFigure 3のようになる。

  • C#/Scala/Python/Ruby/F#でデータ処理はどう違うのか?

    ■概要 以前、C#でのデータ処理について解説した。今回は、同様のデータ処理を、C#以外のプログラミング言語ではどうしているのか、(C#も含めて)以下の5つの言語を比較しながら説明していく。 C# Scala Python Ruby F# 結果としてできることは似ているのだが、その内部的な実装方法は言語ごとにさまざまである。 ■データ処理のおさらい 概念的には、「データ処理」というのは、Figure 1に典型例を示すように、条件選択や変換など、小さな処理単位に分けて、それをつないでいく形を取る。

    C#/Scala/Python/Ruby/F#でデータ処理はどう違うのか?
  • 実践! Rで学ぶ統計解析の基礎 - @IT

    Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!

  • 大相撲のアノーマリー (1)

    大相撲の勝敗結果を分析すると、ちょっとした不自然さが見つかります。今回は、ベストセラーとなった書籍「ヤバい経済学」でも紹介されていた論文を元ネタにネット上のデータを利用して解析を試みます。 今回の前口上 諸事情により2カ月の間連載を空けてしまいました。申し訳ございませんでした。実は10月、11月に用意した時事ネタがいろいろあるのですが、こちらは少しタイミングを逸して旬が過ぎたので、もう少し寝かせてから提示したいと思います。また、何人かの読者の方から励ましのお言葉を戴きまして大変感謝しています。当に励みになります。ありがとうございました。もしもこの連載で取り上げてほしい問題やネタ、改善点などがありましたら、遠慮なく以下のメールアドレスにリクエストやご意見をお送りください。 knife@bakfoo.com 今回から数回は、大相撲の統計データをネタにして、「公になっているが混乱しているデータ

    大相撲のアノーマリー (1)
  • Xcode/Interface BuilderでUI設計+イベント処理

    連載第1回の「いまさら聞けないiPhone/iPadアプリの作り方の基礎」では、iPhone/iPadアプリ開発における環境構築や開発ツールであるXcodeについて簡単に触れました。今回から、いよいよアプリの具体的な作成方法について説明していきます。 さて話が変わりますが、皆さんはお腹のぜい肉が気になったりしていないでしょうか? 今回作成するサンプルアプリは、下記のような「BMI(肥満度)計算」アプリです。1画面だけのシンプルなアプリですが、この制作を通してiPhone/iPadアプリの画面の作り方や、画面をタッチしたときのイベント処理の基について学んでいきましょう。

    Xcode/Interface BuilderでUI設計+イベント処理
  • 各ディレクトリの役割を知ろう(ルートディレクトリ編)(1/2)

    ディレクトリを知ればLinuxが見えてくる Windowsを使っている人であれば、ディレクトリごとに役割や約束事があることはご存じでしょう。 アプリケーションをインストールする場合は、通常\Program Filesフォルダ下にサブフォルダを作ってファイルを保存します。Windows 2000であれば各ユーザー固有の設定は\Documents and Settingsフォルダ下にあり、\WINNTにはOS体のファイルが集められています。各ユーザーが作成したデータの保存先は、ユーザー用の[マイ ドキュメント]であり、ちょっと詳しい人ならこのアイコンの実体が\Documents and Settings\ユーザー名\My Documentsであること、好きなフォルダにマッピングし直せることも知っているでしょう。 しかし、WindowsからLinuxに移行した途端、いままでのセオリーはまったく

    各ディレクトリの役割を知ろう(ルートディレクトリ編)(1/2)