タグ

データに関するfm315のブックマーク (37)

  • 「100均」セリアは女性管理職が50%超 社長肝いりのデータ化がもたらした働きやすさとは? #令和に働く(Yahoo!ニュース オリジナル 特集)

    100円ショップ大手の「セリア」は、競合他社が300円、500円と商品価格のラインアップを広げるなか、いまも全品100円を貫く。セリアという名称になって20年余り。直営店とFC店の合計が昨年2000店を突破し、業界では第2位の座にある。同社は女性管理職の比率が51.5%と高く、女性社員の登用も顕著だ。女性からの人気が高いといわれるセリアの経営戦略について、代表取締役社長の河合映治氏に尋ねた。(文・写真:ジャーナリスト・古川雅子/Yahoo!ニュース オリジナル 特集編集部) 女性に人気 でも女性向け品ぞろえは「意識せず」白基調の明るい店内には、文具やキッチン用品、収納用品、スマホ関連用品のほか、器や女性向けメイク用品など多彩な商品が並ぶ。そのすべてが100円だ。売上高で業界2位のシェアをもつ100円ショップ「セリア」の特徴は、女性からの支持が高いことが挙げられる。昨年3月公表のLINE

    「100均」セリアは女性管理職が50%超 社長肝いりのデータ化がもたらした働きやすさとは? #令和に働く(Yahoo!ニュース オリジナル 特集)
  • 中央集権体制からDataOpsへの転換 / centralized-to-dataops-transformation

    【イベントページ】 https://chatwork.connpass.com/event/311948/ 我が社が考える最強のデータ基盤'24最新版 Chatworkは約2年前よりデータ基盤の刷新プロジェクトを推進してきました。 スモールスタートで始まったプロジェクトは、今や拡大期を迎えています。 このイベントでは、そのプロセスや直面した壁などを大公開! さらにゲストには大西氏、CARTA HOLDINGSのPei氏を迎え、各社の考え方やこれからのアーキテクチャについて激論を交わします!

    中央集権体制からDataOpsへの転換 / centralized-to-dataops-transformation
  • 「そもそも開発生産性ってなんだ?」 “勘”ではなく“データ”で判断するために可視化すべき指標

    「開発生産性」をテーマに発表したのは弥生株式会社CTOの佐々木氏。組織運営における開発生産性向上への着目背景や可視化の意義など、よりよい組織づくりをするための取り組みについて語りました。全2回。 登壇者の自己紹介 佐々木淳志氏:弥生株式会社の佐々木です。私からは、「より早く良いものを多くのお客様に使ってもらうために」というタイトルでお話をいたします。 最初に軽く自己紹介を失礼します。弥生株式会社でCTOをやっている佐々木と申します。弥生での業務ですが、けっこう全体的にフワッとしたことをやっているというイメージがいいかもしれません(笑)。 全社レベルのアーキテクチャ検討とか採用とか教育とかセキュリティ推進とか、そんな感じのことをやっていて、個別のプロダクトというわけではないのですが、なんとなく全体を見ている感じになっています。 趣味などいろいろ書いてあるのですが、『FF14』をやっていたり、

    「そもそも開発生産性ってなんだ?」 “勘”ではなく“データ”で判断するために可視化すべき指標
  • Goでの Mysql接続から構造体へのデータ割り当てまで - Qiita

    Mysql接続からデータを引っ張ってくるまで 今回は、ローカルにあらかじめ用意しておいた、IDと名前があるだけの簡単なuserデータベースにアクセスしてみます。 データベース名:gosample テーブル名:users package main import ( "database/sql" //ここでパッケージをimport "fmt" "log" _ "github.com/go-sql-driver/mysql" //コード内で直接参照するわけではないが、依存関係のあるパッケージには最初にアンダースコア_をつける ) //引っ張ってきたデータを割り当てるための構造体を用意 type Person struct { ID int Name string } func main() { //mysqlへ接続。ドライバ名(mysql)と、ユーザー名・データソース(ここではgosample)

    Goでの Mysql接続から構造体へのデータ割り当てまで - Qiita
  • パフォーマンスチューニング9つの技 ~「書き」について~|PostgreSQLインサイド

    今回の記事は、パフォーマンスチューニングの観点と仕組みを理解することに主眼を置いています。具体的な対処方法についてはシステムによって異なるため、マニュアルの確認や、各種チューニングサービスのご利用をご検討ください。なお、この記事で対象にしているPostgreSQLのバージョンは9.5以降です。 記事の構成 記事「パフォーマンスチューニング9つの技」は以下4つの記事から構成されています。他の記事も併せてご覧ください。 パフォーマンスチューニング9つの技 ~はじめに~ パフォーマンスチューニング9つの技 ~「書き」について~(記事) パフォーマンスチューニング9つの技 ~「探し」について~ パフォーマンスチューニング9つの技 ~「基盤」について~ 1. パフォーマンスチューニングの「書き」とは 一般的にデータベースは、大量データを扱い、大量の問い合わせや更新を高速に処理し、さらに障害発生

    パフォーマンスチューニング9つの技 ~「書き」について~|PostgreSQLインサイド
  • MySQLで階層構造を扱うための再帰的なクエリの実装方法と実用例

    1.はじめに RDBでの階層構造の関係を持つデータを扱う上で、 効率的なデータの持ち方や抽出方法について検証を行っています。 結論から先に 階層構造を扱う方法として下記の種類があります。 隣接リスト 経路列挙 入れ子集合 閉包テーブル 再帰クエリ(WITH RECURSIVE)を使うと階層データを扱う上でのパフォーマンスが得られます。 検索性、更新量、データ量など加味すると隣接リストで再帰クエリを用いるのがよさそう。 2.階層構造を持つデータの概要 階層構造を持つデータとは 複数の要素(データ)が親子関係で結びついている構造を持つデータ 1つの要素が複数の要素の親になることができ、 また、1つの要素が複数の子要素を持つこともあります。 ある要素を親として、細分化された子要素であったり、 類似する要素を抽象化したものを親要素とするようなデータ。 階層構造を持つデータの例 組織における事業部、

    MySQLで階層構造を扱うための再帰的なクエリの実装方法と実用例
  • データ活用が事業貢献していることを示すための取り組み

    2023年2月16日開催、サイバーエージェント メディア事業部主催のデータ活用に関する勉強会「メディアサービスにおけるデータ・AIの活用事例 #2」登壇資料です。 https://cyberagent.connpass.com/event/270224/

    データ活用が事業貢献していることを示すための取り組み
  • 2023年版:実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト(初級6冊+中級8冊+テーマ別15冊) - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by wal_172619 from Pixabay) 去年で恒例の推薦書籍リストの更新は一旦終了したつもりだったんですが、記事を公開して以降に「これは新たにリスト入りさせないわけにはいかない!」という書籍が幾つも現れる事態になりましたので、前言撤回して今年も推薦書籍リストを公開しようと思います。 初級向け6冊 実務総論 データサイエンス総論 R・Pythonによるデータ分析プログラミング 統計学 機械学習 中級向け8冊 統計学 機械学習 テーマ別15冊 回帰モデル PRML 機械学習の実践 Deep Learning / NN 統計的因果推論 ベイズ統計学 時系列分析 グラフ・ネットワーク分析 データ基盤 コメントや補足説明など 完全なる余談 初級向け6冊 今回は新たに加わったテキストがあります。 実務総論 AIデータ分析プロジェクトのすべて[ビジネス力×技術力=価値創出

    2023年版:実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト(初級6冊+中級8冊+テーマ別15冊) - 渋谷駅前で働くデータサイエンティストのブログ
  • ごちきか

    ごちきか# NTTコミュニケーションズ イノベーションセンターでは、社会・産業DXのためのSmart World の一貫として、時系列データ分析手法の研究開発、お客さまのデータ分析支援や社内データ分析人材育成を行っています。 ごちきか(gochikika) は、これら研究開発成果やデータ分析人材育成コンテンツをまとめたナレッジベースです。大別してメインコンテンツは以下の通りです。 分析: 主に製造業の時系列データを対象として、前処理からモデリングまで一連の基的な分析手法をPythonコード付きで解説しています。 特集記事: 比較的新しめであったり難易度の高い手法や、私たちの取り組みを知ってもらうための学会発表資料が掲載されます。また一部未分類なコンテンツが格納されています。 私たちの研究開発成果は、同じくイノベーションセンターで開発しているノーコードAI開発ツールNode-AI に搭載さ

    ごちきか
  • 講義資料 – 九州大学 数理・データサイエンス教育研究センター

    ページで公開している講義スライドはすべてCC-BYです(〈参考資料〉は除く). 編集可能なPowerPointファイル(無償, CC-BY)が必要な場合や,今後改訂したときに連絡が必要な場合は,下記までご連絡ください(PPTは100以上の大学等へ提供済みです. お気軽にどうぞ). 連絡先:mds-lecture-slides@human.ait.kyushu-u.ac.jp (内田(センター長)・福冨(センター秘書)) スライド内容について間違いがあった場合も,上記連絡先にご連絡いただけると,大変に助かります.(修正の上,改訂版を随時アップロードいたします.) データサイエンス概論Ⅰ&Ⅱ(夏休み中の3日間での集中講義を予定.2023年度からは,高年次基幹教育科目「データサイエンス総論Ⅰ&Ⅱ」としても開講予定.なお,電気情報工学科「データサイエンス序論」とほぼ同一内容.無編集ですが講義動画

  • Excelでのデータ分析スキルを測る検定試験 12月から ビジネス上での活用事例の増加受け

    データサイエンティスト育成スクールを運営するデータミックス(東京都千代田区)は9月16日、Excelでのデータ活用スキルを測る検定試験「データ分析実務スキル検定 シチズン・データサイエンティスト級」(CBAS Citizen級)を実施すると発表した。2022年12月から試験申し込みを受け付け、会場ごとに順次試験を実施する。受験料は8800円。 データ分析の専門家ではない現場のビジネスパーソンがExcelを使ったデータ分析を行うケースを想定。データハンドリングから分析まで行えるかを証明する検定として、個人のスキル資格証明や、企業内のデータ活用研修の成果確認などに利用できるという。 試験では、基的なビジネス指標の関係理解や基的なデータ可視化手法、集計値の意味理解などを問う。試験時間は80分で問題数は20問。Excelを操作して解く実技試験もある。問題はビジネスで求められる分析スキルを踏まえ

    Excelでのデータ分析スキルを測る検定試験 12月から ビジネス上での活用事例の増加受け
  • DATAFLUCT Tech Blog

    2022-08-27 データ抽出に特化したAirbyteによるEL(T) 環境構築の実践 データ基盤 Airbyte ELT こんにちは。今回は、データ基盤の構築の一部を実際に体験してみたいと思います。 データ基盤を作成するにあたり、まずは、社内に眠る様々なデータを集めてくる必要があります。前回の記事では、その機能を「収集」と紹介していました。 データ基盤とは何か… データ基盤 データ分析基盤 実践 2022-08-18 Metaflowでモデルの学習をpipeline化するまで MLOps Metaflow Pipeline 皆さんは「MLOps」について取り組んでいらっしゃるでしょうか。私は2018年頃からデータクレンジングや機械学習モデルの構築や運用をしてきましたが、当時の日で私の耳にはMLOpsという言葉が入ってくることはありませんでした。 ただMLOpsの元となった「Dev…

    DATAFLUCT Tech Blog
  • GMO ペパボの技術スタック 2020 - Pepabo Tech Portal

    執行役員 VP of Engineering 兼技術部長の @hsbt です。今年は Ghost of Tsushima をプレイしてからオープンワールドのゲームをひたすら消化していて、今はアサシンクリードヴァルハラでイングランドを歩き回っています。 昨年から今年にかけては以下のエントリーのようにGMOペパボ(以下、ペパボ)の社内のIT環境やリモートワークの状況について紹介しました。 GMO ペパボの社内IT環境 2019 - ペパボテックブログ GMO ペパボのリモートワーク状況 2020 - ペパボテックブログ 今回は社内IT環境から離れて、ペパボがサービスに採用している技術スタックについてご紹介します。 はじめに ペパボの技術スタック、について紹介すると書きましたが、ペパボという会社は事業部制を採用しており、運営しているサービスは事業部に紐づけられ、所属している人員によって開発が行わ

    GMO ペパボの技術スタック 2020 - Pepabo Tech Portal
  • 【第11回】「設計BIM全社移行を実現する社内教育の秘訣」(BIM導入期編)

    【第11回】「設計BIM全社移行を実現する社内教育の秘訣」(BIM導入期編):BIMで建設業界に革命を!10兆円企業を目指す大和ハウス工業のメソッドに学ぶ(11)(1/3 ページ) 前回は、「BIM啓蒙期」での社内教育について説明した。BIM啓蒙期は、種々の工夫を凝らし、BIMにいかに興味を持ってもらい、少しでも社内でのBIM活用を促し、業務移行のための実施検証を行うべく奔走した過渡期だった。しかし、2017年からの“全社BIM移行”の決定を受けて、格的な「BIM導入期」に移ることになる。「BIM導入期」では、まず設計のBIM移行を進めた。2次元CADの文化を捨て、BIMに完全移行するためには、担当者だけでなく、管理職や派遣社員・協力会社まで、縦横に徹底して教育することで、やっと設計の完全移行が見えてきた。今回は、この「BIM導入期」における社内教育がどのようなものであったかを紹介し、B

    【第11回】「設計BIM全社移行を実現する社内教育の秘訣」(BIM導入期編)
  • 西浦先生らによる実効再生産数の統計モデルを解説&拡張する試み - StatModeling Memorandum

    先日の西浦先生のニコ生の発表を聞いていない人はぜひ聞いてください。 モデルとデータを以下のリポジトリでオープンにしていただいたので、モデルについて僕が分かる範囲内で少し解説を加えたいと思います。 github.com 実効再生産数を推定するコードが2種類ありまして、最尤推定(Maximum Likelihood Estimation, MLE)を使ったMLE版(Sungmok Jungさん作成)と 、ベイズ推定版(Andrei Akhmetzhanovさん作成)があります。どちらもコンセプトはほぼ同じで、実装が若干異なります。この記事では、ベイズ推定版(以降、元コードと呼びます)の流れを簡単に説明し、その後でその拡張を試みます。 ベイズ推定版の流れ 大きく分けて「データの集計」「back projection」「実効再生産数の推定」の3つの部分からなります。 データの集計 まずは日付ごとの

    西浦先生らによる実効再生産数の統計モデルを解説&拡張する試み - StatModeling Memorandum
  • 自宅学習におすすめ!11日でマスター衛星データの学び方ガイド2020 | 宙畑

    衛星データ、どこかで勉強したいと思っているけれど、結局始められてないなぁというそこのあなた!この機会に宙畑と一緒に衛星データを学びましょう 宙畑では、日々衛星データに関する情報をお届けしています。 記事では、今までご紹介をした内容を整理し、どのように衛星データを学んで行くのが良いのか、お伝えしたいと思います! 今、衛星データ学習がおすすめな2つの理由 そもそも、なぜ今、衛星データを学ぶことがおすすめなのか、その理由は2つあります。 衛星データ市場は今後伸びていく市場 Credit : EuroConsult Source : http://www.euroconsult-ec.com/research/satellite-value-chain-2018-extract.pdf 実際に世界全体で使われている衛星データ(画像を含む)とデータを利用したサービスの市場規模は、衛星データそのもの

    自宅学習におすすめ!11日でマスター衛星データの学び方ガイド2020 | 宙畑
  • A/Bテストの時間短縮に向けて 〜ベイズ統計によるA/Bテスト入門〜 - Gunosyデータ分析ブログ

    はじめに こんにちは、19卒でGunosy Tech LabのBIチームの齊藤です。 data.gunosy.io この記事はGunosy Advent Calender 2019の4日目の記事です。昨日の記事は高橋さん(@tkhs0604)によるプロダクトマネージャーカンファレンス2019 参加レポート でした。 はじめに 背景 ベイズ統計 例: 継続率 事後分布のプロット 継続率以外の指標は? おわりに 背景 GunosyではUI・ロジックの変更等を行う際にA/Bテストにより効果検証を行っています。 data.gunosy.io 上記のブログの通り、従来の(頻度論に基づく)仮説検定ではA/Bテストを開始する前に有意水準、検出力、効果量を定めてサンプルサイズを求めなければなりません。またサンプルサイズを定めても必要なサイズを満たすのに何日かかるかも不透明であり、施策の実行→A/Bテスト→

  • データサイエンティストが開発したプログラミング不要の分析ツールnehanでSalesforce 商談データの勝率を予測してみた - CData Software Blog

    はじめに CData Japan技術ディレクターの桑島です。記事では、nehanにSalesforce Sales Cloudの商談データを取り込み、各商談の勝率を予測する方法をご紹介します。 記事の構成は以下の通りです。 はじめに nehan とは 前提 手順 CData Sync 概要 CData Sync製品のインストール ライセンスのアクティベーション Salesforce へのコネクションを作成 PostgreSQL へのコネクションを作成 ジョブの作成 ジョブの実行 PostgreSQLに同期した商談(Opportunity)データを確認 nehan 概要 SQLビルダーを利用したデータソースの作成 予測モデルを作成 モデルで予測値を算出 まとめ nehan とは nehanは、データサイエンティストが開発したプログラミング不要の分析ツールです。データの前処理から予測モデル

    データサイエンティストが開発したプログラミング不要の分析ツールnehanでSalesforce 商談データの勝率を予測してみた - CData Software Blog
  • 2019 阪大MMDS「機械学習・データ科学 スプリングキャンプ」

    機械学習・データ科学 スプリングキャンプ 2019 2019年3月11日(月)-12日(火), 大阪大学 中之島センター 盛況のうちに閉幕しました。ご参加いただいた方、ご協力いただいた方、ありがとうございました。 また、来年もお会いしましょう。 機械学習・データ科学 スプリングキャンプ2019のサイトにお越しいただき、ありがとうございます。 大阪大学数理・データ科学教育研究センター(MMDS)では、研究者だけでなく、学生、若手の方が学べるような イベントを企画してみました。データ関連の人材は不足しています。今回のような機会を通して、 少しでもデータ科学を適用する裾野が広がっていければと考えています。 初日は、3月に講談社から機械学習プロフェッショナルシリーズ「ガウス過程と機械学習」という書籍を出版される 持橋 大地(統計数理研究所 准教授)先生、 大羽 成征(京都大学 講師)先生に「ガウス

  • 2つの公開鍵暗号(公開鍵暗号の基礎知識) - Qiita

    はじめに TLS/SSLをはじめとして、様々な場面で公開鍵暗号が重要な役割を果たしているのは良く知られていることと思います。 ここで公開鍵暗号が何かというと、「かたやデータを公開鍵で暗号化して、かたや秘密鍵で復号する。他人にはデータの内容が漏れない」という説明が一般的です。 そうすると大抵の人は「TLS/SSL、公開鍵で暗号化して秘密鍵で復号するのね」と2つの情報を組み合わせ、それで納得してしまうわけですが、実は今日これは大体において誤り1です。 この誤りはいまやどうしようもなく広く流布していています。これは、適切な入門書がないことや、そもそも情報の検証を行う人が少ない ( そこまでする動機がない ) という理由によるわけですが、公開鍵暗号という言葉が2通りの意味で流通しているという面も大きいように思われます。 ということで、この2つの意味の違いに着目しつつ、基礎の整理を行いたいと思います

    2つの公開鍵暗号(公開鍵暗号の基礎知識) - Qiita