  • Naming Variables In CSS

    “Naming things is hard” goes the software engineering axiom and CSS is no exception. Here are some collected thoughts related to naming CSS Custom Properties. I’m going to use use the terms “variable” and “custom property” interchangeably since they are effectively the same thing for the purposes of what to call them. Disclaimer: What follows is not gospel. CSS to me is a very poetic language, the

    • データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu

      はじめに#前回のポストではデータレイクとはどういうものかというのを調べた。 今回はデータレイクの文脈でどのような OSS が注目されているのかを見ていきたい。 以下は NTT データさんによる講演資料であり、その中で「近年登場してきた、リアルタイム分析に利用可能なOSSストレージレイヤソフト」というのが3つ挙げられている。 Delta LakeApache HudiApache Kuduこれらはすべて論理的なストレージレイヤーを担う。 こちらの講演資料に付け足すようなこともないかもしれないが、このポストではデータレイクという文脈から自分で調べて理解した内容をまとめるということを目的にする。 当然 Hadoop, Hive, Spark 等もデータレイクの文脈において超重要だが、「データレイク」という言葉がよく聞かれるようになる前から普及していたのでこのポストでは触れないことにする。 Del

        データレイク関連の OSS - Delta Lake, Apache Hudi, Apache Kudu
      • The Building Blocks of a Modern Data Platform

        Photo by Adam Nowakowski on UnsplashIf you Google “modern data platform”, you’ll immediately be bombarded with advertisements and lots of companies professing that they are the one true data platform. Not so helpful, right? So what the heck is a modern data platform? What does that even mean, and what does it look like in 2021? The short answer: a modern data platform is a collection of tools and

          The Building Blocks of a Modern Data Platform
        • Presto conferencetokyo2019

          This document summarizes a presentation about Presto at LINE. It discusses LINE's use of Presto, Yanagishima (an open source Presto web UI), OASIS (a Spark-based data analysis platform), and challenges encountered with Presto at LINE's scale. Some key points include: - LINE uses Presto for interactive queries through Yanagishima and Spark/Hive for batch processing through OASIS due to Presto's lac

            Presto conferencetokyo2019
            • LINEにおけるすべてのデータの蓄積から利活用まで データプラットフォーム「IU」はなぜデータを統合できたのか

              2021年11月10日と11日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2021」がオンラインで開催されました。そこで奥田輔氏が、LINEのデータを一つにまとめ上げてデータプラットフォームを作り上げた経緯について共有しました。後半はデータプラットフォームを作る上での課題をどのように解決したかについて。前半はこちら。 データの分断をどのように解決したか①ストレージの問題 本移行プロジェクトにおいて、アプローチを大きく2つに分類してお話しします。1つは、技術的アプローチ。複雑な問題・システムを簡単にするようなアプローチです。もう1つはデータマネジメント的アプローチ。ユーザーにとって移行のコストを下げるべく、現在の状態をできるだけ変えることなく、変更点を少なく移行ができるように心がけました。 まずは技術的アプローチです。大きく3つ

                LINEにおけるすべてのデータの蓄積から利活用まで データプラットフォーム「IU」はなぜデータを統合できたのか
              • Dataproc Hub により機械学習でノートブックの使用がより簡単に | Google Cloud 公式ブログ

                ※この投稿は米国時間 2020 年 12 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。 Dataproc は、Apache Spark クラスタ、Presto クラスタ、Apache Hadoop クラスタなどのオープンソースを簡単かつコスト効率よく実行できるようにする、高速で使いやすいフルマネージド クラウド サービスです。本日、Dataproc Hub を一般提供し、機械学習の初期化アクションをリリースしました。Spark による水平スケーリングが可能なコンピューティングにより、データ サイエンティストが、IT で制御されたオープンソース ノートブック ベースの機械学習を簡単に使用できるようになります。 Dataproc で機械学習を運用する企業のお客様は、IT とデータ サイエンティストのロールを分離する必要があります。また、IT 管理者は Dat

                  Dataproc Hub により機械学習でノートブックの使用がより簡単に | Google Cloud 公式ブログ
                • AWS、3つのアナリティクス新機能を発表:時事ドットコム

                  AWS、3つのアナリティクス新機能を発表 [アマゾンジャパン合同会社] AQUA (Advanced Query Accelerator) for Amazon Redshift:画期的なハードウェアにより高速化された新しい分散型キャッシュを提供し、他のクラウドデータウェアハウスに比べ最大10倍のクエリパフォーマンスを実現 AWS Glue Elastic Views:複数のデータストアのデータを自動的に組み合わせ、レプリケートできるマテリアライズドビューを簡単に構築 Amazon QuickSight Q:機械学習を活用したAmazon QuickSightの新機能により、ビジネスデータに関する自然言語での質問に対し、正確な回答を数秒で提供 Capital One、Best Western Hotels & Resorts、NTTドコモ、Audible、パナソニック アビオニクスをはじめ

                    • Aurora MySQL スロークエリログの解析|Takahiro Yamada

                      Aurora MySQL スロークエリログの可視化について試してみたので共有したいと思います。 Aurora MySQL とは AWS が提供しているMySQL と互換性のあるリレーショナルデータベースサービスです (PostgreSQL 互換エディションもあります)。 Aurora ではスロークエリログを出力することができますが、出力先として CloudWatch Logs を選択することができます [1]。 ※ Aurora MySQL スロークエリログを CloudWatch Logs で表示させた例 CloudWatch Logs ではコンソール上でログデータの検索を実施できますが、スロークエリの実行時間の統計値などを確認することは難しいです。 そこで、下記 2 つの方法にてスロークエリログの可視化を実施してみました。 ・CloudWatch Logs Insights を利用する

                        Aurora MySQL スロークエリログの解析|Takahiro Yamada
                      • SAP、ZabbixからOffice365 SMTPサーバ経由でメールを送信するには | BeeX Technical Blog

                        鈴木です。 Metabaseというデータ可視化ツールがあります。データをチャートやダッシュボードにして可視化できます。 オープンソースのデータ可視化ツールにはMetabaseのほかにも、Redash、Superset、Kibanaなどいくつかあります。その中でもMetabaseは後発なだけあって、他と比べシンプルで、画面もきれいです。SQLの知識も不要です。使ってみるまでのステップも他のツールに比べ非常に簡単で、Dockerコマンドや、jarファイル1個でのJVM起動のほか、AWSであればElastic Beanstalkでの起動も公式に用意されています。 データソースとしては、PostgreSQL/MySQLやSQL Serverなどのデータベースのほか、AWSのRedshiftやGCPのBigQueryのクラウドサービスにも対応しています。SAPなどの基幹システムに入っているデータも、

                          SAP、ZabbixからOffice365 SMTPサーバ経由でメールを送信するには | BeeX Technical Blog
                        • 軽いと噂のブラウザ「Vivaldi」を使ってみた!!実際に軽くなるのか検証!!

                          Vivaldiの場合はどうなるのか見てみましょう!! まずはVivaldi(ヴィヴァルディ)とは。。。 Vivaldi(ヴィヴァルディ)は、Vivaldi Technologiesによって開発されているウェブブラウザである。 Vivaldi Technologiesは、オペラ・ソフトウェアの創設者の一人でありCEOであったヨン・スティーブンソン・フォン・テッツナーによって設立された。”A new browser for our friends”(私たちの友人のための新しいブラウザ)をスローガンとしており、技術者、インターネットのヘビーユーザ、OperaのレンダリングエンジンがPrestoからBlinkへと変更されたことに伴い多くの機能が削除されてしまったことに不満を抱いているかつてのOperaユーザを主な対象としている 出典:Vivaldi (ウェブブラウザ) – Wikipedia Op

                            • Hadoopのバージョン混用は可能? HDP 2.6.4 とコミュニティ版 Hadoop 3.2.1 におけるHDFSの互換性調査結果

                              ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog (English translation is available here) ヤフーで Hadoop の運用・開発をしている李 燮鳴です。私たちのチームでは Hadoop 3.2.1 に含まれる Router Based Federation (RBF) で Hadoop のスケーラビリティ問題の解決を試みています。この記事では RBF を導入する背景と Hadoop 3.2.1 と既存の実行系の互換性を紹介します。 背景および目的 Hadoopクラスタ@ヤフー ヤフーでは、自社が提供している多種多様なサービスのログを分析してサービスの改善に役立てるため、Hadoop クラスタを複数運用しています。ソフトウェアスタックでは、HD

                                Hadoopのバージョン混用は可能? HDP 2.6.4 とコミュニティ版 Hadoop 3.2.1 におけるHDFSの互換性調査結果 
                                • Cloud Hive metastore now available | Google Cloud Blog

                                  Dataproc Metastore: Fully managed Hive metastore now available for alpha testing Google Cloud is announcing a new data lake building block for our smart analytics platform: Dataproc Metastore, a fully managed, highly available, auto-healing, open source Apache Hive metastore service that simplifies technical metadata management for customers building data lakes on Google Cloud. With Dataproc Metas

                                    Cloud Hive metastore now available | Google Cloud Blog
                                    • The History of Microsoft Azure

                                      Hello! Welcome to my first article on Azure, this article is a reminder of the growth and maturity Microsoft Azure which finally made it as a top cloud service provider. My name is Roosevelt Abandy I am a Gold Microsoft Learn Student Ambassador, Software Engineer, Power Platform Advocate and a student at the University of Benin, Nigeria. As a Co-Lead of the Microsoft Power Platform User Group Edo

                                        The History of Microsoft Azure
                                      • 有限温度状態での量子もつれに関する普遍的性質の発見

                                        理化学研究所(理研)革新知能統合研究センター数理科学チームの桑原知剛研究員(研究当時、現開拓研究本部桑原量子複雑性解析理研白眉研究チーム理研白眉研究チームリーダー、量子コンピュータ研究センター量子複雑性解析理研白眉研究チーム理研白眉研究チームリーダー)と慶應義塾大学理工学部の齊藤圭司教授の共同研究チームは、量子力学に従う多粒子系(量子多体系[1])の熱平衡状態[2]では、一般に長距離に及ぶ「量子もつれ[3]」が存在しないことを示しました。 本研究成果は、量子機械学習[4]を含む量子計算に関する手掛かりを多く与えるとともに、有限温度[5]で観測されるさまざまな量子的物理現象に関与する量子もつれの分類研究に寄与すると期待できます。 量子コンピュータ[6]を使った量子計算には、量子もつれが本質的な役割を果たすため、量子もつれの有限温度における効果を解き明かすことは重要な未解決問題の一つでした。

                                          • Guide to File Formats for Machine Learning: Columnar, Training, Inferencing, and the Feature Store

                                            TLDR; Most machine learning models are trained using data from files. This post is a guide to the popular file formats used in open source frameworks for machine learning in Python, including TensorFlow/Keras, PyTorch, Scikit-Learn, and PySpark. We will also describe how a Feature Store can make the Data Scientist’s life easier by generating training/test data in a file format of choice on a file

                                              Guide to File Formats for Machine Learning: Columnar, Training, Inferencing, and the Feature Store
                                            • Open Sourcing Amundsen: A Data Discovery And Metadata Platform

                                              By Tao Feng, Jin Hyuk Chang, Tamika Tannis, Daniel Won In a modern data-driven company like Lyft, every interaction on the platform is powered by data. The challenges that arise from complex data generation, ETL processes, and analytics make metadata significantly important. Moreover, the types of data resources are constantly increasing. At Lyft, these resources include SQL tables and views in Re

                                                Open Sourcing Amundsen: A Data Discovery And Metadata Platform
                                              • Self-referential types for fun and profit

                                                Some Rust questions are asked over and over, and are therefore met with short and well-rehearsed answers. “Compile in release mode when measuring performance.” “Don’t try to learn Rust with linked lists.” “Use scoped threads.” “That requires specialization.” But there is one response that is delivered in an almost checkmate-like fashion: “You are trying to construct a self-referential type.” This

                                                  Self-referential types for fun and profit
                                                • LyftLearn: ML Model Training Infrastructure built on Kubernetes

                                                  Authors: Vinay Kakade, Shiraz Zaman IntroductionIn a previous blog post, we discussed the architecture of Feature Service, which manages Machine Learning (ML) feature storage and access at Lyft. In this post, we’ll discuss the architecture of LyftLearn, a system built on Kubernetes, which manages ML model training as well as batch predictions. ML forms the backbone of the Lyft app and is used in d

                                                    LyftLearn: ML Model Training Infrastructure built on Kubernetes
                                                    • Amazon QuickSight: 2019 年の振り返り | Amazon Web Services

                                                      Amazon Web Services ブログ Amazon QuickSight: 2019 年の振り返り 2019 年は、Amazon QuickSight にとって刺激的な年でした数千社におよぶお客様をオンボーディングし、グローバルに 10 箇所の AWS リージョンに拡張し、60 以上の機能 (各週間に 1 つ以上の機能) をリリースしました お客様や Amazon QuickSight で実施する全てのことに活気づけられています。面談、電話会議、メール、ディスカッションフォーラム、そして AWS サミットを通して、皆様と時間を共にできたことを感謝いたします。今年の締めくくりとして、ハイライトの概要を簡単に紹介いたします。 re:Invent 2019 Amazon QuickSight チームは、 re:Invent で Best Western、Capital One、Club

                                                        Amazon QuickSight: 2019 年の振り返り | Amazon Web Services
                                                      • Searching the web for < $1000 / month | Quickwit

                                                        This blog post pairs best with our common-crawl demo and a glass of vin de Loire. Six months ago, we founded Quickwit with the objective of building a new breed of full-text search engine that would be 10 times more cost-efficient on very large datasets. How do we intend to do this? Our search engine will search data straight from Amazon S3, achieving true decoupled compute and storage. For distri

                                                          Searching the web for < $1000 / month | Quickwit
                                                                    • Some Gripes on User-Agent, Again

                                                                      ]> ▼帰ってきたUser-Agentについてのたわごと▼ [unknown above.net robot] adidxbot admantx-* adscanner (seocompany.store) Adsbot Adsbot (seostar.co) adscanner (seoscanners.net) AguseScan AlexaMediaPlayer [unknown alibaba.com .cn scanner] [Alkonavt checker] AlphaBot Amazonbot Applebot [Apple Messages preview] archive.org_bot [archive.ph archiver] AspiegelBot [aws fake Chrome scanner] BaiduSpider [fake] Barkrowler be

                                                                      • Amazon EMR Serverlessをさわってみた - JBS Tech Blog

                                                                        はじめに 前提知識(Amazon EMR) Amazon EMR Serverlessとは? Amazon EMR Serverlessをさわってみた 事前準備 関連AWSリソースの準備 データの準備 クエリの準備 EMR ServerlessでHiveアプリケーションを作成して実行する EMRアプリケーションの作成 ジョブの実行 さいごに はじめに こんにちは!クラウドプラットフォーム部の土井です。 今年6月にAmazon EMR ServerlessがGAとなったので遅ればせながらですが、既存のAmazon EMRサービスとの違いにも簡単に触れつつ触ってみたいと思います。 前提知識(Amazon EMR) Amazon EMR コンソール操作で自動的にサーバのプロビジョニングとオープンソースの処理フレームワークのデプロイと設定を行い、迅速にビッグデータ処理のためのクラスタを構築できるA

                                                                          Amazon EMR Serverlessをさわってみた - JBS Tech Blog
                                                                        • 複雑さのはなし / morrita - Message Passing

                                                                          本質的な複雑さ批判 森田が大ファンであるところの Dan Luu が「人月の神話」の Fred Brooks をディスる 記事を書いており、 痛快なのでみんなでこれ読んで与太話しようぜ、という回。(Dan Luu のページは Pocket か Instapaper 必須なのでみなインストールされたし。) ここで批判されているのは Brook の Essential Complexity / Accidental complexity に関する記述。 極めて雑に復習すると、Brooks は「問題には “essential complexity” すなわち “本質的な複雑さ” というのがあるから、 プログラミング言語とかツールとか計算機性能の改善とかで “accidental complexity” / “偶発的な複雑さ” を減らしていっても限度があるよね、 ソフトウェア開発って難しいですね・

                                                                            複雑さのはなし / morrita - Message Passing
                                                                          • A simple way to get more value from tracing

                                                                            A lot of people seem to think that distributed tracing isn't useful, or at least not without extreme effort that isn't worth it for companies smaller than FB. For example, here are a couple of public conversations that sound like a number of private conversations I've had. Sure, there's value somewhere, but it costs too much to unlock. I think this overestimates how much work it is to get a lot of

                                                                              • Clojure needs a Rails, but not for the reason you think

                                                                                First, a quick storySuzi, a software engineer of suitable caliber, loves writing Clojure. At her polyglot employer, she often uses her technical freedom to bat for Clojure every chance she gets. One day her manager taps her for an opportunity, the company wants to build a scrappy, lean internal tooling team to build tools for sales, marketing, and so on.  Perfect. One the first day of the tooling

                                                                                  Clojure needs a Rails, but not for the reason you think
                                                                                • Amazon EMR 6.4 リリースバージョンが Apache Spark 3.1.2 のサポートを開始

                                                                                  Amazon EMR 6.4 リリースバージョンは Apache Spark 3.1.2 をサポートするようになりました。これにより、Amazon EMR Runtime for Apache Spark でランタイムパフォーマンスが向上します。Amazon EMR 6.4 は、PrestoDB 0.254 の Presto ランタイムの改善と、メタストアのために AWS Glue Data Catalog を使用する場合の Apache Hive 3.1.2 のランタイムの改善を提供します。 Amazon EMR 6.4 は、 Apache Hudi 0.8.0、Trino 359、PrestoDB 0.254、Apache HBase 2.4.4、Apache Phoenix 5.1.2、Apache Flink 1.13.1、Apache Livy 0.7.1、JupyterHub

                                                                                    Amazon EMR 6.4 リリースバージョンが Apache Spark 3.1.2 のサポートを開始