You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
こんにちは佐々木です。 それでも続くデータ分析基盤の設計シリーズの第六弾です。前回に引き続き、データ加工をテーマにします。今回は、GUIによるデータ加工処理についてです。将来的には、GUIが活躍する領域がもっと広がってくると予想していますが、その選定についての個人的な課題感についてです。なお、論理的にどういうパターンがあるかを整理しているだけで、具体的な製品についての紹介や言及はしません。 データプレパレーションについて データプレパレーション(Data Preparation )とは、データ分析に先立って元データをクレンジングしたり分析しやすいように加工するプロセスです。いわゆる前処理にあたります。Preparationは直訳すると準備なので、データの準備ということですね。やっている事自体は、ETLそのものなのですが、データプレパレーション製品を提供する会社によると、ETLとは違うものと
Flat explores how to make it easy to work with data in git and GitHub. It builds on the “git scraping” approach pioneered by Simon Willison to offer a simple pattern for bringing working datasets into your repositories and versioning them, because developing against local datasets is faster and easier than working with data over the wire.
特許・契約書・有価証券報告書・企業関連ニュースなど、実応用上の自然言語処理では、会社名を認識したいという場面に非常に多く出くわす。 会社名らしい文字列をテキストから抽出することは、形態素解析器の辞書を用いたり固有表現抽出モデルを学習することである程度実現される一方で、抽出した会社名をレコード化して分析などに用いる際には、いわゆる名寄せの問題が発生する。 自然言語処理における名寄せに似た問題は、エンティティリンキングや共参照解析といったアプローチで探求されており、実応用上は前者のアプローチが採られることが多い印象がある。*1 名寄せタスクをエンティティリンキング的に解くためには、帰着先の知識ベース・辞書が予め存在していることが必要だが、研究の文脈では知識ベースとしてWikipediaが採用されることが多い。 Wikipediaを用いる利点は多くあり、様々なエンティティ種に対してそこそこのカバ
皆さんは示唆を出すときにどこに気をつけていますか? 約1年前にデータアナリストの職種につき、データ分析、特に行動データの分析を多くしてきた、株式会社メンバーズの北澤さん。アナリストになる前までデータから示唆を得るような分析の経験はなかったそうです。今記事では、初心者でもデータから示唆を出せるように気を付けたいポイントを中心に解説してもらいました。 北澤 茜(きたざわ・あかね)氏 株式会社メンバーズ メンバーズデータアドベンチャーカンパニー データアナリスト/データエンジニア SIerでシステム開発に従事した後、現職でデータアナリスト/データエンジニアをやっています。現在は大手ECサイト等のサービス事業会社に常駐しており、施策効果検証やユーザー行動の分析、データ分析基盤構築などの業務に携わっています。絵を描くこととゲームが好きです。 示唆出しってなに? データ分析としての示唆とはなんでしょう
【使い方解説】GoogleデータポータルとTableauを使って開発ブログのアクセス解析してみた。 2021.01.29 技術 Tableau, データ分析 システム部でデータ可視化を担当しているのまちです。 今回は今まさにお読みいただいているGMOリサーチの開発ブログのサイトがどのくらい集客できているのか? について、BIツールであるTableauとGoogleデータポータルを使って実際にデータ分析してみた話をしようと思います。 また、データの入手元としてGoogle AnalyticsとGoogle Search Consoleを使用しました。 そもそもこの分析をしてみようと思った理由ですが、当ブログの管理人であるちはっぴーがサイトの効果測定のためにページプレビュー数を毎週スプレッドシートに手入力しているらしいという話を聞き(Techといえど分析は意外とアナログな実態)ダッシュボードを
Dataformを初めて使ってみたので、雑に感想を書いておきます。結構よかった。 使ってみようとした背景 Dataformについて 試してみてどうだったか よかった まだまだこれからっぽいところ & 気になり 参考 使ってみようとした背景 今週、社内の開発合宿に参加していた。変更のリードタイムやデプロイ頻度などのFour Keysにあるような指標を計測できるデータ基盤を作るのが目標。様々なチームの開発のパフォーマンスをトラッキングしやすくして、うまくできているチームがなぜうまくいっているのかを明らかにしたり、改善施策を行なった結果指標も改善しているか定量的に確認できるようにして、開発効率を上げる土台を作るというのが目的。この辺の詳しいことは後々別のエントリで書かれると思う。 自分のチームは3人構成で、在宅のオンラインでやっていた。 id:shiba_yu36さん Mackerelチームでも
こんにちは。MackerelチームにおいてCRE(Customer Reliability Engineer)をしているid:syou6162です。主にカスタマーサクセスを支えるデータ基盤の構築や、データ分析を担当しています。 最近、はてな社内のさまざまなチームでデータ活用が進んでいます。しかし、そういったデータ活用の知見は、それぞれのチーム内でとどまってしまいがちです。この記事では、チームを横断したデータ活用を推進するため、昨年の秋から開催している「突撃! 隣のダッシュボード」という会の企画を紹介します。 データ活用についてラフに議論できる場所 ダッシュボードの事例:種類といくつかの観点 ダッシュボードの設計という観点から ダッシュボードの作成という観点から ダッシュボードの活用という観点から ダッシュボードの育て方 データ活用の課題感と解決に向けた動き データ活用の3つの壁とメンバー固
Monetize Your Data with White-Labeled Analytics Products.Juice is your end-to-end solution to design, develop, and deploy with confidence. Transform Your Data into RevenueJuice is a full-service partner for creating revenue-generating analytics solutions. With our expertise and proprietary platform, we turn your data into valuable products that drive growth. Here's how we stand apart: Rapid Time-t
Datasette is a tool for exploring and publishing data. It helps people take data of any shape, analyze and explore it, and publish it as an interactive website and accompanying API. Datasette is aimed at data journalists, museum curators, archivists, local governments, scientists, researchers and anyone else who has data that they wish to share with the world. It is part of a wider ecosystem of 46
Google Cloud は今年 8 月に Harvard Global Health Institute とのパートナーシップのもとで COVID-19 Public Forecasts を公開しました。このサービスは予測開始日から将来 14 日間における米国内の COVID-19(新型コロナウイルス感染症)陽性者数や死亡者数などの予測を提供しています。この度、本サービスを日本にも拡張し、COVID-19 感染予測(日本版)の提供を開始します。日本版では予測開始日から将来 28 日間のあいだに予測される国内の陽性者数や死亡者数等の予測値を表示します。 米国で提供している COVID-19 Public Forecasts は AI と膨大な疫学的データを組み合わせ、さらに、時系列の予測を扱う斬新な機械学習のアプローチを採用することで実現しました。米国向けのこの初期モデルは今年 8 月に初
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く