並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

データ工学の検索結果1 - 16 件 / 16件

  • 夢中になった技術が「打ち込める仕事」になるまで ─ OSS検索エンジンの開発にコミットし事業にも貢献する - Findy Engineer Lab

    はじめまして、 @mocobetaと申します。 パッケージソフトウェアベンダー、コンサルティング会社、Webサービス企業などを経て、現在は株式会社LegalForceというスタートアップの研究開発セクションでソフトウェアエンジニアをしています。 個人としては、Python形態素解析ライブラリjanomeを開発するとともに、OSS検索エンジンライブラリApache Luceneのコミッターをしています。ちなみに本記事のアイキャッチ画像は、絵師さんに描いてもらったjanomeのキャラクターです。とてもかわいく描いていただいて、お気に入りの1枚です。 この記事では、進路とエンジニアとしての力不足に悩んでいた私の若手時代から、10年(以上)の模索期間を経て、ライフワークにしたいと思える技術に出会い、なんとか好きな仕事で食べていけるようになるまでを振り返ります。アップダウンの激しいIT業界において、

      夢中になった技術が「打ち込める仕事」になるまで ─ OSS検索エンジンの開発にコミットし事業にも貢献する - Findy Engineer Lab
    • NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language

      DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム チュートリアル講演資料 Part2: Vision-and-Language

        NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language
      • NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP

        DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム チュートリアル講演資料 Part1: NLP

          NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP
        • PPT - 大澤 昇平 (21) PowerPoint Presentation, free download - ID:2850047

          An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While download

            PPT - 大澤 昇平 (21) PowerPoint Presentation, free download - ID:2850047
          • 詳解Rustプログラミング | SEshop.com

            さまざまなCUIアプリケーションを通して システム言語としてのRustを徹底詳解 本書は、 Tim McNamara, "Rust in Action: Systems programming concepts and techniques" Manning Publications, の翻訳書です。 【本書の内容】 ダイレクトにメモリを操作し、OSのシステムコールを活用することで高速性を維持しつつ、コンパイラの進化によって安全性も確保した開発言語・Rust。 本書は、ファイルI/Oを使った入出力プログラムから、キーバリュー型のDB操作やメモリ操作、生のTCPを使うネットワークプログラム。そしてプロセスやスレッド、割り込みや例外処理などの低レイヤからカーネルそのものまで扱うためのノウハウを、Rust固有のテクニカルタームとともに解説します。 著者のTim McNamaraは、15年以上の時

              詳解Rustプログラミング | SEshop.com
            • 2年の歳月をかけて作成した1枚の図はデータ基盤構築の羅針盤となるか~「実践的データ基盤への処方箋の刊行にあたって」パネルディスカッションレポート | gihyo.jp

              2年の歳月をかけて作成した1枚の図はデータ基盤構築の羅針盤となるか~「実践的データ基盤への処方箋の刊行にあたって」パネルディスカッションレポート 2021年12月10日、データマネジメント領域に特化した「Tech × Marketing Conference 2021」がオンライン形式で開催されました。 同イベントでは、データマネジメントというテーマを軸に、データ整備、ツールやサービス、データ基盤構築といったさまざまな視点から、豪華登壇者による10のセッションが行われました。当日の各セッションの様子はYouTubeチャンネルで公開されています。 本稿は「実践的データ基盤への処方箋の刊行にあたって」と題して行われたパネルディスカッションを再構成し、ダイジェストとしてお送りします。なお、このパネルディスカッションのアーカイブはYouTubeで公開しています パネルディスカッションの投影資料です

                2年の歳月をかけて作成した1枚の図はデータ基盤構築の羅針盤となるか~「実践的データ基盤への処方箋の刊行にあたって」パネルディスカッションレポート | gihyo.jp
              • データエンジニア大集合!「実践的データ基盤への処方箋」輪読会レポート ~データ基盤システム編~ | gihyo.jp

                「実践的データ基盤への処方箋」輪読会のレポートは、以下の記事に分けて掲載しています。 データエンジニア大集合!「実践的データ基盤への処方箋」輪読会レポート 〜データ整備編〜(第1回) データエンジニア大集合!「実践的データ基盤への処方箋」輪読会レポート ~データ基盤システム編~(今回) データエンジニア大集合!「実践的データ基盤への処方箋」輪読会レポート 〜データ組織編〜(第3回) 2022年1月から2月にかけて、データエンジニアリング、データ活用の知見の共有を目的としたコミュニティdatatech-jpおよび株式会社風音屋の協力のもと「実践的データ基盤への処方箋」の輪読会がオンライン形式で開催されました。輪読会は3回に分けて開催され、合計9名の発表者と、多くの参加者が集まり、さまざまな議論が交わされました。本稿ではこの輪読会の第2回の様子をダイジェストで紹介します。 データ収集は試行錯誤

                  データエンジニア大集合!「実践的データ基盤への処方箋」輪読会レポート ~データ基盤システム編~ | gihyo.jp
                • 日本経済新聞社での事前学習済み言語モデルの構築と活用 — HACK The Nikkei

                  研究開発部署「日経イノベーション・ラボ」の石原です。 Nikkei Advent Calendar 2022の 23 日目を担当します。 日本経済新聞社では、ユーザへより良いサービス利用体験を提供するため、広くデータの利活用を進めています。 本記事では特に「自然言語処理」と呼ばれる領域に焦点を当て、2022 年の主要な取り組みの一つとして、昨今の急速な進展の根幹を担う「事前学習済み言語モデル」の構築と活用に関する事例を紹介します。 最初に自然言語処理や事前学習済み言語モデルの概要を説明し、その後に日本経済新聞社での取り組みをまとめます。 日本経済新聞社では積極的な対外発表が推奨されており、本記事は技術ブログ・外部登壇・論文発表で公表済みの内容をもとに構成しています。 自然言語処理とは 自然言語処理とは、人間が日常的に使っている言語(自然言語)をコンピュータで処理するための一連の技術です。

                    日本経済新聞社での事前学習済み言語モデルの構築と活用 — HACK The Nikkei
                  • 名刺を超えて人や企業を検索する - Sansanにおける検索システムへの取り組み / Building Search for People and Businesses Beyond Business Cards

                    ■イベント 
DEIM2020 第12回データ工学と情報マネジメントに関するフォーラム
https://db-event.jpn.org/deim2020/ ■登壇概要 タイトル:名刺を超えて人や企業を検索する - Sansanにおける検索システムへの取り組み 発表者: 
DSOC 研究開発部 Data Analysis Group 奥田 裕樹 ▼Sansan Builders Box https://buildersbox.corp-sansan.com/

                      名刺を超えて人や企業を検索する - Sansanにおける検索システムへの取り組み / Building Search for People and Businesses Beyond Business Cards
                    • DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム

                      株価変動分析においても機械学習の時系列データクラスタリング手法が広く使われている.代表な距離定義はk-Shape法のSBD,及びDTWなどであるが,これらは入力データの標準化を前提とするので,重要な分散(リスク)情報を捨て去ってしまうという問題がある.株価分析においては,現在も,1952年にハリー・マーコウィッツが創案した「収益率の平均 (平均リターン) とリスク(リターンの標準偏差)の散布図」による分析法が広く使われている.この手法ではリスク情報を捨てずに用いているが,より詳細な変動パターン(V字回復,S字型など)を知るためには,機械学習クラスタリングが必要となる.しかし,例えば,テスラやインドIT企業の株価のように成長率が大きい銘柄の場合,k-Shape法では分散情報が除去されてしまい分析目的に合致しない.そこで我々はAmplitude-based clustering法という,分散情

                        DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム
                      • DEIM2021報告

                        皆さんこんにちは.北山です.研究室としては毎年参加しているDEIM(データ工学と情報マネジメントに関するフォーラム)に今年も参加しましたので,その報告です.今年は昨年に引き続き,完全オンラインの開催ということで,私は運営側でもなかったので自宅からの参加をしていました.ちなみに昨年は運営側だったのと,初のオンライン開催でてんやわんやだったのを思い出します. 北山研としては11件の発表を行いました.共著の発表がもう1件あるので,北山の名が入っている発表は12件ということになります.こうなってくると,ほぼすべての時間帯が,発表 or コメンテータのお仕事という状態で,一日中張り付いているような形になりました…ちょっとやりすぎ感もありますので,来年からは考えたいと思います.これ,いつも言ってるような…まあええか. ありがたいことに,そのうち「ユーザのシチュエーションと振る舞いに基づく提示タイミング

                          DEIM2021報告
                        • 詳解Rustプログラミング【PDF版】 | SEshop.com

                          本製品は電子書籍【PDF版】です。 ご購入いただいたPDFには、購入者のメールアドレス、および翔泳社独自の著作権情報が埋め込まれます。 PDFに埋め込まれるメールアドレスは、ご注文時にログインいただいたアドレスとなります。 Amazon Payでのお支払いの場合はAmazonアカウントのメールアドレスが埋め込まれます。 本製品を無断で複製、転載、譲渡、共有および販売を行った場合、法律により罰せられる可能性がございます。 ご購入の前に必ずPDF利用案内をお読みください。 さまざまなCUIアプリケーションを通して システム言語としてのRustを徹底詳解 本書は、 Tim McNamara, "Rust in Action: Systems programming concepts and techniques" Manning Publications, の翻訳書です。 【本書の内容】 ダイレ

                            詳解Rustプログラミング【PDF版】 | SEshop.com
                          • PostgreSQL のマテリアライズドビューを高速に最新化する

                            この記事は株式会社SRAの技術情報誌「GSLetterNeo Vol.173(2022年12月発行)」の記事を許可を得て転載したものです。 はじめに PostgreSQLは広く使用されているオープンソース・ソフトウェアのRDBMSです。SRA OSS LLC ではPostgreSQLに関するサポートやコンサルティングのサービスを提供する一方、技術開発室という部署ではPostgreSQL開発コミュニティへの貢献やPostgreSQLに関する研究開発といった活動を行っています。本稿ではその中から「増分ビューメンテナンス(Incremental View Maintenance, IVM)」と呼ばれる機能の実装について紹介します。これは一言で言うならば、マテリアライズド・ビューの最新化を高速に行う技術です。 マテリアライズド・ビュー マテリアライズド・ビューとは、そのビューを定義するSQLクエリ

                              PostgreSQL のマテリアライズドビューを高速に最新化する
                            • Vol.28 No.6 (2013/11) 情報推薦 – 人工知能学会 (The Japanese Society for Artificial Intelligence)

                              私のブックマーク 情報推薦システム(Recommender Systems)奥 健太(立命館大学) はじめに 「この商品を買った人はこんな商品も買っています」. このようなフレーズは今やあらゆるオンラインショッピングサイトで目にするようになった. 情報推薦システムは,膨大な情報の中からユーザの嗜好にあった情報を提供するシステムである. 基本的な実現方式としては,大きく,内容に基づくフィルタリングと協調フィルタリングがある. 内容に基づくフィルタリングでは,購入履歴や閲覧履歴などからユーザのプロファイルを構築し, そのプロファイルに合致するアイテムを推薦する. 協調フィルタリングでは, 嗜好が類似するユーザが高く評価しているアイテムを対象ユーザにも推薦したり, 対象ユーザが興味を示しているアイテムと類似するアイテムを推薦したりする. 本稿では,情報推薦システムについて研究を遂行していくにあた

                              • 「出島0.5方式」で進める東京海上のデジタル戦略--中核を担う東京海上ディーアール・嶋倉社長に聞く

                                いま東京海上グループは、保険会社や保険商品の「再定義」に挑んでいる。データ活用によるデジタル戦略を加速させる同グループは、2021年7月に「データ戦略中核会社」として東京海上ディーアールを設立した。 今回は、東京海上グループのデジタル戦略を率いるグループCDOの生田目雅史氏のインタビューに続き、東京海上ディーアールの代表取締役社長をつとめる嶋倉泰造氏に、設立の背景や現在の進捗、今後の方針などを聞いた。 「出島0.5方式」の東京海上ディーアールとは 東京海上ディーアール(以下、TdR)は、東京海上グループが進めるデジタル戦略においてデータ戦略的な利活用を担う中核会社だ。前身は、1996年に設立された東京海上リスクコンサルティング(2004年に東京海上日動リスクコンサルティングに社名変更)で、2021年7月にグループからの増資を受けて、その役割を拡大する形で設立された。 「TdRは、完全なる新

                                  「出島0.5方式」で進める東京海上のデジタル戦略--中核を担う東京海上ディーアール・嶋倉社長に聞く
                                • 最強DB講義 #10 いまどきのデータベース索引技術(石川佳治 教授) (2021/10/20 18:30〜)

                                  日時・講演内容 日時:2021年10月20日(水) 18:30-19:30 開催場所:オンライン(URL等は本ページの「参加者への情報」に掲載いたします) タイトル:いまどきのデータベース索引技術 講師:石川佳治先生(名古屋大学 教授) 講義概要: 索引(インデックス)はデータベースの問合せ処理において重要な役割を果たしている.この講義では,データベースにおいて用いられる索引技術について,まず基礎的な技術について解説する.加えて,現在のシステム技術やハードウェアの進展による最近の新しい索引技術のアイデアについて概説する. 講師紹介: 石川佳治 先生(名古屋大学 教授) 1989 筑波大学第三学群情報学類卒.1994 同大学大学院博士課程工学研究科単位取得退学.同年奈良先端科学技術大学院大学助手.1999 筑波大学電子・情報工学系講師.2004 同助教授.2006 名古屋大学情報連携基盤セン

                                    最強DB講義 #10 いまどきのデータベース索引技術(石川佳治 教授) (2021/10/20 18:30〜)
                                  1