アクセス解析ツール「Google Analytics 4」の実装・設定・活用のための情報サイト 株式会社HAPPY ANALYTICSの代表、小川卓によって個人運営されています。
アクセス解析ツール「Google Analytics 4」の実装・設定・活用のための情報サイト 株式会社HAPPY ANALYTICSの代表、小川卓によって個人運営されています。
凋落の続く日本の半導体分野で、経済産業省が復権に動きだした。熊本県への誘致が成功した、台湾TSMC(台湾積体電路製造)の新工場がその皮切りだ。「日本企業にこだわらず、積極的に海外ファウンドリーを誘致する」という戦略で、復権はなるか。経産省 商務情報政策局 デバイス・半導体戦略室長の荻野洋平氏に聞いた(図1)。(聞き手=中道理、内田泰、佐藤雅哉、久保田龍之介) 2022年3月には、令和4年(2022)度経済産業省関連予算が成立しました。「半導体産業の基盤強化」に向けて、令和3(2021)年度補正予算と合わせると計8000億円投じるということですが、予算についての考え方を教えてください。 われわれの目標は、「半導体の国内基盤を取り戻す」こと。この大きな目標に向けて、必要な対策はどんどん打っていきます。 約8000億円という予算額は第1弾に過ぎません。30年には3倍の額にするくらいの勢いが必要で
エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(@po3rin) です。最近、AI・機械学習チーム配下の検索基盤チームでElasticsearchのAnalyzerをKuromojiからSudachiに移行しました。今回はSudachi移行の背景と、Sudachiの概要、実際に移行するにあたってのプロセスや注意事項をお話しします。 対象読者 なぜSudahchiに移行したのか 検索基盤チームが抱えていた検索の課題 Sudachiとは Sudachiへの移行戦略と実践 今使っているKuromojiユーザー辞書をSudachiユーザー辞書に移行する 今使っているシノニム辞書からSudachi正規化機能でまかなえるものを削除する 平仮名/カタカナの正規化辞書を作る 移行時のSudachi切り替え戦略 移行後の影響の事前確認 Sudachi移行時のハ
Pythonがファイルを開くときなどに使われるエンコーディングはロケール(WindowsではANSIコードページ)依存でした。 Unixの世界ではどんどんUTF-8ロケールが一般的になっている一方、WindowsのANSIコードページはなかなかUTF-8になりません。 そのために、Unixユーザーが open(filepath) のようにエンコーディングを指定しないままUTF-8を仮定するコードを気軽に書いてしまって、Windowsユーザーがエラーで困るといった問題が発生します。 また、Windowsでもメモ帳(Notepad.exe)やVSCodeはすでにUTF-8をデフォルトのエンコーディングで使用しています。ANSIコードページがUTF-8になるのを待っていたらどんどん周りの環境から置いていかれ、レガシー化してしまいます。 Pythonがデフォルトで利用するエンコーディングをWind
If you’ve ever had the need to query or transform large amounts of JSON data, you’ve undoubtedly turned to the phenomenal and ubiquitous tool jq. Yet your first experience trying out jq was probably a bit challenging. Its syntax is powerful but also terse and arguably a little too clever. It’s kind of like a Unix pipeline but not really. Don’t get me wrong. jq is awesomely useful. But overall, it
オーストラリアで見つかった隕石(いんせき)が、生命の設計図である遺伝子に使われるすべての核酸塩基と呼ばれる物質を含んでいることを発見したと、北海道大学などの国際的な研究グループが発表し、隕石によってもたらされたこうした物質が、生命誕生に関与した可能性があるとして注目されています。 北海道大学の大場康弘准教授などの国際的な研究グループは、50年余り前にオーストラリアで見つかった「マーチソン隕石」と呼ばれる隕石に含まれる物質を詳しく調べました。 その結果、生命の設計図として機能するDNAやRNAに使われているアデニンやチミン、それにウラシルなど合わせて5種類の核酸塩基と呼ばれる物質すべてが検出されたということです。 研究グループによりますと、5種類の核酸塩基すべてが1つの隕石から検出されたのは初めてだということです。 また、これとは別の核酸塩基も13種類見つかったということです。 研究グループ
こんにちは、@igsr5 です。普段はある高専の情報科に通いながら、Wantedly, Inc. で長期インターンをしています。興味領域はフロント・バックエンド、インフラで、最近は業務でもっぱらGoを書いています。今回はGoのパフォーマンスチューニングの話です。 対象読者 aws-sdk-go(aws-sdk-go-v2)[1] で s3 ダウンロード処理のパフォーマンス改善を行いたい人 Go[2] の io パッケージの話に興味がある人 バックエンドのパフォーマンス改善に興味がある人 TL;DR 内部で s3 ダウンロードが行われるバックエンドAPI などを考えたとき、 // 1. Downloader の作成 downloader := s3manager.NewDownloader(sess, func(d *s3manager.Downloader) { // + ここを追加 d.
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2021年11月10日・11日の2日間にわたり、LINEのオンライン技術カンファレンス「LINE DEVELOPER DAY 2021」が開催されました。特別連載企画「DEVDAY21 +Interview 」では、登壇者たちに発表内容をさらに深堀り、発表では触れられなかった関連の内容や裏話などについてインタビューします。今回の対象セッションは「プッシュ通知到達率100%を目指して - データ解析で得られた知見」です。 LINE公式アカウントは、企業・店舗とユーザーの接点を送出するサービスであり、LINEのトークと同じようにお客さまと直接コミュニケーションできるほか、クーポンやショップカードの機能も利用できます。 このLINE
この投稿は、私が去年OSCONで行ったプレゼンテーションを基に作成しています。プレゼンよりは簡潔に編集し直し、プレゼン後にいただいたいくつかのフィードバックに応える形で記事を書いています。 Go言語に関してよく言われるのは、Go言語はサーバでうまく機能し、静的なバイナリや強力な並行処理、高いパフォーマンスを見せくれるということです。 この投稿では、その後半の2つの項目に関して焦点を当てます。プログラマとってGo言語とそのランタイムは、スケーラブルなネットワークサーバをスレッド管理やブロッキングI/Oを気にせずに書くのにどんなに有効かを説明していきます。 効率的なプログラミング言語に関しての議論 技術的な話に入る前に、Go言語をターゲットにしたマーケットを説明する2つの議論に関してお話したいと思います。 ムーアの法則 画像は以下より引用; 2005年5月にHerb Sutter氏が書いたDr
At CloudFlare, We use Go for a variety of services and applications. In this blog post, We're going to take a deep dive into some of the technical intricacies of Go. One of the more important features of Go is goroutines. They are cheap, cooperatively scheduled threads of execution that are used for a variety of operations, like timeouts, generators and racing multiple backends against each other.
Okapi BM25 はオープンソースの検索エンジンとして有名な Elasticsearch やそのエンジンである Apache Lucene で採用されている検索のランキングアルゴリズムです。 ランキング手法としては TF-IDF が有名ですが、BM25 は TF-IDF を改良した物と言えます。また一方で、BM25 は確率論をベースとしたモデルを採用した手法でもあります。多くの検索エンジンでデフォルトのランキングアルゴリズムとして採用されており、BM25 は「現代版 TF-IDF」と言えると思います。 BM25 は以下を主要なアイデアとして採用した手法になります。この記事では二回にわたってこれらを解説していきます。 条件付き確率を基礎としたスコアリング ロバートソン/スパルクジョーンズ重み付け関数 (IDF に相当) Binary Independence Model (BIM) El
Image by Zeta Alpha.The International Conference in Learning Representations (ICLR) will be held online (for the third year in a row!) from Monday, April 25th through Friday, April 29th. It’s one of the biggest and most beloved conferences in the world of Machine Learning Research, and this year is no exception: it comes packed with more than a thousand papers on topics ranging from ML theory, Rei
エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。検索とGoが好きです。 今回は社内でPyTerrierを採用して文書検索BatchをPythonで実装したので、PyTerrierの紹介とPyTerrierで日本語検索を実装する方法を紹介します(日本語でPyTerrierを扱う記事は多分初?)。 PyTerrierとは 弊社でのPyTerrier利用 PyTerrierで日本語検索 Phrase Queryの注意点 まとめ We're hiring !!! PyTerrierとは Terrierのロゴ PyTerrierは、Pythonでの情報検索実験のためのプラットフォームです。 JavaベースのTerrierを内部的に使用して、インデックス作成と検索操作を行うことができます。基本的なQuery RewritingやBM
衣料品大手のワークマン(群馬県伊勢崎市)は、今後5年をめどにECの宅配をやめ店頭受け取りに一本化する方針を明らかにした。新規出店を加速し、“受け取り拠点”となる店舗が増えた段階で移行する。 ワークマンによると理由の1つは配送コスト。「利益が十分にとれる製品ならともかく、ワークマンは原価率が高い。宅配で利益を上げるのはきびしい」と話す。 近場に店舗がない人にとって宅配は便利だが、低価格な商材の多いワークマンでは利益を圧迫する。対して店舗受け取りなら既存の配送ルートにEC商品をのせるだけで済む。 もう1つの理由は店舗への誘導を図ること。「リアル店舗で様々な商品を見てもらい、関連購買を増やしたい」としている。 現在、ワークマンの店舗数は「WORKMAN Plus」「#ワークマン女子」を含め全国に944店。2030年までに全国1500店舗まで広げる方針で、「5年後(2027年)に1100店舗から1
ファームウェアエンジニアの中林 (id:tomo-wait-for-it-yuki) です。ESP32愛好家の皆様、ESP-IDF v4.3で次の変更が入ったことにお気づきでしょうか? Heap: Switched heap algorithm to one based on TLSF, improves performance especially when using a high number of allocations in PSRAM リリースノート1にさらっと1行だけ書かれていますが、「え?ヒープアロケータ変わったの?インパクト大きくない?」というのが最初の印象でした。本エントリではこのさらっと入った変更の、意外と大きな影響について解説して参りたいと思います。 本エントリの要点は次の通りです。 ESP-IDF v4.3からヒープアロケータがフリーリストアロケータからTLSFア
ご来店ありがとうございます。 2022年5月刊行の新刊『検索システム ― 実務者のための開発改善ガイドブック』(打田智子・古澤智裕・大谷 純・加藤 遼・鈴木翔吾・河野晋策 共著)のお知らせです。(リンク先は「PDFのみ」バージョンです。紙書籍とPDFのお得なセットも購入可能です) Webではおなじみの検索機能、いざ自分たちで導入しようと思ったとき、何から手を付けるでしょうか? とりあえず「全文検索エンジン」のようなキーワードでWebを検索しながら、LuceneやVespaでプロトタイプを作ってみる、という方も少なくないはずです。その過程では、チュートリアルだけで理解できない概念について再びWebで検索してみたり、「〇〇を実現するコードはどう書くんだろう」と思ってやっぱりWebで検索してみたり、そこで見つけた説明でわからないことをまた検索してみたり、とにかく何度も何度もいろいろな検索を繰り返
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く