並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 50件

新着順 人気順

header 意味 データの検索結果1 - 40 件 / 50件

  • SPF (やDMARC) を突破する攻撃手法、BreakSPF | 朝から昼寝

    SPF レコードで許可されている IPアドレスの実態がクラウドやプロキシ等の共用サービスのものであるケースは多く、それらの IPアドレスが第三者によって利用できる可能性があることを悪用し、SPF 認証を pass、結果的に DMARC 認証まで pass して詐称メールを送信できてしまうことを指摘した論文が公開されています。 この論文では、上記のような SPF の脆弱な展開に対する攻撃手法を BreakSPF と呼び、関連するプロトコルや基盤の実装に対する分析と共に、その内容が体系的にまとめられています。 本記事では、その論文を参照しながら、簡単に概要をまとめておきます。 補足事項 (2024/3/5) 本記事につきまして、(当サイトとしては) 多くのアクセスいただいているようで (ちょっとビビってま) す。まことに大変ありがたいことに色々とシェアいただいたりしたようです。 そこで、記事の

      SPF (やDMARC) を突破する攻撃手法、BreakSPF | 朝から昼寝
    • Linux カーネルをバイパスして TCP 通信を 10 倍速くする | IIJ Engineers Blog

      【IIJ 2023 TECHアドベントカレンダー 12/16の記事です】 この記事について 背景:TCP はコンピュータネットワークの通信において広く利用されているプロトコル・標準化された通信規格です。コンピュータは TCP/IP スタックと呼ばれるようなソフトウェアを実行することで、定められた規格に則って通信を行います。汎用 OS 環境では、TCP/IP スタックは多くの場合、カーネル空間に OS 機能の一部として実装されています。 課題:通信に関するソフトウェアの研究コミュニティでは、そのようなカーネル空間に実装されている TCP/IP スタックは、近年の高速な NIC の性能を十分に引き出すことが難しいという課題が指摘されてきました。 テクニックの紹介:当記事では、近年の研究コミュニティにおいて比較的一般的な高速化テクニックとされている「カーネルをバイパス(迂回)して TCP 通信を

        Linux カーネルをバイパスして TCP 通信を 10 倍速くする | IIJ Engineers Blog
      • 元々は /usr は user の略に決まってるじゃん?ホームディレクトリを置く場所だったんだから - Qiita

        Twitterとか見て「そうだったのかー」とか言うんじゃなくて、ちゃんと調べてみましょうよ。/usr は元々ユーザーのホームディレクトリをおいていた場所ですよ。/bin などを置いていたシステムディスクの容量が足りなくなったので別ディスクだった /usr 以下を使うようになっただけです。Unix System Resources とかそんな長い名前、後付けに決まってるでしょ? 翻訳は面倒なので、DeepL(の少し手直し)です。 初期の Unix のドキュメントから URLと1972年という年から、おそらく Version 1 Unix (1971) のドキュメントだと思います。ここ 経由で見つけました。 12ページにこのようなものがあります。詳細はよくわかりませんがディレクトリ構造でしょう。 idata: / root 41. 140016 .byte 7,1 9f-.-2 41. <..

          元々は /usr は user の略に決まってるじゃん?ホームディレクトリを置く場所だったんだから - Qiita
        • KeyTrap (CVE-2023-50387)を検証してみた - knqyf263's blog

          DNSは趣味でやっているだけですし有識者のレビューを経ているわけでもないので誤りを含むかもしれませんが、DNS界隈には優しい人しかいないのできっと丁寧に指摘してくれるはずです。 追記:めちゃくちゃ丁寧にレビューしていただいたので修正いたしました。森下さんほどの方に細かく見ていただいて恐れ多いです...(学生時代に某幅広合宿で森下さんの発表を見てDNSセキュリティに興味を持った) 4万文字を超える大作、おつかれさまです。わかりやすく書けていると思いました。 ざっと読んで、コメントしてみました。ご参考まで。https://t.co/bVj5WeFHQr https://t.co/ku5NOx6ua8— Yasuhiro Morishita (@OrangeMorishita) 2024年2月19日 要約 背景 詳細 DNSSECとは? DNSSECの可用性 鍵タグの衝突 攻撃内容 SigJam

            KeyTrap (CVE-2023-50387)を検証してみた - knqyf263's blog
          • Amazon Connect + Whisper + GPT-4 Turboで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた | DevelopersIO

            構成 構成としては、下記の通りです。 Connectのフローの詳細は下記の通りです。 例として、発話で住所を認識させる処理の流れは以下のとおりです。 コンタクトフロー内で「メディアストリーミングの開始」ブロックを使って、Kinesis Video Stream(KVS)への音声のストリーミングを開始します。 顧客は、住所を含めた発話をします。 「顧客の入力を保存する」ブロックで、顧客が特定の番号を押すと、ストリーミングを終了します。 「AWS Lambda関数を呼び出す」ブロックを使い、LambdaでKVSからデータを取得します。取得したデータをWAV形式に変換し、Whisper APIで文字起こしします。文字起こし内容から、GPT-4 Turboで住所のみを抽出します。 プロンプト再生で、住所のみを音声出力します。 以下の図は、電話での対話の流れを示しています。 前提 2023年11月時

              Amazon Connect + Whisper + GPT-4 Turboで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた | DevelopersIO
            • React Server Componentsを理解する | POSTD

              私も年を取ったと感じるのは、今年Reactが10年目を迎えたからです。 混乱していた開発コミュニティにReactが初めて紹介されてから10年、以来いくつもの進化を遂げてきました。Reactチームは、急進的な改革ということに関しては躊躇しませんでした。問題に対して、より良い解決策が見つかれば、それを実行してきました。 数か月前、Reactチームは最新のパラダイム・シフトであるReact Server Componentsを発表しました。史上初めて、Reactコンポーネントがサーバーでのみ実行できるようになったのです。 このことに関連してオンライン上では、きわめて大きな混乱が起きています。それが何なのか、どのように機能するのか、利点は何か、そしてSSR(Server Side Rendering)などとどのように連携するのか、多くの人が多くの疑問を抱いています。 私はReact Server

                React Server Componentsを理解する | POSTD
              • オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ - Findy Tools

                公開日 2024/05/29更新日 2024/06/06オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ 近年マイクロサービスアーキテクチャの普及やクラウドネイティブの普及が進み、システムの複雑性は増す一方です。システムの動作を正確に把握することはますます困難になっており、そのような状況の中で、オブザーバビリティはシステムを安定的に運用するために必要不可欠な要素になってきています。 そして、オブザーバビリティの重要性の認知が高まるにつれて、多くの企業でオブザーバビリティに関するツールの導入も進み始めています。 そのような潮流の中、オブザーバビリティ分野でさらなる大きな可能性を持つプロジェクトがOpenTelemetryになります。 本記事では、OpenTelemetryとは一体どんなものなのか、そして実際にOpenTelemetryの導入・活用に成功し

                  オブザーバビリティの最前線 OpenTelemetryで下げる認知負荷~活用事例4選~ - Findy Tools
                • 意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer

                  Manningから出版予定の『AI-Powered Search』(AIを活用した情報検索の意)を冬休み中に読んでいたら、その中で意味的知識グラフ(Semantic Knowledge Graph)と呼ばれるデータ構造について説明していて、関連語の計算やクエリ拡張などに使えるということで興味深かったので紹介しようと思います。最初に意味的知識グラフについて説明したあと、日本語のデータセットに対して試してみます。 AI-Powered Search(https://www.manning.com/books/ai-powered-search) 本記事の構成は以下のとおりです。 意味的知識グラフとは 意味的知識グラフを用いた関連語の計算 参考資料 意味的知識グラフとは 知識グラフと聞くと、固有表現認識や関係抽出、OpenIEを使って構築するグラフを思い浮かべる方もいると思うのですが、意味的知識

                    意味的知識グラフとApache Solrを使った関連語検索の実装 - Ahogrammer
                  • フロントエンドパフォーマンスのチェックリスト2021年版(PDF、Apple Pages、MS Word)-後編 | POSTD

                    目次# 前編 準備段階:計画と指標 パフォーマンスを重視する文化、Core Web Vitals、パフォーマンスのプロファイル、CrUX、Lighthouse、FID、TTI、CLS、端末。 現実的な目標の設定 パフォーマンスバジェット、パフォーマンス目標、RAILフレームワーク、170KB/30KBバジェット。 環境の定義 フレームワークの選択、パフォーマンスコストの基準設定、Webpack、依存関係、CDN、フロントエンドアーキテクチャ、CSR、SSR、CSR + SSR、静的レンダリング、プリレンダリング、PRPLパターン。 中編 アセットの最適化 Brotli、AVIF、WebP、レスポンシブ画像、AV1、アダプティブメディア読み込み、動画圧縮、Webフォント、Googleフォント。 ビルドの最適化 JavaScriptモジュール、モジュール/ノーモジュールのパターン、ツリーシェイ

                      フロントエンドパフォーマンスのチェックリスト2021年版(PDF、Apple Pages、MS Word)-後編 | POSTD
                    • 新規プロダクトの開発に Nuxt 3 を採用して良かったこと - ANDPAD Tech Blog

                      ANDPADフロントエンドエンジニアの小泉です。 昨年の夏頃、担当したプロダクトで新規リポジトリでの開発を立ち上げる機会があり、Nuxt 3 を用いて構築を行いました。 アップデートではなく新規で Nuxt 3 サイトを構築するのは業務としては初めての経験だったのですが、Vue 3・Nuxt 3 の様々な機能によって、型安全な状態を保ったまま快適な開発を進められ、かつ3ページの全体実装を約7営業日で形にすることができました。 この記事では、「いま新規サービスのゼロからの立ち上げにNuxt 3を選択するとどんな嬉しいポイントがあるのか」という実例をご紹介できればと思います。 担当したプロダクトについて ANDPAD資料承認 | 製品のご紹介 2023年10月にリリースされた「ANDPAD資料承認」という、資料の申請・承認を一元管理する機能のフロントエンド開発を担当しました。 ただし、紹介サイ

                        新規プロダクトの開発に Nuxt 3 を採用して良かったこと - ANDPAD Tech Blog
                      • 2023年のコンパイル時レイトレーシング - in neuro

                        これは qiita.com の12/16の記事です。やばいもう16日が終わってしまう! はじめに 太古の昔、あるC++プログラマ*1がtemplateの再帰と特殊化を使ってコンパイル時に計算ができることを「発見」*2*3したその日から、C++とコンパイル時計算は分かちがたく結びついています。 言語機能を本来意図されていなかった方法で活用する曲芸的な技巧だったコンパイル時計算は、その強力さを買われコミュニティを席巻し、C++11での constexpr の導入によりある意味で公式に認められたものとなりました。 導入当初は return 文一つだけしか持てなかった constexpr 関数は、それでも三項演算子による条件分岐や再帰によってコンパイル時計算を大いに盛り上げました。 そしてC++14で条件分岐、ループ、変数の書き換えが、C++17ではラムダが、C++20では仮想関数と動的メモリ確保

                          2023年のコンパイル時レイトレーシング - in neuro
                        • デジタル復調の学習を目的として、ワンセグチューナーで地デジのフルセグTSを抜く - Qiita

                          お詫びと訂正 タイトルにて「ワンセグチューナー」と表記しておりますが、正しくは「ワンセグチューナーの技術を応用したSDR受信機」となります。お詫びして訂正いたします。 本題 さて、茶番はこのあたりにして(今回は使わなかったと言うだけで、本物の「ワンセグチューナー」でもフルセグを受信できるはずなので、あながちタイトが誤っているというわけではないのですが、茶番をやりたいための茶番でした)。 今回はデジタル変調の復調を学習することを目的としているので、それ以外の部分(例えば受信機のハードウェアや、リードソロモン誤り訂正のような情報理論的分野)には触れません。また、限定受信を目的としたスクランブルの解除や映像の復号にも一切触れません。一方で、海外の人が作ったGNU Radioのソースコードをコピペして「受信したよ!」と言っても学習という意味では全く意味がありませんから、ISDB-Tの復調に関しては

                            デジタル復調の学習を目的として、ワンセグチューナーで地デジのフルセグTSを抜く - Qiita
                          • GPT-4 Turboにドキュメントのチャンク分けを任せてみる - EXPLAZA Tech Blog

                            はじめに こんにちは、LLM Advent Calendar 2023 4日目の記事を担当する_mkazutakaです。よろしくお願いします。 LLM Advent CalendarといってもRAGの話になりますが、ご容赦ください。 企業独自のデータを使ってLLMからの出力を制御する際には、検索拡張生成(いわゆるRAG)が使われます。 RAGの実装方法としては、「PDFからドキュメント情報を読み取り検索エンジンに保存」「ユーザの入力する質問文から関連するドキュメントを検索エンジンから取得」「取得したものをコンテキストとしてプロンプトに含める」という流れが一般的だと思います。 この際、RAGの課題の一つでもあるのですが、検索結果から取得するドキュメントのサイズ(いわゆるチャンクサイズ)をどれぐらいのものにするかというものがあります。チャンクサイズが小さすぎるとLLMは関連するコンテキストから

                              GPT-4 Turboにドキュメントのチャンク分けを任せてみる - EXPLAZA Tech Blog
                            • SDDLで学ぶWindowsのアクセス制御 - ラック・セキュリティごった煮ブログ

                              北原です。 今回は、Windows OSを守るセキュリティ機能の中でも重要な役割を担う、アクセス制御に関する話題を解説します。 UnixやLinuxでは「Everything is a file」と言われていますが、Windows OSではファイルやプロセスをはじめとする全てのものがオブジェクトとして管理されており、それぞれが ACL(Access Control List:アクセス制御リスト) によりアクセス制御されています。 ACLは、アカウントに与えているアクセス権限を個別に定義した ACE(Access Control Entry:アクセス制御エントリ) と呼ばれる情報のリストです。 例えば、Windows OSでファイルのプロパティを開くと、以下の図のようにACLが視覚的に確認できます。 DACLの確認例 ファイルやディレクトリなどでは、Windows OS標準の機能でこのように

                                SDDLで学ぶWindowsのアクセス制御 - ラック・セキュリティごった煮ブログ
                              • Referrer-Policy の制限を強めると安全になるという誤解 | blog.jxck.io

                                Intro Referrer-Policy は、送信される Referer の値を制御することが可能だ。 このヘッダの副次的な効果をよく理解していないと、「no-referrer にして送らないのが最も安全だ」という誤解を生むことになる。 では、複数あるポリシーの中でどのような観点で、どのディレクティブを採用するのが良いのだろうか? 前提として前回の記事の「リクエストの出自をチェックすることは現代の実装のベースプラクティスである」という点を踏まえて考えてみる。 令和時代の API 実装のベースプラクティスと CSRF 対策 | blog.jxck.io https://blog.jxck.io/entries/2024-04-26/csrf.html Referer とアナリティクス Referer は、リクエストに対してその前のページの URL を送るところから始まった。 GET / H

                                  Referrer-Policy の制限を強めると安全になるという誤解 | blog.jxck.io
                                • Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ - LayerX エンジニアブログ

                                  はじめに こんにちは。バクラク事業部 機械学習チームの機械学習エンジニアの上川(@kamikawa)です。 バクラクではAI-OCRという機能を用いて、請求書や領収書をはじめとする書類にOCRを実行し、書類日付や支払い金額などの項目内容をサジェストすることで、お客様が手入力する手間を省いています。 書類から特定の項目を抽出する方法は、自然言語処理や画像認識、近年はマルチモーダルな手法などたくさんあるのですが、今回は項目抽出のための物体検出モデルを構築するまでの手順について紹介します。 Document Layout Analysisとは Document Layout Analysisとは、文書のレイアウトを解析するタスク(直訳)のことを指します。具体的には、文書内のさまざまな要素(例えば、テキスト、画像、表、見出し、段落など)を抽出し、それぞれの位置や意味などを明らかにすることを目的とし

                                    Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ - LayerX エンジニアブログ
                                  • 生成AI と Wikipedia記事 で 子供向けお仕事提案bot を作ってみよう(Azure OpenAI + RAG) - ENGINEERING BLOG ドコモ開発者ブログ

                                    NTT コノキューに出向中の澤山です。 今年の7月にドコモから、コノキューにやってきました。 この記事は、NTTドコモ アドベントカレンダー2023 21日目の記事です。 この記事では、Wikipedia記事 と Azure OpenAI API、既存のモデルの3つを用い、RAG(Retrieval-Augmented Generation)のためのデータ作成と、RAGを活用した子ども向けお仕事提案botを作ります。 (記事の情報は2023/11月のものです。) 生成AI / ChatGPT の大流行 子供のための、生成AI活用方法、ってある? 子供向けお仕事提案チャットボットを作ってみる 全体像 ステップ1 Wikipedia + Azure OpenAI service でお仕事情報をまとめよう Wikipedia 記事からのお仕事情報・概要の抽出 お仕事情報・概要に基づく、情報の整理

                                      生成AI と Wikipedia記事 で 子供向けお仕事提案bot を作ってみよう(Azure OpenAI + RAG) - ENGINEERING BLOG ドコモ開発者ブログ
                                    • UnityのWebGLアプリ開発における"使えないライブラリ問題"の回避策 - Gaudiy Tech Blog

                                      ファンと共に時代を進める、Web3スタートアップのGaudiyでUnityエンジニアをしているくりやま(@xamel7)です。 Gaudiyでは"Gaudiy Fanlink"というブロックチェーンや生成AIなどの技術を活用したファンプラットフォームで、漫画、アニメ、アイドルといったIP(知的財産コンテンツ)独自のコミュニティの開発・運営をしています。 service.gaudiy.com このFanlinkの一機能として、現在、新たに開発を進めているのがIPのカジュアルゲームです。 「GANMA!コミュニティ」で先日公開されたカジュアルゲーム ▼登録不要で遊べます ganma-community.com WebサービスであるFanlinkとの連携が必要なこともあり、GaudiyのUnityチームではWebGLビルドによるアプリケーション開発を行っています。 WebGLビルドは、スタンドア

                                        UnityのWebGLアプリ開発における"使えないライブラリ問題"の回避策 - Gaudiy Tech Blog
                                      • いい塩梅を目指したデザインエンジニアによるフロントエンド設計 - estie inside blog

                                        こんにちは。ひらやまです。 今回は、これまでフロントエンド環境を作ったり、運用したり、設計のアドバイスをしたりしてきた私がひとまずたどり着いた、このくらいの塩梅の設計が良いのではないかと考えている一つの案をみなさんに共有しようと思います。 フロントエンド設計の必要性 フロントエンドは JSON 色づけ係と言われることもありますが、ただ JSON をきれいにしてユーザに見せる以上の難しさを感じることもあるのではないでしょうか。 実装を完遂するために必要となるスキルが広いため、様々なバックグラウンドを持つ人がコードを書くことになりやすいです。フロントエンドエンジニアと呼ばれる人も、私みたいにマークアップエンジニアからフロントエンド領域に手を伸ばした人もいれば、デザイナーやバックエンドエンジニアなどの領域からこの環境に挑戦される方もいらっしゃいます。 このような様々な背景を持つ人たちが一つのコー

                                          いい塩梅を目指したデザインエンジニアによるフロントエンド設計 - estie inside blog
                                        • Geminiの技術レポートを読み解く〜生成AIの最前線|Ray | 旅する魔法使い

                                          Google DeepMindから次世代のマルチモーダル生成AI「Gemini」が発表されました。「GPT-4を圧倒」や「人間の専門家を超えた」などの華々しい評価が発表され、驚くようなデモ動画も公開されました。 断片的な情報が飛び交う中、しっかりと技術レポートを読み解いてみます。 どんな生成AIモデル? 定量的な評価は? 具体例は? Gemini - Technical Report はじめに革新的な技術が登場したとき、技術レポートや論文をしっかりと読むことが、急がば回れの近道です。華々しいデモ動画や断片的な二次情報の記事を読んでも、表層的な情報に踊らされて、技術の真の姿を読み解くことはできません。 Geminiに関しては、オープンソースではなく論文もありませんが、技術レポートが公開されています。しかし、60ページの大作であり、英語で書かれているため、多くの人が読むのをためらうでしょう。

                                            Geminiの技術レポートを読み解く〜生成AIの最前線|Ray | 旅する魔法使い
                                          • [翻訳] プラットフォームではなくプロトコルを: 言論の自由への技術的アプローチ

                                            この記事はProtocols, Not Platforms: A Technological Approach to Free Speech | Knight First Amendment InstituteをDeepLによって翻訳、加筆修正したものである。元のページは2024/04/21に参照した。 言論の自由を促進するために、インターネットの経済的・デジタル的インフラを変更する 著:マイク・マスニック 2019年8月21日 FREE SPEECH FUTURES デジタル時代の憲法修正第1条を再考するエッセイ・シリーズ より多くの言論を可能にし、思想の市場を改善する方法として、インターネットやソーシャルメディアに賛成する一般的な感情が10年ほど続いた後、ここ数年で見方は劇的に変化した。これらのプラットフォームが荒らしや偏見、憎悪の巣窟になっていると感じている人もいる。[1]一方で、こ

                                              [翻訳] プラットフォームではなくプロトコルを: 言論の自由への技術的アプローチ
                                            • URL圧縮サイトを作ってみた

                                              今回の例では + と . が特殊文字なので、それぞれ .E と .G に置換します。 .E57TE27ZJ.G2 バージョン番号をつける あとで仕様を変更したくなったときのためにバージョン番号を振っておきます。 バージョン 0 が現在のバージョンです。 0.E57TE27ZJ.G2 URLの形式に整形する 圧縮URLを知らない読み取り機のために、URLの形に整形します。 HTTPS://C.SHOGO82148.COM/0.E57TE27ZJ.G2 FAQ 誰から聞かれたわけでもないけど、たぶん聞かれそうな質問に答えておきます。 「圧縮」と言っておきながら、URL長くなってるよね? はい。 ASCII文字列で表現したときの文字数は長くなります。 しかしQRコードには「英数字モード」が存在し、一文字をより短いビット数で表現できます。 ASCII文字列をQRコードに変換するには8ビット必要です

                                              • Next.js App Router で route 毎に Cache-Control を任意に指定したいときは middleware を使う(今のところ)

                                                App Router でトラディショナルな動的 SSR 既存〜今後のコンポーネントの互換性を踏まえて React を前提とし、フレームワークの分散を抑制するため Next.js を選び、多少の冒険ではあったが App Router での開発にトライしています。 今後は現在 Ruby on Rails のモノリシックコードベースで展開されている複数プロダクトを分割し、それぞれを Next.js で水平展開し直していくイメージです。 で、まずは App Router のフルパワー(サバクラに渡る重厚なキャッシュ機構)を要しない、ログインする操作こそあれだページの9割9分が Server Components としてレンダリング可能な領域をリプレース中。 つまり // app/layout.js export const fetchCache = 'default-no-store'; expo

                                                  Next.js App Router で route 毎に Cache-Control を任意に指定したいときは middleware を使う(今のところ)
                                                • SEO分析が加速する「ANATOMY」サイト改善策が瞬時に見える! - ソロ活@自由人BLOG

                                                  SEO分析とか アクセス解析とか 難しくてムリ... Webサイトを運営していると、SEO分析やアクセス解析は避けては通れません。 とは言え、よく分からない専門用語ばかりで、何となく敬遠しがちです。 しかもデータの量も多く、マジメにやるとトンデモなく時間もかかります。何とかならないかな~と、悩んでいる人も多いのではありませんか? こんなあなたに! ✔SEO分析?めんどくさい... ✔アクセス解析する時間がない ✔初心者でも使えるツールを知りたい ✔SEO分析を自動化・効率化したい ✔分析結果の活かし方が分からん... このような悩みを全面解決します。 SEO分析ツールと言えば、Google Search Console(グーグル・サーチ・コンソール)が有名です。自分でWebサイトを運営していて、使っていない人や企業は、ほとんどいないでしょう。 そしてアクセス解析ツールと言えば、Google

                                                    SEO分析が加速する「ANATOMY」サイト改善策が瞬時に見える! - ソロ活@自由人BLOG
                                                  • 生成AIは「お気持ちで規制」/「危害を無視して推進」すべきではない | p2ptk[.]org

                                                    以下の文章は、電子フロンティア財団の「Generative AI Policy Must Be Precise, Careful, and Practical: How to Cut Through the Hype and Spot Potential Risks in New Legislation(生成AI政策は正確・慎重・実践的でなければならない:AI立法における誇大宣伝の見抜き方と潜在リスクの見分け方)」という記事を翻訳したものである。 Electronic Frontier Foundation テクノロジー、エンターテイメント、安全保障の著名人たちが振りまく大げさなレトリックに煽られ、生成AIへの不安はそのテクノロジーの使用と同じ速度で広がり続けている。それぞれに思い描くカタストロフィー――アーティストの死やロボットによる支配など――を食い止めるためには手を打たなければならな

                                                      生成AIは「お気持ちで規制」/「危害を無視して推進」すべきではない | p2ptk[.]org
                                                    • PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball

                                                      プログラミングとプロダクト作りは楽しいよ, っていう「個人開発ネタ」の話です. スポーツ観戦, 具体的には野球のデータ分析DX(Digital transformation)*1を実現しました. 記事の前半はプロダクト企画とアーキテクチャ, 後半はDash(Python)を使ったマルチページ・データ・アプリケーション開発の話となります. TL;DR SpreadsheetとPythonのアプリケーションでいつでもメジャーリーガー(全選手)のパフォーマンスを好きな条件で可視化できるようにしたら野球が面白くなりました. https://example.com/batter/ohtani-shohei/2024-03-20/2024-04-28?cache=false みたいなURLを開くと, オオタニサンのパフォーマンス(現地時間2024/4/28までの数字) 以下の成績をいい感じにグラフ・可

                                                        PythonとGoogle Cloud, Spreadsheetで「自分のためのスポーツ観戦DX」をプロダクト化して実現した話. - Lean Baseball
                                                      • ChatGPT x LangChain で独自ドキュメントのベクターストア検索をチューニングする - GMOインターネットグループ グループ研究開発本部

                                                        D.Mです。 ChatGPT を開発の現場で活かしていくためにベクターストア活用の方法を検証しました。 結論ファースト A. ベクターストアに入れる元ネタドキュメントの抽出 ⇒ unstructured が使えるかも B. ベクターストアに入れる元ネタドキュメントのチャンク分け ⇒ タイトル。キーワードをメタデータで付加 C. ベクターストアに投げる質問プロンプトの最適化 ⇒ 形態素またはキーワード抽出でプロンプトを精査 D. ベクターストア検索結果の精査 ⇒ ContextualCompressionRetriever による検索結果要約とDocumentCompressorPipeline による検索結果絞り込みがよさげ 「検索結果が質問に沿ったものか精査させる」タスクをChatGPTに担当してもらうことが私の業務課題には適しているのではという気付きがありました。 E. (おまけ)ベク

                                                          ChatGPT x LangChain で独自ドキュメントのベクターストア検索をチューニングする - GMOインターネットグループ グループ研究開発本部
                                                        • Common Crawlから作る大規模日本語コーパスとその前処理(Mixtral 8x7Bを語彙拡張継続事前学習 Part2) - ABEJA Tech Blog

                                                          ABEJAでデータサイエンティストをしている服部です。 ABEJAは国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)が公募した「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発」に当社提案の「LLMの社会実装に向けた特化型モデルの元となる汎化的LLM」に採択されたことを受け、LLMの事前学習を実施しました。 その中でモデルの学習だけでなく、学習に欠かせない大規模日本語言語コーパスを作りました。データセットのサイズとしては、語彙拡張前のMixtral Tokenizerで約400Bほどのものです。 特にその中で大部分を占めるCommon Crawlをベースとしてデータセットを作った過程について解説します。 データセットの概要 Common Crawlについて warcとwet データセット作成方針 前処理の流れ 1. 日本語の簡易判定、w

                                                            Common Crawlから作る大規模日本語コーパスとその前処理(Mixtral 8x7Bを語彙拡張継続事前学習 Part2) - ABEJA Tech Blog
                                                          • 【metafor】メタ解析におけるフォレストプロット解析のやり方【メタ解析】 - LabCode

                                                            macOS Monterey (12.4), Quad-Core Intel Core i7, Memory 32GB metafor 4.2-0 メタ解析のための統計知識 メタ解析におけるフォレストプロットを学ぶ前に、いくつかの基本的な統計知識を理解しておくことが大切です。これらの用語や概念は、初めて耳にすると少し難しく感じるかもしれません。「そんなものなのだな〜」という程度で収めておくで大丈夫です。 メタ解析のポイント メタ分析を進めるには、全ての研究から「効果量」を明確に特定しなければなりません。効果量とは、研究の結果の大きさや重要性を示す数値のことを指します。時々、この数値は研究の論文から直接取り出すことができますが、大抵の場合、報告された他のデータからこの数値を計算する必要があります。 この効果量の計算は、メタ分析の最終結果とそのどれだけ解釈できるかに大きな影響を与える可能性があ

                                                            • スキーマ マークアップの重要性: エンティティとの関係 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ

                                                              【メールマガジンのご案内】 SEOに役立つ記事の更新やセミナーのご案内をメールマガジンで行っております。 ぜひご登録ください。 メールマガジンに登録する>> この記事は、Backlinkoの「Schema Markup Guide: Help Search Engines Help You」の翻訳記事になります。ウェブページに追加するスキーママークアップ(構造化データ)の重要性とその方法について解説しています。 スキーママークアップは、検索エンジンにコンテンツの内容を明確に伝え、適切な検索結果に表示させるためのコードです。スキーママークアップがSEOにどのように役立つか、エンティティ(実体)との関連性などについて紹介しています。 また、スキーママークアップの種類や、それをウェブサイトに適用する方法についても詳しく説明しています。 スキーマ マークアップは、コンテンツの内容を検索エンジンに伝

                                                                スキーマ マークアップの重要性: エンティティとの関係 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ
                                                              • 3分プロトタイピング: ベクトルデータベース超入門 - ROUTE06 Tech Blog

                                                                連載「3分プロトタイピング」 Streamlitを用いたAIチャットアプリ RAGを使ってAIチャットアプリケーションに知識を与える ベクトルデータベース超入門(この記事です) 前回、前々回とAIアプリケーションのプロトタイプを作る時に便利な2つのフレームワーク: StreamlitとLlamaIndexを紹介しました。 この記事では、本格的なAIアプリケーションを作成するときに必要になることの多い、ベクトルデータベースを紹介します。今回も説明が長くなりますが、コード部分は3分で試せることを目指しています! ベクトルデータベース、ベクトル検索とは ベクトルデータベースとはどのような技術か、AWSのドキュメントがわかりやすく説明しているので引用します。 ベクトルデータベースは、ベクトルを高次元の点として保存および取得する機能を提供します。 これらには、N 次元空間の最も近い近傍を効率的かつ高

                                                                  3分プロトタイピング: ベクトルデータベース超入門 - ROUTE06 Tech Blog
                                                                • グルーレコードについて改めて考える ~ランチのおともにDNS~

                                                                  グルーレコードについて改めて考える ~ランチのおともにDNS~ 2023年11月21日 Internet Week 2023 ランチタイムセミナー 株式会社日本レジストリサービス(JPRS) 森下 泰宏・礒浪 直生 Copyright © 2023 株式会社日本レジストリサービス 1 今年も現地で、ランチのおともにDNS! • 今年のInternet Weekは、オンラインWeekとカンファレンス Weekの2本立てで開催されています • 今年のランチタイムセミナーはカンファレンスWeekのプログラ ムの一つとして、現地開催となりました! • ご参加のみなさまに、ランチをご提供しております! Copyright © 2023 株式会社日本レジストリサービス 2 講師自己紹介 • 森下 泰宏(もりした やすひろ) – 所属:JPRS 技術広報担当・技術研修センター – 主な業務内容:技術広報

                                                                  • サーバーサイドの画像編集処理でメモリ使用量を抑える方法 ​ | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]

                                                                    株式会社ラクーンホールディングスのエンジニア/デザイナーから技術情報をはじめ、世の中のためになることや社内のことなどを発信してます。 こんにちは、開発チームの山下です。 業務ではスーパーデリバリーの開発を担当しています。 ​ 今回は私がスーパーデリバリーの開発で関わったサーバーサイドにおける画像編集処理でメモリ不足を防ぐノウハウを共有したいと思います。スーパーデリバリーではユーザーが任意の画像をアップロードできる機能があるため、まれに想定以上の高解像度画像が処理されてサーバーが Out Of Memory エラーを発生させることがありました。 そこで私が任されたタスクが「画像編集処理でメモリ不足を避けるために、バリデーションを追加する」です。 TL;DR サーバーサイドでの画像編集はメモリ使用量が高い操作です。 なぜなら処理される画像データはメモリ上に非圧縮のビットマップとして展開されるた

                                                                      サーバーサイドの画像編集処理でメモリ使用量を抑える方法 ​ | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]
                                                                    • デザインファイルにおける命名規則を策定した話【Figma】|三上蒼太 / Sota Mikami

                                                                      こんにちは、ほぼフルタイムのフリーランスとして株式会社mikanでデザイナーをしています、三上蒼太(@sota_mikami)です。 英語アプリmikanは、もうすぐ10歳になる長寿アプリです。アプリ自体はシンプルさを保ち続けていますが、多くの実験が積み重ねられてきた歴史があります。 ただその歴史ゆえに古い画面のデザインデータが一部なかったり、設計意図や当時の背景がわからず評価の難しい画面があったりと、デザインデータと意図を管理するための標準化が一つの重要な課題となっていました。 今回は、その一環としてmikanにおけるデザインデータの命名規則を策定した話を記録します。 なぜ命名規則を作ったのか?デザインファイルにおける命名規則を策定するのは、チーム内での共通認識を高めて効率的なコミュニケーションを図ることが目的です。 命名規則がないと、デザイナーごとに異なる命名が行われ、他のメンバーがフ

                                                                        デザインファイルにおける命名規則を策定した話【Figma】|三上蒼太 / Sota Mikami
                                                                      • Googleの新ガイドライン対応だけで終わらせない:5分で構築する自前のレポート分析ツールでDMARCを正しく運用 - asoview! Tech Blog

                                                                        アソビュー株式会社VPoEの @tkyshat です。 はじめに この記事は、以下の方々を対象にしています: メールのセキュリティについてかいつまんで知りたい方 DMARCをまだ設定できていない方 DMARCの設定はしたもののポリシーがnoneのままの方 DMARCの設定はしているがレポートをうまく活用できていない方 すでにDMARCの設定が完了し、レポートのモニタリングもできており、BIMI認証まで完了している方には物足りないかもしれません。 ブログの中で簡易的なものではありますが、5分でできるレポート分析ツールの構築方法も紹介しておりますので、ぜひ参考にしていただければと思います。 背景と目的 Googleが2023年10月に発表したGmailの新ガイドラインは、5000件以上のメールを送信する企業に対する要求が強化され、2024年2月以降にガイドラインに従っていないメールは配信されな

                                                                          Googleの新ガイドライン対応だけで終わらせない:5分で構築する自前のレポート分析ツールでDMARCを正しく運用 - asoview! Tech Blog
                                                                        • データ部の小話という取り組みでプロンプトエンジニアリングについて共有した話 - ANDPAD Tech Blog

                                                                          こんにちは!データ部でデータエンジニア&MLエンジニアをしている谷澤です。 データ部には小話という仕組みがあり、チームメンバーが持ち回りで自由なテーマについて30分の発表を隔週で行っています。 他メンバーが興味を持っていることを知れたりプレゼンの練習ができるよい機会であり個人的に好きな制度です。 今回はその小話で共有した内容をベースに記事を作成しています。 はじめに 最近プライベートのプログラミングでChatGPTを利用しているのですが、入力によって回答の良さが変わるという現象に直面し、良い出力を得るための方法が気になり調査を行いました。 A Survey of Large Language Models1という論文の8章に知りたい内容がまとめられていたため、該当部分を翻訳したものに加え、実際に試した結果を共有いたします。 実例として、BigQueryの設定を変更するプログラムを作成したと

                                                                            データ部の小話という取り組みでプロンプトエンジニアリングについて共有した話 - ANDPAD Tech Blog
                                                                          • CloudShell VPC environment から VPC内のEC2インスタンスやRDS DBインスタンスに接続してみた | DevelopersIO

                                                                            CloudShell VPC environment から VPC内のEC2インスタンスやRDS DBインスタンスに接続してみた もっと簡単にVPC内のリソースにアクセスしたい こんにちは、のんピ(@non____97)です。 皆さんはもっと簡単にVPC内のリソースにアクセスしたいと思ったことはありますか? 私はあります。 VPC上のRDS DBインスタンスやRedisクラスターなどのリソースに接続したい場合、Site-to-Site VPNやClient VPN、Direct Connectがなければ踏み台が必要になります。 踏み台へのアクセス方法は以下のようなものがあります。 直接SSH SSMセッションマネージャー EC2 Instance Connect SSMセッションマネージャーとEC2 Instance Connectについては以下記事をご覧ください。 しかし、上述のいずれの

                                                                              CloudShell VPC environment から VPC内のEC2インスタンスやRDS DBインスタンスに接続してみた | DevelopersIO
                                                                            • お一人様でも寂しくない! RustとChatGPTで分散SNS上に話し相手を作る - asoview! Tech Blog

                                                                              こんにちは、皆さん。アソビュー! Advent Calendar 2023の10日目(B面)です。 11月にアソビューにジョインしました竹村です。今日は、私が最近趣味で作成した、RustとChatGPTを使用したチャットボットの開発についてお話しします。なぜこの二つの技術に焦点を当てたのかというと、Rustの堅牢なメモリ管理と高いパフォーマンス、そしてChatGPTの自然な会話能力に魅力を感じたからです。両者を組み合わせることで、お一人様用の分散SNS上で話し相手になってもらえるのか、その可能性を模索していきたいと思います。 この記事では、RustとChatGPTの選択理由、開発プロセスの紹介、そして開発中に直面した課題とその解決策について詳しく説明していきます。開発を通じての学びや発見も共有できればと思います。 Rustの紹介 Rustは、安全性、速度、並行性を重視したシステムプログラミ

                                                                                お一人様でも寂しくない! RustとChatGPTで分散SNS上に話し相手を作る - asoview! Tech Blog
                                                                              • ChatGPT時代に必要かも!? Pythonで実行するファイルパース(HTML編) | DevelopersIO

                                                                                コアとしては、GPL 3ライセンスではhtml2text、trafilatura、それ以外のライセンスでは、BeautifulSoup4、unstructured(lxml)、Readability.jsが挙げられます。 ラッパーを含みで一つずつ動かしてみたいと思います。 試してみた 準備 pip install llama-index html2text trafilatura langchain unstructured requests pip install git+https://github.com/alan-turing-institute/ReadabiliPy.git@master#egg=readabilipy readabilipyは、pip install readabilipyで入るバージョン0.2.0がWindowsの文字コードに対応できていなかったので、git

                                                                                  ChatGPT時代に必要かも!? Pythonで実行するファイルパース(HTML編) | DevelopersIO
                                                                                • デザイントークンの効果的な命名方法|トビ / KazuhiroTobita

                                                                                  サイボウズでkintoneのデザインシステム開発をしているトビ(@0b1tk)です。こんにちは。 今回はデザイントークン、特にセマンティックトークンの命名方法について掘り下げます。 まずはデザイントークンの定義について、W3Cから設立されたデザイントークンの仕様策定をするコミュニティ「Design Tokens Community Group」の定義を引用いたします。 Design tokens are indivisible pieces of a design system such as colors, spacing, typography scale. (訳:デザイン・トークンとは、色、スペーシング、タイポグラフィ・スケールなど、デザインシステムを構成する不可分の要素のことである) Design Tokens Community Group このデザイントークンの名前づけについて

                                                                                    デザイントークンの効果的な命名方法|トビ / KazuhiroTobita