タグ

あとで読むに関するbeeworksのブックマーク (1,058)

  • LLMの用途はチャットボットや検索にとどまらず——エンプラ系アプリの可能性を広げるエンベディングとは - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

    Image credit: LlamaIndex 大規模言語モデル(LLM)の人気が高まるにつれ、さまざまなデータタイプの特徴を数値表現に圧縮する深層学習システム「エンベディングモデル」にも関心が集まっている。 エンベディングモデルは、企業向けの LLM の重要なアプリケーションの1つである検索拡張世代(RAG)の重要なコンポーネントの1つである。しかし、エンベディングモデルの可能性は、現在の RAG アプリケーションにとどまらない。この1年、エンベディングアプリケーションは目覚ましい進歩を遂げた。 エンベディングの仕組み エンベディングの基的な考え方は、画像やテキスト文書などのデータの一部を、その最も重要な特徴を表す数値のリストに変換することだ。エンベディングモデルは、異なるタイプのデータを見分けることができる最も関連性の高い特徴を学習するために、大規模なデータセットで学習される。 例

    LLMの用途はチャットボットや検索にとどまらず——エンプラ系アプリの可能性を広げるエンベディングとは - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
  • LlamaIndexを使ってローカル環境でRAGを実行する方法 - 電通総研 テックブログ

    こんにちは。電通総研コーポレート部システム推進部の山下です。 最近はChatGPTなどのLarge Language Model(LLM)を利用したAIが話題ですね。 そのLLMを応用したRetrieval-Augmented Generation(RAG)という技術があります。 これは、LLMに文書検索などを用いて関連する情報を与えて回答させることで、 LLMが知識として持っていない内容を回答させたり誤った情報を答えてしまうハルシネーションを抑止する技術です。 今回はこのRAGをLlamaIndexというライブラリを使ってローカル環境で実装する方法について紹介します。 なぜローカル環境でLLMを利用したいのか 大変便利なツールのLLMですが、利用が難しいこともあります。 例えば、機密情報を取扱いたい、外部インターネットへの接続に制限が掛かっているといった場合です。 最終的にOpenAI

    LlamaIndexを使ってローカル環境でRAGを実行する方法 - 電通総研 テックブログ
  • PlaywrightによるE2Eテスト自動化を導入したので各種構成とtipsをご紹介

    株式会社シャペロンのsrkwです。 シャペロンでは昨年、Playwrightを使ったE2Eテストによる各種機能の検証の自動化を導入しました。 E2Eテスト導入の背景や、チームへの浸透に向けた取り組みと反省等については別の記事で紹介しているので、興味のある方はこちらも併せてご覧ください。 この記事では、シャペロンの日次のE2Eテスト実行を支えるインフラ構成と、PlaywrightによるE2Eテスト導入によって溜まったtipsをご紹介したいと思います。同じようにPlaywrightを使ったE2Eテスト導入を検討している、あるいは導入済みで格闘している方にとって、少しでもお役に立てると嬉しいです。 日次のE2Eテスト実行を支えるインフラ構成 前提:Shaperonのテナント構成 シャペロンは製薬企業向けのコミュニケーション用SaaS、Shaperonを提供しており、Shaperonは利用テナント

    PlaywrightによるE2Eテスト自動化を導入したので各種構成とtipsをご紹介
  • チーム開発を加速するテストの育て方

    テストを書いてないというチームには色々理由があると思いますが、「何をテストすべきかわからない」「書き方がわからない」「どのくらいメリットがあるかわからない」という意見は多いのではないでしょうか?テスティングフレームワークの選定や使い方を学ぶのは重要ですが、それ以上にテストの目的や戦略を学ぶことが重要です。チーム開発においてテストを活かすのは相応の知識とスキルが必要になりますが、活かせればテストは開発スピードを維持・促進する飛び道具になり得ます。 稿は筆者が取り組んで実際に高いチーム満足度と速度を得られた、テスト戦略についてまとめたものです。

    チーム開発を加速するテストの育て方
  • 本当は教えたくない、VScode拡張の最強プログラミングアシスタントAI Phind(導入・使い方) - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? みなさんプログラムは書いていますでしょうか。この一年でChatGPTができ、CopilotにCopilot Chatなど色々なAIツールが出ていますが今回お勧めするのはPhindというAIアシスタントです。 Phindとは Phind(Phind.com)とは端的にいえばGPT-4を超えるコーディング能力に特化した言語AIです 参考リンク:大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る リンク内で言われているように、WebからChatGPTGoogleのように簡単に使うことができますが、Phindの真髄はここで

    本当は教えたくない、VScode拡張の最強プログラミングアシスタントAI Phind(導入・使い方) - Qiita
  • 【TinyLlama-1.1B】わずか1.1Bの高性能な超小型版Llama 2を使ってみた | WEEL

    WEELメディア事業部LLMリサーチャーの中田です。 シンガポールの大学のNLP研究チームが、Llamaのコンパクトバージョン「TinyLlama-1.1B-Chat-v1.0」を公開しました。 このLLMでは、Llama 2と同じアーキテクチャとトークナイザーを採用していますが、Llama 2よりも軽量であるため、メモリを節約しつつ高速に文章をできるんです…! HuggingFaceでのモデルダウンロード数は、すでに8900を超えており、多くの人にすでに利用されていることが分かります。 この記事ではTinyLlama-1.1B-Chat-v1.0の使い方や、有効性の検証まで行います。記事を熟読することで、TinyLlama-1.1B-Chat-v1.0の凄さを実感し、普通のLlama 2には戻れなくなるでしょう。 ぜひ、最後までご覧ください。 TinyLlama-1.1B-Chat-v

  • GitHubのデータセンターでは、Mac miniを分解して取り出したメイン基板をラックマウントに使っている

    GitHubのデータセンターでは、Mac miniを分解して取り出したメイン基板をラックマウントに使っている GitHubは、コードのビルドやテスト環境などで使えるGitHub-hosted runnerとして、Apple M1チップによる「M1 macOSランナー」を提供しています。 このM1 macOSランナーの実行環境として同社のデータセンターには大量のMac miniが稼働していますが、同社が先月(2023年12月)に公開した動画によると、この大量のMac miniはラックマウントのために分解されてメイン基板が取り出され、専用のシャーシに納められていると説明されています。 GitHubはどのようにしてMac miniをデータセンター内でラックマウントしているのか、動画の内容を紹介しましょう。 Mac miniを分解、メイン基板を専用シャーシに組み込む あるGitHubのオフィス。こ

    GitHubのデータセンターでは、Mac miniを分解して取り出したメイン基板をラックマウントに使っている
  • データビジュアライゼーションとは?デザインする際の重要なポイントを紹介! | DevelopersIO

    こんにちは!アシスタントデザイナーのくぼです! 記事では、データビジュアライゼーションとは?から、デザインする際に注意するべきポイントをご紹介します! データビジュアライゼーションとは「データを分かりやすくする」こと データビジュアライゼーションは、データを理解しやすいよう視覚的に表現することです。重要なのは、見る人がそのデータを正確に読み取れるようにすることです。 具体的には文字と数字で表されるデータを、グラフや図などのチャートで視覚化することを指します。この「視覚化」には、類義語に「可視化」という言葉が存在します。それぞれの意味を見比べてみましょう。 可視化→見えないものを見えるようにすること 視覚化→目に見えない抽象的な事などを、見てわかるような形にして示すこと データビジュアライゼーションにおいては、見えるようにするだけでは不十分で、データの意味や内容を分かりやすく・理解しやすく

    データビジュアライゼーションとは?デザインする際の重要なポイントを紹介! | DevelopersIO
  • 【VBA】ExcelVBAで実現するエビデンスツール - Qiita

    はじめに インフラ系のエンジニアWindowsServerやWebコンソール周りの操作をする際などにエビデンスとして画面のスクリーンショットを撮るといったことは結構定番かなと思います。 自分も新人の頃は「自分の身を守るためにもエビデンスを残すように!」と何度も忠告をうけたなーなんてことを思い出します。 エビデンスの残し方としてはWinshotのようなツールを利用して効率よくとっていくこともありますが、私の周りではExcelシートにべた張りしていく方法がよく用いられてましたね。 Excelエビデンスのメリット Excelシートに貼り付けていくことは以下のようなメリットがあるかと思います。 単一のファイルで管理可能 シートを分けることで、作業単位でエビデンスを記録できる 適宜コメントなどを書き込める(Excelだから) とはいっても、以下のフローを毎回実施するのは面倒です。 記録対象のウィン

    【VBA】ExcelVBAで実現するエビデンスツール - Qiita
  • 外部からいきなりCTOとして就任する時に気をつけていること|BTO

    おはこんばんちは!!尾藤 a.k.a. BTO です。 私は今はオープンロジでCTOをしていますが、オープンロジを含めて今まで4社でCTOをしています。CTOとしての実績と経験を積み重ねてきた結果、今ではある程度開発組織が大きくなった会社からCTOのオファーをいただくことが増えてきました。 いわゆるパラシュート人事というやつです。パラシュート人事は非常に難しく、私が今まで見てきた中でもパフォームしていないマネージャーはほとんどが外部登用でした。逆に現場上がりのマネージャーはうまくワークしており、微妙な人は少数でした。 このように失敗する可能性の高いパラシュート人事で入社する場合は、いろいろ気をつけないといけません。CxOとまではいかずとも、みなさんの中にも転職をきっかけに何らかの責任者としてのポジションを期待されて入社することもあるかと思います。そういった方に私の気をつけていることが参考に

    外部からいきなりCTOとして就任する時に気をつけていること|BTO
  • GitLabよ、この得体のしれないソースコードから、仕様書をつくりたまえ - Qiita

    GitLab Duo Chatを使うと、ソースコードから日語で「仕様書」を書き起こせます 世の中、おかしなことがあるもので、ソースコードだけが目の前にあり、仕様書がない、なんてことがあります。 たとえば、オープンソースのソースコードであったり、ずーっと社内で使われている、だれが書いたかわからないコードであったり・・・。 ソースコードを読めばすべてが分かりますが、いちいち読んでいられないこともあります。 たとえば、このコードは「OOOをやるコード」ということだけでもすぐに確認できれば、全体像を把握するスピードが飛躍的に早くなります。 そう、なんでもかんでも「ゼロから理解」するのは、疲れます。 そんなときに試してみていただきたいのが、「GitLab Duo Chat」。 これを使うと、なんと、ソースコードから仕様書を書き起こすことが、ぱぱっとできてしまいます。しかも日語で。(正式にはきちん

    GitLabよ、この得体のしれないソースコードから、仕様書をつくりたまえ - Qiita
  • @storybook/test-runner を playwright server と実行し VRT する

    はじめに @storybook/test-runner は jest-transformer で storybook の story をテストケースに変換し、playwright で各 story を巡回してテストを実行するソフトウェアです。 @storybook/addon-interactions と story 定義の play メソッドによって story に対してインタラクションを行ったり任意の評価を実行することができます。 @storybook/test-runner は一連の処理の中で実行されるフックを定義することができます。story を訪れた後のフックでスナップショットを取得し、既存のスナップショットとの比較を行うことで VRT が実現できます。 @storybook/test-runner での VRT については @storybook/test-runner の RE

    @storybook/test-runner を playwright server と実行し VRT する
  • 自動テストを健全に保つための2つの取り組み - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? この記事は ソフトウェアテストの小ネタ Advent Calendar 2023 22日目 の記事です。 はじめに MagicPodにプロジェクトのヘルススコアを表示してくれる機能がリリースされていたのはご存じでしょうか。ヘルススコアの数値は毎週更新され、テストが健全に保たれているかの指標を知ることができます。また、ヘルススコアが低い場合はMagicPodがどうするべきかも提示してくれます。 この機能がリリースされてから私たちのチームではスコアを毎週チェックしていますが、平均90以上と比較的良い数値を継続できていました。 ヘルススコア推

    自動テストを健全に保つための2つの取り組み - Qiita
  • Node.js/TypeScriptの特性と現場での活用 - Qiita

    この記事は? @cosmeを運用するistyleでは、業務でNode.jsを積極的に活用しています。私、村田がいるメディア開発グループにおいても積極的に使っており、BFFのような中間層の実現、バッチの処理、API実装、フロントエンドの実行環境などなど使われ方は多岐に渡ります。この記事では、Node.jsの導入を考えている組織や、Node.jsの基を振り返りたいエンジニアに向け言語環境の特性と活用を考えてみます。 Node.jsの特性 Node.jsはサーバー上で動き、ブラウザでJavaScriptが動く機構とは異なります。近年、サーバー開発はもちろん、Next.js, RemixなどのNode.jsを利用する各種フロントエンドフレームワークが、サーバーに処理を寄せる流れになってきていることから、フロント開発者にとってもNode.jsの理解は重要でしょう。高性能なv8エンジンを搭載している

    Node.js/TypeScriptの特性と現場での活用 - Qiita
  • わずか3カ月でロケットエンジン開発、アジャイル開発プラットフォーム | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    2040年に予定されている宇宙旅行の予約を開始した将来宇宙輸送システムは、それに使用する宇宙船のための、日初となる形式のエンジンを開発し燃焼試験を成功させた。驚くべきは、エンジンの開発検討から燃焼試験成功までに要した期間がたったの3カ月ということ。そこには、徹底したアジャイル開発のための独自プラットフォームが活躍していた。 将来宇宙輸送システムは、乗客を乗せて地球軌道を周回するスペースホテルへの送迎をする単段式宇宙往還機の建造を2030年代中に予定している。客船版スペースシャトルといったところだ。そのエンジンは、水素とメタンと酸素の3つの推進剤を使用するトリプロペラント方式というもの。大気圏内ではメタン、大気圏の外では水素と推進剤を使い分けることで、水素燃料タンクを小型化でき宇宙船を軽量化できる。今回の燃焼試験では、ひとつのエンジンで水素とメタンの燃焼モードを5秒ずつ連続的に切り替えるこ

    わずか3カ月でロケットエンジン開発、アジャイル開発プラットフォーム | Forbes JAPAN 公式サイト(フォーブス ジャパン)
  • DevOpsのアプリ開発にも欠かせない「Git」を活用したソースコードのバージョン管理

  • GitHub Copilot全社導入で得られた効果と課題 - RAKUS Developers Blog | ラクス エンジニアブログ

    はじめに こんにちは、技術広報のnobu_msです。 ラクスでは2023年6月からGitHub Copilotを全開発組織に導入し、希望者は申請により全員利用可能となっています。GitHub Copilot導入から5カ月が経過し、利用状況や導入効果のアンケート調査を行いました。 記事では、調査結果を踏まえて下記の内容をご紹介します。 全社導入前の課題とその対応 導入後の利用状況・効果測定 今後の活用に向けた課題と取り組み より詳細な目次はこちらをご覧ください。 はじめに GitHub Copilot導入の目的 全社導入前の課題とその対応 ① セキュリティの担保 当社の情報資産が学習に利用される可能性 他社のコードがサジェストされて著作権を侵害するのではないか? ② 費用対効果 導入後の利用状況・効果測定 コーディング時間短縮の効果 業務品質向上効果 学習・調査効率化効果 エンジニアの業務

    GitHub Copilot全社導入で得られた効果と課題 - RAKUS Developers Blog | ラクス エンジニアブログ
  • 生成AIはソフトウェアの産業革命になるのか

    「Happy Elements Advent Calendar 2023」 12月24日の記事です。 はじめに Happy Elements株式会社 カカリアスタジオの新規タイトル開発チームで働いているryoooです。新規開発と並行して社内ツールの開発も担当しています。 今年の春にGPT4に触れてから(日ディープラーニング協会の)E資格を取得したり、LLMで自動でissueからPull requestを作成するGitHubアクションを書いてみたり、LLMによるテストコード自動生成ツールを開発するなどし、生成AIがどういう技術なのかを理解し、「LLMにはどれくらい高度なソフトウェア開発業務を任せられるのか?」について考える機会が増えました。 AIまわり、進化の速度もパないですよね。世界中の天才たちが持てる限りのリソースをぶちこんで競争しているこの勢いがどこまで続くのか、私達をどこまで連れて

    生成AIはソフトウェアの産業革命になるのか
  • 古いコンピュータやOSで小文字ではなく大文字が使用されていた理由とは?

    by pilot_micha 今日のコンピュータープログラムでは小文字や大文字を区別しつつ入力することがありますが、コンピューターの誕生当時はプログラムの入力に全て大文字を使っていました。その理由について、さまざまなユーザーが解説を行っています。 graphics - Why did older computers and OSes use UPPER case instead of lower case? - Retrocomputing Stack Exchange https://retrocomputing.stackexchange.com/questions/28141/why-did-older-computers-and-oses-use-upper-case-instead-of-lower-case IT技術系Q&AコミュニティのStack Overflowにおいて、m

    古いコンピュータやOSで小文字ではなく大文字が使用されていた理由とは?
  • 機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版)|カレーちゃん

    機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版) こんにちわ、カレーちゃんです。Kaggle GrandMasterです。 Kaggleはデータサイエンスに入門するのにとても適しています。ですが、英語の問題などがあり、入門するのが難しい。そこで、Kaggleの「入門」をこうすれば高速に完了できるというnoteを書きます。 同じタイトルの記事を、2020年8月にも書いたのですが、それから2年以上がたちました。それから、おすすめできる資料が増え、また、私が思う入門のコースもやや変わりましたので、更新をしたいと思います。 1.Kaggleに入門(はじめに取り組むと良い資料)Kaggleには、「タイタニックコンペ」という、練習用のコンペがあります。 これは、事故が起こったタイタニックの乗客のデータから、乗客の生死を予測するという、やりたいこと

    機械学習初心者がKaggleの「入門」を高速で終えるための、おすすめ資料などまとめ(2023年12月版)|カレーちゃん