h_taijiのブックマーク - はてなブックマーク

爆速でローカル動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』の実力は？／実際にローカルで実行してOpenAIの「Whisper」と比較してみた【レビュー】

h_taiji 2024/11/02

リンク

事前にアイデアを検証する方法を学ぶ - 「NO FLOP!」を読んだ - $shibayu36->blog;

施策のヒット率を高める方法について学んでいる。今回は「NO FLOP!」を読んだ。Ｇｏｏｇｌｅ×スタンフォードＮＯＦＬＯＰ！　失敗できない人の失敗しない技術作者:アルベルト・サヴォイアサンマーク出版Amazon 定性調査・定量調査の両方で参考になりそうな前提知識を学べたと感じた。印象に残ったのは「身銭」を切ってない人の意見を聞くな結果に対して、何かしら失うものや得るものを持っている人の意見だけを聞く気づき: 確かにこれが欲しいと言った意見を聞いて実装しても、それにお金を払う段階では使われないということはよく起こる「あいまいな思考」を「検証可能な仮説」に変えるためには、できる限り数字で表現することが大切あいまいな意見例: この申し込みボタンの横幅をもう少し広げたら、クリック率もちょっとは上がるんじゃないかな検証可能な仮説: この申し込みボタンの横幅を20%広げた場合、申込

h_taiji 2024/11/01

リンク

AWSアカウントを取り違えないための試み - KAYAC Engineers' Blog

SREチームの長田です。皆さんは操作するAWSアカウントを取り違えたことはありますか？私はあります。カヤックのSREは複数のプロダクトを担当することも多く、ひとつのプロダクトでも環境(本番、ステージング、開発、etc.)ごとにAWSアカウントを分ける場合があり、扱わなければならないAWSアカウントが多くなる傾向にあります *1。今回はうっかり別のアカウントのリソースを削除してしまったーといったオペレーションミスを減らすために個人的に行っている、「気をつける」以外の対策を紹介します。間違いに気づくための対策対象のアカウントが操作の対象として正しいかどうかは、結局は操作している本人にしか分かりません *2。そのため、「アカウント取り違え自体をなくす」のではなく、「アカウントを取り違えていることに気づきやすくする」ための対策をしています。 AWSコンソール用の対策 AWSコ

h_taiji 2024/10/29

つかう

リンク

RAGの「文脈が消える問題」を解決する「LongRAG」

株式会社ナレッジセンスは、エンタープライズ企業向けにRAGを提供しているスタートアップです。本記事では、RAGの性能を高めるための「LongRAG」という手法について、ざっくり理解します。この記事は何この記事は、RAGの文脈消える問題を克服する新手法「LongRAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー LongRAGは、「文書全体を読まないと正答できない」ようなタイプの質問に対しても、RAGの精度を上げるための新しい手法です。中国科学院・清華大学の研究者らによって2024年10月に提案されました。ざっくり言うと、LongRAGとは、「階層化」+「フィルタリング」です。 2つとも、よく知られたRAGの手法ですが、これらを組み合わせるこ

h_taiji 2024/10/29

リンク

適切なインフラコスト難しいなと思って、上場企業約30社分のサーバー費用を調査した💻

はじめまして、asachiです。普段はプロダクトマネージャーとかデザインとかをやっています。最近、会社・事業のインフラコストをどう評価するかという話に社内でなって、実際各企業どんなもんなんだろうなと気になり、IR資料から頑張って漁ってきました。せっかく色々と見たので、気になった事例等含めて書いていこうかなと思います。 TL;DR 上場企業のインフラコストを調べた規模・業態問わずで30社くらいのデータを発掘できた最もコストがかかっていたのはゲーム会社アカツキ約11-12億/年次点はツイキャス運営のモイ約5.8億/年「メメントモリ」が流行ったため、BANK OF INNOVATINが直近四半期でサーバー費用が3億円/四半期(前年同期比1,153%)になっていた各種会計項目に対してサーバー費の比率が安定しているのは、GunosyとGameWith 売上原価に占める割合が高いのは

h_taiji 2024/10/15

参考

リンク

ADRを運用して3年経った僕らの現在地

2024-10-05 YAPC::Hakodate 2024 https://yapcjapan.org/2024hakodate/

h_taiji 2024/10/09

リンク

OpenAIのプロンプト自動作成機能を触ってみる - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? OpenAI DevDay 2024でいくつかの新しい機能が実装されています。新機能のひとつに、プロンプト自動作成というものがあります。目的を入力しただけで、自動的にシステムプロンプトを作成してくれるというものです。他の新機能に比べると、やや地味目ですが、どんな感じのプロンプトを作成してくれるのか気になったので試してみました。 TL;DR 曖昧な一文からでも、マークダウン形式に沿ったプロンプトを書いてくれるので、たたき台としてよさそう。プロンプト自体がマークダウン形式なせいか、Output形式がマークダウンに引きずられることがあ

h_taiji 2024/10/06

リンク

時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。｜にょす

みなさん、こんにちは！9月は久しぶりに個人開発をしてました。今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です！「無限もじおこし」はその名の通り、時間無制限、無料で使える文字起こしアプリです。普通に考えたら「え？大丈夫なの？」って感じですよね笑でも、ちゃんと収益的に成り立つ算段を立てています。この記事ではそこらへんの考えや、アプリ開発における技術的な学びについてまとめていきたいと思います！「無限もじおこし」の紹介主な特徴音声の文字起こしが無制限に可能（10時間でも100時間でも！）使いやすさにこだわった機能（コピー、シェア、自動タイトル生成など）「よく使う単語帳」に登録すると、文字起こしの変換精度アップバックアップ機能があるので、機種変更などが発生しても簡単に引き継げますそして、無

h_taiji 2024/10/06

かなりいい

リンク

転職していった同僚が「このExcelにタスクの進捗いれてください、と伝えても半数も入れてくれない」と言っていた。自主的に進捗報告するのはすごいことらしい (2ページ目)

更新日:10月4日19時09分

h_taiji 2024/10/04

気づいたのが1つのタスクをステータスによって他人に割り当てるタスクにしないやり方は悪いと思った。タスクのステータスによって実行者が変わるタスクなら自然とステータスを変えないといけない状況が生まれる

リンク

開発用適当ツールはGoで作るのがオススメ - Qiita

開発用適当ツールとは？開発していると、たまに何かしらプロジェクト内で開発者用や運用者用にテストデータを作成したり、DBやAPIに繋いでCSVやExcelを出したりする名もなきツールが大量に必要になってきますよね？配布して他の人にも使ってもらったりしたくなりますよね？これが開発用適当ツール1です。そういった開発用適当ツールをGoで作ってみたら案外体験が悪くなかったのでシェアしたいと思います。どうやって開発用適当ツールを作るか？既存プロジェクトにそのままGoのプロジェクトレイアウトを重ねていきます。具体的には以下のような感じです。

h_taiji 2024/10/04

あんまり読んでないけど、激しく同意できる。

リンク

Valibot Schema Driven UI - ユーザーがノーコードで自由に UI を組み立てられるエディタを Next.js と Valibot で構築する - ROUTE06 Tech Blog

近年 Bubble や Webflow、日本だと STUDIO などのノーコードプラットフォームが注目を集めています。これらのツールは、プログラミングの知識がなくてもユーザーが思い思いの UI を構築できる機能を提供し、アプリケーション開発の民主化に貢献しています。このようなノーコードでユーザーが自由に UI を組み立てる仕組みはどのように構築されているのでしょうか。一見複雑に見えますが、基本的な考え方を理解すれば独自のエディタを構築することも不可能ではありません。アーキテクチャの中核となるのは、動的な UI コンポーネントを表現するスキーマ定義と、それを実際の UI 要素に変換する仕組みです。この過程では、データのバリデーション、データ型の絞り込みと UI コンポーネントの動的生成、そしてそれらの適切な配置が重要な役割を果たします。本記事では、ユーザーがブラウザ上で UI を自由に構

h_taiji 2024/09/26

使ってみる

リンク

話題のGraphRAGにAWSで挑戦しよう！（LlamaIndexとNeptuneに入門） - Qiita

GraphRAGとは？ Microsoft社が、以前から提唱していたRAGの新しいアプローチ「GraphRAG」のサンプル実装を7月にGitHubで公開したことから、LLM界隈で一気に話題となりました。従来のRAGは、検索対象のドキュメントを埋め込み（ベクトル）に変換しておくことで、検索クエリーと意味的に近いかたまり（チャンク）を数学的な計算によって探し当てて持ってくる手法でした。これに対してGraphRAGでは、検索対象のドキュメントを埋め込みではなく「グラフ」として保存する手法です。これによって、従来のRAGでは検索精度がイマイチだったユースケースでも精度が改善することがあります。グラフとは？グラフといえば、Excelなどでデータを可視化するアレを思い浮かべる方も多いでしょう。GraphRAGで扱うのはそれではなく、数学の世界でいう「グラフ理論」のグラフです。ノード（節点）とエ

h_taiji 2024/09/24

リンク

汚いコードと対処法 - 君はコードなんか汚いと思いながら

あらすじ徹夜明けの深夜テンションで書いた怪文書が思いの外多くの人の目に止まったようなので、実際にどういうコードが汚くて、どう改善できるのか、みたいな事を簡単にまとめてみる。モジュール・クラス・変数の名前がおかしい名前から全く想定できない作用がある、名前が嘘例えば、validateForm()という名前のメソッドを実行すると、決済処理が完了してレシートが印字されるとケース。おまえはvalidationではない。でもvalidationなので、DBには保存しない。（何を言っているんだ？？？ちなみに、外部APIやデバイスのコールはこのメソッドの中でできてしまうが、フレームワーク制約でDB更新はここではできない、みたいな状況でそういう事が起こる） const blue = "#ff0000"、おまえは青色ではない。真っ赤なウソだ。これは、しばしば致命的なバグにつながる。既存のblueを

h_taiji 2024/09/24

リンク

Rust3000行でテキストエディタを作るチュートリアルをやった

想定よりだいぶ大変でした。 hecto 成果物はこれ↓ 参考サイトはこれです↓ インスパイア元↓ 感想 Rustはこのチュートリアルが初体験ずっと勉強したいとは思っていたので良い機会だったチュートリアルを進めていくなかで所有権とかライフタイムとかを少しずつ導入していき説明も挟んでくれるので助かったしかし3000行の経験を積んだ程度ではまだまだエラーの読み解きは難しいな〜という印象 https://bsky.app/profile/kawarimidoll.bsky.social/post/3l3znqvdbx42q パターンマッチ、ResultやOptionといった概念は先にGleamをやっていたおかげで問題なく理解できた外部依存ナシのC言語版が1000行程度だったので外部ライブラリを使えるRust版は行数が少ないのかしらと思ったが結果的に3000行になった C版は1週間ほどで完成

h_taiji 2024/09/24

リンク

社内ヘルプデスクのチケット管理システム、みんな何使ってるんですか？→有益すぎる情報が集まる

りんご🍎 @r1ngo5656 社員が問い合わせする窓口が一箇所じゃないのほんと気持ち悪い。内部通報制度とかは別として、総務宛も経理宛もIT宛もぜんぶいったん一箇所に放り投げて仕分けしてあげるくらいがいい。りんご🍎 @r1ngo5656 問い合わせ者が問い合わせ先を判断しろ、じゃなくて、『判断するのは受け取った先』でいいじゃんっておもう。組織によって仕分けが違うけどそれこそ学習させて処理したいーあとは担当部門ごとに情報を見せたがらないときのロール管理なんだよな。にんげんってめんどい

h_taiji 2024/09/22

リンク

医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話

どんな人向けの記事？医薬品のような難しい検索ニーズにこたえるためにベクトル検索を利用する知見を見てみたい MySQLの全文検索と、ベクトル検索の精度や速度を比較してみたいベクトルDBとEmbeddingモデルを利用した簡単なベクトル検索の実装方法を知りたい医薬品の検索ニーズは多様なので、ベクトル検索で解決できるか試したい 1つの医薬品を指す名称は、複数存在するため医薬品検索は意外と面倒な問題です。例えば、日本人なら頭痛や生理痛、発熱したときに「ロキソニン」を飲んだことがあるかもしれません。この名称は商品の名称ですが、成分の名称は「ロキソプロフェンナトリウム水和物」です。さらに、ロキソプロフェンには錠剤以外にもテープやパップといった剤形の違いがあります。そして最後に、ロキソプロフェンを作っている会社は複数あるので、末尾に「トーワ」や「ファイザー」などの組み合わせが存在します。ロキ

h_taiji 2024/09/20

リンク

プロンプトエンジニアリングをしよう - 一休.comでの検索システム改善事例 - 一休.com Developers Blog

はじめにこんにちは。宿泊プロダクト開発部の宮崎です。みなさん、生成 AI 使ってますか？近年、AI の進歩はめざましく、文章生成や画像生成はもちろん、動画生成も実用的なレベルで出来るようになっています。 ChatGPT が話題になったのが 2022 年の 11 月なので、たった 2 年足らずでここまで来ているという事実に少し恐ろしくもありますね。AGI(汎用人工知能)の実現もそう遠くないのかもしれません。一休でも AI 技術は注目していて今年の 6 月に、まさに生成 AI を使ってホテル検索システムの改善を行いました。この記事では、その時に学んだプロンプトエンジニアリングの重要性について書いていこうと思います。生成 AI を使ったホテル検索システム今回我々が実装したのはフリーワード・文章でもホテルを検索できるシステムです。以下のようなユーザーの自由な入力に対して、適切なホテ

h_taiji 2024/09/12

役立つ

リンク

医療分野におけるLLMの現状と応用可能性について

論文読み会 SNLP2024 Instruction-tuned Language Models are Better Knowledge Learners. In: ACL 2024

h_taiji 2024/09/07

リンク

そこそこ借金して「俺が考える最強のタスク管理・時間管理サービス」作った。どうか使ってみてほしい｜jMatsuzaki🔥

私の愛しいアップルパイへ 8月16日（金）、このTCP/IP網の片隅に新規サービスを産み落としました。「TaskChute Cloud 2」っていいます。頑張って作ったトップページ去年の8月から本格的に作り始めて、1年間でようやく形になりました。これこそ"俺が考える最強のタスク管理・時間管理サービス"って感じです。正直タスク管理サービスって有名どころは出尽くしてる感じですし、「いまさらー？」って感じだと思います。この手のサービスは西海岸からいくつも出てますし。でも、今までの発想のタスク管理サービスって使いづらくないですか？もう実際の仕事に通用しなくないですか？って気持ちもあって、ちょっと違ったアプローチのサービスをガチで作ってみました。そこそこ借金して1年かけて作りました小学生時代からの友人と作った役員2人だけの極東の極小の会社なんですけど、コロナとか異常な円安とかの影響もあって経

h_taiji 2024/09/06

リンク

RAGの「ベクトル検索」の弱みを、ナレッジグラフで補う

株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、RAGの性能を高めるための「HybridRAG」という手法について、ざっくり理解します。この記事は何この記事は、RAGシステムを専門用語に強くするための手法「HybridRAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー HybridRAGは、通常のRAG（Retrieval Augmented Generation）で用いられる「ベクトル検索」の弱みを補い、回答精度を向上するための手法です。BlackRockとNVIDIAの研究者らによって2024年8月に提案されました。ベクトル検索の弱みはいくつかあります

h_taiji 2024/09/04

リンク

はてなブックマーク

タグ

h_taijiのブックマーク (1,141)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス