shunkeenのブックマーク - はてなブックマーク

[提案]テーブル名はもう全部単数形にしようや

こんにちは、データベース愛好家のみなさん！今日は、データベース設計で永遠の議論となっている「テーブル名、単数形 vs 複数形問題」について、徹底的に掘り下げていきます。私は単数形派です！でも、なぜそうなのか、一緒に深掘りしていきましょう。イントロダクション：我らが主人公、単数形くんみなさん、こんな経験ありませんか？ You: テーブル名って、users? user? どっちがいいんだろう... 先輩: いや、絶対usersだよ！Rails使ってるし。 You: でも、user_idって書くときは単数形だよね？先輩: あ、そうだね...でもやっぱりテーブルは複数形！ You: （心の中で）なんかモヤモヤする... 実は、この「モヤモヤ」には理由があるんです。今日はその理由を解き明かし、単数形テーブル名の魅力をお伝えします。準備はいいですか？Let's dive in! 言語の壁を突破せ

shunkeen 2024/07/07

コーディングの命名規則でもコレクション型は複数形で名付ける（例えばtype Users = Set<User>;）だろうし、単一値とみなすプロパティの型は単数系で名付ける（例えばtype UserID = User["id"];）ような気もするが。

リンク

数学の「＝」（等しい）とはどういうことか？　英ICL教授が発表　「コンピュータの登場で定義が曖昧に」

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X：＠shiropen2 英インペリアル・カレッジ・ロンドン（ICL）の教授であり、数学者のケビン・バザードさんの単著論文「Grothendieck’s use of equality」は、数学者が等式の概念をどのように使用しているか、そしてそれが数学の形式化を試みる際にどのような影響を与えるかについて議論した研究報告である。バザードさんは「現状、数学者は等式の概念を曖昧に使っており、近年のコンピュータプログラムによる証明（形式化）においてその曖昧さが障害になっている」と指摘する。「＝」（等号）にみる一般的な等式の定義は、両辺が同じ数学的対象を表しており、一方から他方への論

shunkeen 2024/06/11

ホモトピー型理論(homotopy type theory, HoTT)とかの話かなと想像が膨らむけど、そもそも16pで数式とかあんまり出てこないプレプリントなんだから、妄想するくらいなら元の論分読んだほうがええか。

リンク

ドクターペッパー、米炭酸飲料市場で２位躍進　ペプシコ抜く

ニューヨーク（ＣＮＮ）米炭酸飲料業界紙は６日までに、市場シェアで「ドクターペッパー」が昨年、長らく２位の座にいた「ペプシコーラ」をついに抜いたと報告した。首位は依然、コカ・コーラで、２位に大差を付ける１９．２％の占有率を獲得。同業界紙「ビバレッジ・ダイジェスト」のデータによると、ペプシコーラとドクターペッパーは共に８．３％だったが、「厳密に言えば」としてドクターペッパーが上位にあるとした。他のブランドではコカコーラ系列の「スプライト」が８．１％、「ダイエットコーク」が７．８％だった。同紙の編集責任者はＣＮＮの取材に、ペプシコーラとドクターペッパーは競り合っているが、ドクターペッパーには勢いがあり、ペプシコーラは失速していると指摘した。２３種類の原料を使っているとされるドクターペッパーはここ数年、人気を高めており、ぴりっとした飲み口はコーラの代替品になるとの評価も得てきた。ドクタ

shunkeen 2024/06/06

ドクペ「ペプシコ抜きさせてもらえないでしょうか⋯？」ペプシ「ペプシコ抜き？」「はい」「うーん、人気⋯ ってやつなのかな？」「はい」「しょうがないにゃあ…いいよ」

リンク

「Copilot+ PC」とはなにか　マイクロソフトが狙うUX変化とWindowsの再設計

shunkeen 2024/05/22

Recall気になる〜。そのうちプロセスマイニング（業務の処理パターンを特定するやつ）とかできそう。あるいは「何もしてないのにPCが壊れた」とか言われた時の調査に使えそう。

リンク

OpenAIで超知性の制御と安全性を研究していた「スーパーアライメント」チームが解散、元幹部は「派手な製品が安全性より優先されている」

by Jernej Furman OpenAIでAIの安全性を確保するための部署である「スーパーアライメント」チームが事実上解散したと報じられています。決め手となったのはイルヤ・サツキヴァー氏とヤン・ライク氏というチーム幹部2人の退社で、ライク氏はX(旧Twitter)に「OpenAIで安全性が軽視されている」とポストしています。 OpenAI researcher resigns, claiming safety has taken ‘a backseat to shiny products’ - The Verge https://www.theverge.com/2024/5/17/24159095/openai-jan-leike-superalignment-sam-altman-ai-safety What happened to OpenAI’s long-term AI r

shunkeen 2024/05/21

ここまで需要が拡大した以上、１つの組織でやる話でもない気はする。AI機能の安定性を確保し、AI利用者、学習元データの保護を図るとともに、AI推進の円滑を図ることを目的とした行政機関を立ち上げた方がいいかも？

リンク

GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。今回は、2024/05/14に発表されたGPT4oについてです。返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか？というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通りこのBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

shunkeen 2024/05/17

再帰的に識別・生成させればGPT-4o自身でBBoxの座標を修正したりできるのかな？初期値はゼロショットでBBox座標を生成、赤枠付きの画像と座標をGPT-4oに渡して、修正された座標を生成させる。座標が安定するまで繰り返す。

リンク

「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用

LayerX 部門執行役員・AI・LLM事業部長中村龍矢 2024/5/8 生成AI Conf

shunkeen 2024/05/10

クラウドソーシングを上手く活用できている会社は大規模言語モデルも上手く活用できるんだろうな、という感覚はある。

リンク

【Bedrock×Lambda】高精度なハイブリッド検索RAGをサーバレスで実装（Slack連携も可） - Qiita

はじめに近年、大規模言語モデル（LLM）の発展により、LLMを活用する機会が増加しています。その中でも、LLMを組み込んだ仕組みの一つとして、RAG（Retrieval-Augmented Generation）が注目を集めています。本記事では、はじめに、検索精度を向上させたRAGアーキテクチャを紹介します。次に、それをAWS上で実装する方法について紹介します。本記事で紹介したアーキテクチャの実装に用いるソースコードはGitHubで公開しています。検索精度を向上させたRAGアーキテクチャ RAGの概要と検索手法 RAGの用途としては、社内文書など非公開ドキュメントを読み込ませ、そこから回答できる社内専用AIチャットボットなどが考えられます。そのため、RAGの精度向上のためには、ナレッジベースから検索する際に必要なドキュメントを的確に取得できるかが重要な要素の一つとなります

shunkeen 2024/04/25

“提案するRAGアーキテクチャ”の図、全文検索で20件に絞った後にFAISSでIndexingするのはなぜだろうか。20件程度なら文章IDと埋込ベクトルのルックアップテーブルを用意しておいて、自前でcos類似度計算してもよい気がする

リンク

OpenAI Japanスタート　3倍速い日本語特化モデルも公開へ

shunkeen 2024/04/16

ブコメのアテンションと日本語の相性が悪そうって話は他で聞いたことがないし、帰納バイアスが少ないと言われるTransformerであれば、スケーリング則で、どうとでもなりそうな気はするが、どうなんじゃろうか。

リンク

今のチームに来てから最も生産性が上がった考え方｜牛尾　剛

多分今回のポストは多くの人には参考にならないだろう。相当ニッチなので。でもこれは自分にとってはとても大きなことだったので、忘れないように記録しておきます。生産性の悩み　あまりこの世界では生産性とはあいまいな言葉で、何をもって生産性が高いとは言いにくい。速いのが良いのではない。ただ、自分の実感として自分は生産性が良くないといつも感じていた。だからいろいろ努力したり、考え方をできる人を観察して真似してみたり、直接本人に聞いたりして工夫をしてきた。実は自分はめっちゃコーディングが早い人になりたいわけではない。そうではなくて、「平均的」になりたいだけだ。それぐらいいければ「Strategy」でカバーできるどころかもっと上に行けると確信があったから。でもそうではなくて明らかに遅いのでそれが自分の足を引っ張っていた努力の方向性　様々な努力をして、特に有効だったことを自分の本に書いたつもりではある

shunkeen 2024/04/16

この手の主張を読むと、投機的実行とパイプラインハザードって単語を連想したりする。投機に失敗すればハザードが起きて、そこまでの作業は徒労に終わる。しかし、成功率が高いなら投機したほうが平均的には良い。

リンク

⼤規模⾔語モデルの拡張（RAG）が終わったかも知れない件について

Zero Waste, Radical Magic, and Italian Graft – Quarkus Efficiency Secrets

shunkeen 2024/04/09

本筋と全然関係ないんだけど、Text Embeddingをやってくれるモデルの図を台形で描く時、台形の下底側からtextが入ってきて、上底側からvectorが出てきて欲しい気持ちがある。

リンク

Azure OpenAI Service を活用した対話型 UI を「じゃらんnet」に試験実装、従来型検索ではわからなかったユーザーニーズが短期間で把握可能に

Microsoft customer stories See how Microsoft tools help companies run their business.

shunkeen 2024/03/27

リンク

ビジネスロジックを「型」で表現するOOPのための関数型DDD / Functional And Type-Safe DDD for OOP

Object-Oriented Conference 2024で発表した資料です。 https://fortee.jp/oocon-2024/proposal/b31c9818-3cb8-4350-adfe-cbc839cdf829 ビジネスの専門知識（ドメイン）を中心に据えたドメイン駆動設計に…

shunkeen 2024/03/24

どうでもいい重箱の隅の話だけど、集合の直和の形式的な定義に違和感。ベクトル空間の直和か何かと混同してるのかな？「A⊕B=A∪BただしA∩B={0}」と書いてあるけど、集合の直和なら「ただしA∩B= {}」だよね？？

リンク

速報：話題の 1ビットLLMとは何か？｜寺田英雄（㈱オープンストリームCTO）

2024-02-27にarXiv公開され，昨日（2024-02-28）あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「１ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c

shunkeen 2024/03/02

“BNNの説明が理解できていれば、1.58ビットトランスフォーマーモデルを理解するのは簡単”／やっぱり前提知識がある人は理解の深さが違うんだなぁ。

AI
文章

リンク

既存日本語LLMをBitNetで置き換えて実行してみた｜はち

はじめに昨夜からBit Netという1bit量子化LLMが話題になっていました。簡単な概要としては、既存のLLMが１パラメータをFP16やBF16などのfloat型で扱っているものを、１パラメータで{-1, 0, 1}しか扱わない様にした。計算に使う情報量を削ることで、処理速度の向上、メモリの節約が叶う。 3B params以上ではベンチマークスコアの平均で同サイズのLlamaを上回る結果となった。（量子化手法としては初）ということだと思います。これは元々、今回の論文と同チームによって提案された"Bit Net: Scaling 1-bit Transf ormers for Large Language Models"という論文を拡張したものです。この時は１パラメータで{-1, 1}として扱ってけれど、{-1, 0, 1}としたらうまくいったというのが今回の"The Era of 1

shunkeen 2024/03/02

1(.58)ビット量子化するのを前提に学習時にStraight-Through EstimatorとかRoundClipうんたらを使って学習しないと、量子化して推論したときに結果が振るわない的な話なのかな。手法の一部だけ取り入れても壊れるだけみたいな。

AI
文章

リンク

TypeScriptの代数的部分型模型

本書ではTypeScriptの型と部分型関係がなす代数的構造を解説し、型についての強固かつ柔軟なメンタルモデルを構築します。順序理論、集合論、束論、環論、そして圏論に至るまで、複数の数学理論を利用して多角的にモデルを構築することで、型の直感的な理解を深め、型の互換性に対する自然な推論を可能となるように解説した新しい試みの本です。

shunkeen 2024/02/27

数学的構造をメンタルモデルに使うのが良き。何が証明できるか（応用志向）よりも、いかに脳に楽をさせて推論できるか（理解志向）を意識していそうで素晴らしい。楽をするために数理的解釈を選び取ればいい。

リンク

東京都独自のデジタル地域通貨、QRコードでポイントを貯めて使える「Tokyo Tokyo Point」

shunkeen 2024/01/30

“Tokyo Tokyo Point（仮称）”／Tokyo Pointだと略した時にTポイントだからTokyoを二重にしたのかな。名称を公募したら東京特許許可局ポイント（Tokyo Tokkyo Kyokakyoku Point）とか出てきそう。

リンク

「言葉による解決、あきらめたくない」芥川賞の九段理江さん会見

「東京都同情塔」（新潮１２月号）で芥川賞に決まった九段理江さん（３３）は１７日夜、東京都内で記者会見し、受賞の感慨を語った。主な質疑応答は次の通り。－－最初に一言「小説は好きで一人で書き始めましたが、書き続けることは一人では難しいものですから、書き続ける力をくださる出版社や家族、友人、楽しみに読んでくださる方に、本当にありがとうございますとお伝えしたいです。とにかくうれしい、感謝を伝えたいという気持ちでおります」－－吉田修一選考委員の講評で「完成度が非常に高い」「エンタメ性が高い」と言われたが、どう思うか「完成度が高いという評価をいただけるとは、謙遜ではなく夢にも思っていませんでした。『東京都同情塔』という作品はアンビルト（未建築）をモチーフにした作品なんですけど、アンビルトにもしかしたらなってしまうのではないかと恐る恐る、不安な思いで書いていました。完成してからは自分なりに納得で

shunkeen 2024/01/18

もしもの話として、AIを使った小説執筆のノウハウを詰め込んだ指南書を受賞作家が出したとしたら、本の帯に踊る煽り文には何て書かれるのかな。

リンク

「プロダクトマネージャーがプロダクトマネジメントを失敗させる!?」大企業病の罠を乗り越え若々しいチームを実現する/Traps of Optimization in Product Management 2024

「プロダクトマネージャーがプロダクトマネジメントを失敗させる!?」カオスなプロダクト開発を効率化したら硬くて息苦しい官僚組織になっちゃった! 大企業病の罠を乗り越え若々しいチームを実現するぞ効率化を進めていったら息苦しい組織になってきたと悩む方に向けたセッションです。概要 https://confengine.com/conferences/regional-scrum-gathering-tokyo-2024/proposal/19268 発表者 https://twitter.com/_N_A_ https://note.com/mryy 関連スライド「私考える人、あなた作業する人」を越えて、プロダクトマネジメントがあたりまえになるチームを明日から実現していく方法 https://speakerdeck.com/moriyuya/product-management-rsgt20

shunkeen 2024/01/14

会社の立ち上げ、確立、拡大、衰退の流れと、じゃあどうすればいいのか、を地に足つけて語ってるからなのか、ページ数がものすごいことになっている。

リンク

品質保証部門の陳腐化。そして陳腐化した品質保証は品質を悪化させる - 千里霧中

※品質保証のエンジニアである筆者が自省・戒めのために書いた記事になります品質管理（Quality Control）、品質マネジメントは国内では製造業を中心に発展し、プロダクトの競争力向上に貢献してきました。 JTCと呼ばれる旧来からのメーカーでは、その実績・年功の蓄積に応じて、独立性を保った品質管理・品質保証部門が権威を獲得し、今でもソフトウェア開発に強い影響力を保持するようになっています。筆者は複数のメーカーを転職やコンサルで巡って来ましたが、例えば品質保証部門が承認しないとマイルストーンで開発がブロックされる、プロダクトがリリースできないといった権限を持つ体制が、今なお普遍的に見受けられます。この品質保証部門が権力を持ち、品質ゲートの門番として振る舞う体制は、今であっても、ある面で恩恵を提供しています。例えば次のようなものです：法規制対応、標準化対応、その他公的なガバナンス要求へ

shunkeen 2024/01/12

目的を見失えば、どの時代、どの業務でも起こり得そう。何を目的とした品質なのかを見失って形骸化し、形骸化を格式高さと勘違いする中で、ただの権限が権力に落ちぶれる様は物悲しいが、しかし、ありふれている。

リンク

はてなブックマーク

タグ

shunkeenのブックマーク (2,382)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス