misshikiのブックマーク / 2024年4月22日

BM25／Okapi BM25（情報検索のアルゴリズム）とは？

用語「BM25」について説明。各文書中の各単語の重要性をバランスよく評価する尺度で、主に検索クエリに最も一致する文書を特定するのに用いられる。キーワード検索以外にも、類似文書の検索やレコメンデーションにも活用できる。計算式は「（ある単語の文書間でのレア度）×（ある文書における、ある単語の出現頻度、の正規化された値）」で、正規化するための調整パラメーターを持つ、tf-idfの発展版と見なせる。連載目次用語解説情報検索／自然言語処理におけるBM25（Best Matching 25）とは、検索クエリに最もよく一致する文書を見つけ出すための統計的アルゴリズムの一つである。このアルゴリズムは、文書内での単語の出現頻度（tf：term frequency）と、その単語が含まれる文書の希少性（idf：inverse document frequency）を用いて、各文書内に含まれる各単語が「その

misshiki 2024/04/22

“各文書中の各単語の重要性をバランスよく評価する尺度で、主に検索クエリに最も一致する文書を特定するのに用いられる。”

リンク

Ruff v0.4.0: a hand-written recursive descent parser for Python

Time in milliseconds to lint and format popular repositories. Lower is better. A hand-written parser also opens the door to future optimizations and improvements, especially in error recovery. Read on for discussion of the major changes, or take a look at the changelog. A hand-written parser # Parsers form the foundational layer of any static analysis tool, transf orming raw source code into Abstra

misshiki 2024/04/22

“Ruff v0.4.0が利用可能になりました。PyPIまたは選択したパッケージマネージャーからインストールします。 `pip install --upgrade ruff`　Ruff は、Rust で書かれた非常に高速な Python リンターおよびフォーマッタです。”

Python

リンク

GIS に欠かせない Shapefile を深堀ってみる - Qiita

1. はじめに地理情報システム (GIS) で、使用するデータとして「Shapefile 形式」でデータ提供されていることがあります。この記事では、この Shapefile が、どのような構造となっているのかについて、説明していきます。 1.1. トポロジ構造とは Shapefile について説明していく前に、まずは GIS データ等でよく利用される「トポロジ構造」について説明しておこうと思います。例えば、トポロジ構造を持つファイルとして、次のようなものがあります。 .gdb: ESRIのファイルジオデータベースは、トポロジを含む複雑な空間データを格納することができます。 .topojson: トポロジを保存するための拡張 GeoJSON 形式で、隣接する地物間の境界を共有することでファイルサイズを削減します。 .gml: 地理マークアップ言語 (Geography Markup La

misshiki 2024/04/22

“地理情報システム (GIS) で、使用するデータとして「Shapefile 形式」でデータ提供されていることがあります。この記事では、この Shapefile が、どのような構造となっているのかについて、説明していきます。”

GIS
Python

リンク

Python初学者のためのメモ - Qiita

はじめにこの記事は、大学1,2年生で大学の授業で少しプログラミングの授業を受けた学生に対して、pythonを実際に動かしながら実験データの解析をする方法を紹介している。 Colaboratoryを使ってpythonコードを実行する。 ColaboratoryはGoogleが提供している環境で、ブラウザ上でpythonを記述し、クラウドサーバー上でコードの実行を可能とする。自分の使っているパソコンの性能に依らず、GPUやTPUなどのGoogleのハードウェアを活用できることが一番のメリットである。使い方ブラウザ上でColaboratoryと検索し以下のページに行く。左上の”ファイル”を選択し、ノートブックを新規作成を選択する。 Googleドライブをマウントする。 Googleドライブ内のデータにアクセスするためにGoogleドライブに接続(マウントと言う)する。colaborator

misshiki 2024/04/22

リンク

Kornia：微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。 Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。 Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。概要このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフ

misshiki 2024/04/22

“KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。”

リンク

Announcing py2wasm: A Python to Wasm compiler · Blog · Wasmer

Back to articlesAnnouncing py2wasm: A Python to Wasm compilerpy2wasm converts your Python programs to WebAssembly, running them at 3x faster speeds Since starting Wasmer five years ago we've been obsessed with empowering more languages to target the web and beyond through Webassembly. One of the most popular languages out there is Python, and while it is certainly possible to run Python programs i

misshiki 2024/04/22

“py2wasm の発表: Python から Wasm へのコンパイラー”

リンク

PythonのコードをWebAssemblyにコンパイルする「py2wasm」、Wasmerが発表

PythonコードをWebAssemblyにコンパイルする「py2wasm」がWasmer社から発表された。WebAssembly版CPythonよりも約3倍高速だ。PythonコードをCPythonのAPIコールに変換するトランスパイラがベースになっている。 WebAssemblyランタイムの開発と提供を行っているWasmer社は、PythonのコードをWebAssemblyバイナリにコンパイルする「Py2wasm」を発表しました。 Announcing py2wasm – A #Python to #WebAssembly compiler that speeds up by 3x your Python apps!https://t.co/0v4YLZC7lY — Wasmer (@wasmerio) April 18, 2024 WebAssembly版CPythonよりも3倍高速

misshiki 2024/04/22

“WebAssemblyランタイムの開発と提供を行っているWasmer社は、PythonのコードをWebAssemblyバイナリにコンパイルする「Py2wasm」を発表しました。”

リンク

GitHub - pytorch/torchtune: A Native-PyTorch Library for LLM Fine-tuning

torchtune is a PyTorch-native library for easily authoring, fine-tuning and experimenting with LLMs. We're excited to announce our alpha release! torchtune provides: Native-PyTorch implementations of popular LLMs using composable and modular building blocks Easy-to-use and hackable training recipes for popular fine-tuning techniques (LoRA, QLoRA) - no trainers, no frameworks, just PyTorch! YAML co

misshiki 2024/04/22

“torchtune”のGitHubリポジトリ。

リンク

僕の考えた最強の Python 開発環境 (2024)

はじめにこんにちは, 普段は情報科学専攻の大学院生をしながらバックエンドエンジニアをやっている @koki-algebra です. 普段は Go をよく書いているのですが, 大学でやっている機械学習の研究では Python を使うことがほとんどです. Go のエコシステムに慣れきった私は Python の混沌とした環境に耐えきれず, 最強の開発環境を整えることを決意しました. 具体的には Package Manager, Formatter, Linter, Type Checker, Test Tool を選定し, VSCode の DevContainer を用いてポータビリティに優れた開発環境を作ることを目指します. また, Deep Learning では GPU が必須である場合が多いので, GPU 環境も同時に整えたいと思います. 以下のレポジトリが今回考えた開発環境のテンプ

misshiki 2024/04/22

“Package Manager: rye、 Linter & Formatter: ruff、 Type Checker: mypy、 Test Tool: pytest”

Python

リンク

ベイズ統計学を勉強する参考書のフロー - Qiita

慶應義塾大学・株式会社Nospareの菅澤です．今回はベイズ統計学を勉強するための参考書の順番 (私見) について紹介していきます． 3年ほど前に『日本語で学べるベイズ統計学の教科書10冊』を紹介しましたが，今回は「どのような順番でどの参考書を読んでいくと比較的スムーズに勉強が進められるのか」に焦点を当て，比較的最近の書籍や英語の書籍まで含めて紹介していきます．まずは全体的なフローのイメージを提示しておきます．今回の記事では，「ベイズ統計学を勉強すること」のスタートとゴールを以下のように定めます． (スタート) 統計学の基礎的な内容 (統計検定2級程度の内容) は身についている (ゴール) ベイズモデリングに関する最新の論文がある程度理解して読め，自力でモデルを組んだり実装することができるまた，このゴールへの道のりとして，大きく2通りのルートを想定します． (ルートA: フルスクラ

misshiki 2024/04/22

リンク

GitHub - Koukyosyumei/AIJack: Security and Privacy Risk Simulator for Machine Learning (arXiv:2312.17667)

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2024/04/22

“AIJack: 機械学習のためのセキュリティとプライバシーのリスクシミュレーター”

リンク

初心者大学生が作った機械学習ライブラリがGitHubでスター数300を超えた話 - Qiita

この記事についてこの記事では、プログラミング初心者の大学生である(であった)私が試行錯誤しながらなんとかスター数300越えのOSSライブラリを作った過程をまとめたものです。ライブラリ自体はまだまだ発展中のためこの記事も適宜更新してく予定です。ライブラリ自体の詳細というよりも、自作OSSの認知度を上げで他の人に使ってもらうために有用そうな知見をまとめていこうと思います。ライブラリの概要今私が作っているのは、AIJackという、機械学習モデルがもつセキュリティ・プライバシー上の脆弱性についての各種攻撃・防御手法を実験するためのPythonツールです。既存のライブラリの多くは特定の種類の攻撃や防御に特化したものが多く、複数のタイプの攻撃・防御を組み合わせて実験するためにはいくつものライブラリを組み合わせる必要がありました。そこでAIJackでは、できる限り統一的なAPIで様々な攻撃・防御手

misshiki 2024/04/22

“今私が作っているのは、AIJackという、機械学習モデルがもつセキュリティ・プライバシー上の脆弱性についての各種攻撃・防御手法を実験するためのPythonツールです。”OSSの宣伝やドキュメント整備。

リンク

アノテーションにおけるUIの工夫 - CADDi Tech Blog

こんにちは、MLOpsチームです。先日OCRモデルを学習するためのアノテーションにおいて、作業効率を検証するためのPoCとしてアノテーションUIを開発しました。本記事ではこのアノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。はじめにアノテーションUIを開発することとなった背景について説明します。アノテーションUIとはアノテーションUIは機械学習の学習データを作成するためのUIです。アノテーションUIはアノテーション作業の効率に強く影響し、アノテーション作業によって得られる学習データの量は機械学習の精度に大きく寄与します。したがって、アノテーションUIは機械学習において最も重要なコンポーネントのひとつといえます。 UIを開発した背景キャディではOSSツールなどのUIを用いてアノテーションが行われていましたが、ここに独自の工夫を導入すれば入力効率

misshiki 2024/04/22

“アノテーションUIは機械学習の学習データを作成するためのUIです。アノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。”

アノテーション

リンク

Automating prompt engineering through structural optimization

Large language models (LLMs) have revolutionized a wide range of tasks and applications that were previously reliant on manually crafted machine learning (ML) solutions, streamlining through automation. However, despite these advances, a notable challenge persists: the need for extensive prompt engineering to adapt these models to new tasks. New generations of language models like GPT-4 and Mixtra

misshiki 2024/04/22

“Structure-Aware Multi-objective Metaprompt Optimization (SAMMO) フレームワーク。特にRAGのようにさまざまな種類の構造情報を組み合わせたプロンプトの最適化を合理化する新しいオープンソースツールです。”

リンク

Microsoft、生成AIのプロンプト解釈を最適化するフレームワーク「SAMMO」を発表 | gihyo.jp

Microsoft⁠⁠、生成AIのプロンプト解釈を最適化するフレームワーク「SAMMO」を発表 Microsoftは2024年4月18日、生成AI/大規模言語モデル（LLM）で長文のプロンプトを効率的に処理できるオープンソースのフレームワーク「SAMMO」を発表した。 SAMMO: A general-purpose framework for prompt optimization -Microsoft Research Blog GPT-4などの新世代の言語モデルでは、長い入力テキストを処理する機能が向上している。このため、より長文でリッチな文脈と詳細な指示を言語モデルに入力することが可能となった。しかし、この文脈を新しいタスクに適応させるための迅速なエンジニアリングが必要とされている。長文のプロンプトを処理する一般的な手法としてRAG（検索拡張生成）がある。RAGは特定の入力例に基

misshiki 2024/04/22

“Microsoftは2024年4月18日、生成AI/大規模言語モデル（LLM）で長文のプロンプトを効率的に処理できるオープンソースのフレームワーク「SAMMO」を発表した。”

リンク

【院生が徹底解説】ChatGPTのベクトルデータベースとSQLの比較 | WEEL

近年、大規模言語モデル（LLM＝Large Language Model）の急成長に伴い、膨大なデータ処理の保管先としてベクトルデータベースが重要な役割を担っています。あらゆる産業や仕事に大きなインパクトを与えている生成AIをうまく活用するためには、LLMのデータ保管先としてベクトルデータベースの活用が欠かせません。今回は、ChatGPTの台頭によって注目度が急上昇している「Pinecone」というベクトルデータベースに焦点を当てて、概念やPythonによる実装方法をわかりやすく解説します。さらに、ベクトルデータベースであるPineconeと、従来のデータベース（リレーショナルデータベース）のSQLを比較していますので、ぜひ参考にしてください。なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。ベクトルデータベースとはベクトルデー

misshiki 2024/04/22

“「Pinecone」というベクトルデータベースに焦点を当てて、概念やPythonによる実装方法をわかりやすく解説します。”

リンク

いちばんやさしいローカル LLM｜ぬこぬこ

概要ローカル LLM 初めましての方でも動かせるチュートリアル最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル（LLM）の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。現状、様々な評価指標により LLM の性能が測定されていますが、

misshiki 2024/04/22

“Ollama という初心者の方でも比較的失敗しにくい LLM 推論アプリケーションを用いて、ローカル環境で LLM を実行するまでを取り扱います。”

リンク

Megatron-LMとGKEで作るMixtral 8x7Bを語彙拡張継続事前学習 Part1 ~学習コードとモデルの先行公開~ - ABEJA Tech Blog

こんにちは！ABEJAでデータサイエンティストをしている大谷です。 ABEJAは国立研究開発法人新エネルギー・産業技術総合開発機構（以下「NEDO」）が公募した「ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発」に当社提案の「LLMの社会実装に向けた特化型モデルの元となる汎化的LLM」が採択されたことを受け、LLMの事前学習を実施しました。以降、本LLMプロジェクトをGENIAC（Generative AI Accelerator Challenge）と表記します。開発内容は表題の通り、Mistral社のMIxtral 8x7Bをベースにした日本語の語彙拡張版継続事前学習です。弊社が調べた限り、Megatron-LMでMixtralモデルを継続事前学習するソースコードは2024年4月12日時点（執筆時）では存在していません。 GENIACの計算資源提供の

misshiki 2024/04/22

“Mistral社のMIxtral 8x7Bをベースにした日本語の語彙拡張版継続事前学習です。”

自然言語処理

リンク

A Visual Guide to Vision Transformers | MDTURP

A Visual Guide to Vision Transf ormers This is a visual guide to Vision Transf ormers (ViTs), a class of deep learning models that have achieved state-of-the-art performance on image classification tasks. Vision Transf ormers apply the transf ormer architecture, originally designed for natural language processing (NLP), to image data. This guide will walk you through the key components of Vision Tran

misshiki 2024/04/22

“これは、画像分類タスクで最先端のパフォーマンスを達成した深層学習モデルのクラスである Vision Transformers (ViT) のビジュアルガイドです。”

リンク

Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは？

Googleの機械学習モデル「Transf ormer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transf ormerの手法を画像分野に応用したモデルが「Vision Transf ormer」です。ソフトウェアエンジニアのデニス・タープ氏が、「Vision Transf ormer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説しています A Visual Guide to Vision Transf ormers | MDTURP https://blog.mdturp.ch/posts/2024-04-05-visual_guide_to_vision_transf ormer.html 0：はじめに前提として、T

misshiki 2024/04/22

“「Vision Transformer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説しています”

リンク

MLX で Llama 3 を試す｜npaka

「MLX」で「Llama 3」を試したので、まとめました。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 推論の実行「MLX」は、Appleが開発した新しい機械学習フレームワークで、「Apple Silicon」(M1/M2/M3など) を最大限に活用するように設計されています。推論の実行手順は、次のとおりです。 (1) Pythonの仮想環境の準備。今回は、「Python 3.10」の仮想環境を準備しました。 (2) パッケージのインストールと実行。今回は「mlx-community/Meta-Llama-3-8B-Instruct-4bit」のモデルを利用します。 pip install mlx-lm mlx_lm.generate --model mlx-community/Meta-Llama-3-8B-Instruct-4bit -

misshiki 2024/04/22

“「MLX」は、Appleが開発した新しい機械学習フレームワークで、「Apple Silicon」(M1/M2/M3など) を最大限に活用するように設計されています。”

リンク

First Impressions of Early-Access GPT-4 Fine-Tuning | Supersimple

A few weeks ago we finally got access to the GPT-4 fine-tuning API (in limited early access), and were super excited to check out how well it works. We’d been a user of OpenAI’s fine-tuned models since fine-tuning the original GPT-3 davinci model first became available. Unsurprisingly, a fine-tuned GPT-4 greatly outperforms fine-tuned GPT-3.5 (more than 50% improvement for our use case!). We’ll go

misshiki 2024/04/22

“早期アクセス GPT-4 ファインチューニングの第一印象” ベンチマーク結果は良好みたい。

GPT-4
OpenAI

リンク

AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」、外で撮影した動画→実世界3Dゲームに変換するAI「Video2Game」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第43回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ画像の衣服をキャラクターに着せる生成モデル「Magic Clothing」撮影した動画を操作可能な実世界3Dゲームに変換するAIモデル「Video2Game」 Metaなど、数百万トークンを入力しても効果的に処理できるAIモデル「Megalodon」開発 Adobeなど、画像4枚から高品質な3Dモデルを1秒以内に生成するAI「MeshLRM」を開発 AI同士が教え合い質を高める、Microsoftの新型オープンソース大規模言語モデル「WizardLM-2」画像の衣服をキャラクターに着

misshiki 2024/04/22

リンク

ゼロから学ぶスパイキングニューラルネットワーク

このサイトはスパイキングニューラルネットワーク(SNN)を学びたい人に向けたオンライン学習サイトです．おすすめの対象者は，これからSNNを研究分野にしようとしている人神経回路をモデル化してシミュレーションしようとしている人新世代のAIモデルについてそれなりに詳しく知りたい人暇つぶしの読み物を求めている理系の人のいずれかに当てはまる人です．もちろん，いずれに該当しなくとも誰でもしっかりと知識として蓄えることができるように噛み砕いて，わかりやすく解説をすることを心がけて書いていますのでご安心ください．なお，プログラミングの知識は必要ありませんが，所々にPythonのサンプルコードを掲載しています．必要なひとは参考にしてください．ちなみに掲載しているコードは以下の環境があれば動作します． Python 3.6以上 NumPy Matplotlib 本サイトに掲載しているPy

misshiki 2024/04/22

ディープラーニング

リンク

Winnyの金子さんのED法について | やねうら王公式サイト

Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/it ems/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。当時の金子さんのホームページの

misshiki 2024/04/22

ディープラーニング

リンク

EDLA

誤差拡散学習法のサンプルプログラム 99/7/12 公開 99/7/16 詳細追加 99/8/6 一部修正 99/8/19 論文追加 99/10/27 経過報告 ED法サンプルプログラム（UNIX汎用、tgz、4KB）階層型神経回路網（ニューラルネットワーク）の教師あり学習アルゴリズムである誤差拡散学習法（ED法）のサンプルプログラムです。比較のために用いたバックプロパゲーション法（ＢＰ法）のサンプルプログラムも示しておきます。慣性項ありBP法のサンプルプログラム（UNIX汎用、tgz、4KB）なお、これらのプログラムでは、階層型構造をリカレント型の一種とみなして計算しています。また、パラメータ入力の際には、単にリターンを押すとデフォルト値（括弧の中の値）が用いられるようになっていますので、実行の際にはリターンを連打すればＯＫです。また、X-Windowを用いてトータルエラーのグラ

misshiki 2024/04/22

ディープラーニング

リンク

金子勇さんのED法を実装してMNISTを学習させてみた - Qiita

追記：続きを書きました。はじめに先日以下の記事が投稿され、その斬新な考え方に個人的ながら衝撃を受けました。内容をざっくり言うと、ニューラルネットワークの学習を現在の主流であるBP法（誤差逆伝播法）ではなく、ED法（誤差拡散法）という新しい学習手法を提案しているものです。もし記事の内容が本当ならニューラルネットワークの学習がO(1)でできてしまう事になり、まさしく革命が起きてしまいます。（結論からいうと速度面はそこまででもなかったです（それでも早くなる可能性あり））（ただこの新手法のポテンシャルは革命を起こす可能性は秘めているといっても過言ではありません） ED法に関してネットを探すとインターネットアーカイブに情報が少し残っていました。このページですがED法のサンプルプログラム（C言語）が残っており、このサンプルプログラムをベースにpythonで書き起こしたものが本記事となりま

misshiki 2024/04/22

ディープラーニング

リンク

もし「GitHub Copilot」を現役弁護士が使ったら？ - MNTSQ Techブログ

こんにちは。GitHub Copilotを先日初めて触って、感銘を受けたMNTSQ代表の板谷です。MNTSQの代表をしておりますが、現役の弁護士でもあります。なぜ私が、GitHub Copilotに感銘を受けたかというと、「プログラミングの LLM による進化」は、契約という言語をコーディングするためにもドンピシャで使えそうだと感じたからです。例えば、GitHub Copilot では、自分の過去のコードを参照して、最適なコードをサジェストしてくれます。これは、契約に関わるすべてのビジネスパーソンが求めていたものです！契約の 99.9%が過去のコードの使い回しであるにもかかわらず、毎回ゼロからコーディングするのが本当に苦痛だからです。ちなみに、前回契約と理由なく diff があると取引先に怒られます。笑しかし、GitHub Copilot 的なものがプログラミング言語だけでなく契約

misshiki 2024/04/22

“まもなく契約は、アルゴリズムが書き、交渉するものになるでしょう。なぜなら契約言語はプログラミングより圧倒的にパターン性が高いためです。”

人工知能

リンク

急増する「AI生成」による児童の性的虐待画像、OpenAIなどが対抗措置開始 | Forbes JAPAN 公式サイト（フォーブスジャパン）

AI画像ジェネレータの普及は、人工知能（AI）で生成した児童の性的虐待コンテンツ（CSAM）の急増につながっていることが、全米行方不明・被搾取児童センター（NCMEC）の新たなレポートで明かされた。 2023年に同団体の苦情受付窓口に寄せられたCSAM関連の報告は3620万件で、前年の3200万件から増加し、2019年のパンデミック前の件数の2倍以上に達している。この3620万件のうちの約5000件が生成AIを用いた画像だと判断されたが、実際の件数はそれ以上だと考えられている。 NCMECの苦情受付窓口担当者ファロン・マクナルティは、「報告件数の全体から見れば、かなり少ない件数に思えるが、私たちが懸念しているのは、報告を行う企業の検知能力が向上するにつれて、今後もこの件数が増え続けることだ」と語った。ここ1年でAIを用いた画像生成ツールが違法な性的虐待画像の作成に使用されているという報告

misshiki 2024/04/22

“AI画像ジェネレータの普及は、人工知能（AI）で生成した児童の性的虐待コンテンツ（CSAM）の急増につながっていることが、全米行方不明・被搾取児童センター（NCMEC）の新たなレポートで明かされた。”

リンク

アメリカ軍がAI自律戦闘機「X-62A」と人間が操縦する「F-16」の戦闘テストに成功

アメリカ空軍がAI搭載戦闘機「X-62A」の実機での戦闘テストに成功したことを発表しました。 ACE Program Achieves World First for AI in Aerospace https://www.darpa.mil/news-events/2024-04-17 USAF Test Pilot School and DARPA announce breakthrough in aerospace machine learning > Edwards Air Force Base > Article View https://www.edwards.af.mil/News/Article-View/Article/3744695/ アメリカの国防高等研究計画局(DARPA)はAI搭載戦闘機の実用化プロジェクト「Air Combat Evolution(ACE)」を推

misshiki 2024/04/22

“アメリカ空軍がAI搭載戦闘機「X-62A」の実機での戦闘テストに成功したことを発表しました。”

人工知能

リンク

文化庁『ＡＩと著作物に関する考え方』アプデ来たぞ

森川ジョージ @WANPOWANWAN 文化庁から「AIと著作権に関する考え方について」が発表されました。カギカッコ内の言葉で検索するとすぐ辿り着きます。興味のある方は目を通しておくといいと思います。 2024-04-19 17:22:58 ○ この資料は、文化審議会著作権分科会法制度小委員会で取りまとめられた「AIと著作権に関する考え方について」（以下「考え方」）の概要をまとめたものです。正確な記載内容は「考え方」本体をご確認ください。 ○ 「考え方」は、現行の著作権法の解釈について、公表時点における、小委員会としての一定の考え方を示すものです。「考え方」それ自体は法的な拘束力を有するものではなく、また現時点で存在する特定の生成.. 🪐真冬🪐 @wcolor3242 うぇい、文化庁の「考え方」来たで〜関心ある人は一読しとき〜言ってることはずっと概ね同じなんだけど、だんだんはっ

misshiki 2024/04/22

リンク

(PDF)文化審議会著作権分科会法制度小委員会「AIと著作権に関する考え方について」|文化庁著作権課

misshiki 2024/04/22

文化審議会著作権分科会法制度小委員会「AI と著作権に関する考え方について」【概要】令和6年4月版。説明ページがなくPDFファイルへのダイレクトリンクしかないのでPDFをブクマ。

リンク

「AI事業者ガイドライン（第1.0版）」を取りまとめました（METI/経済産業省）

経済産業省と総務省は、生成AIの普及を始めとする近年の技術の急激な変化等に対応すべく、有識者等と議論を重ね、関連する既存のガイドライン（注）を統合・アップデートし、「AI事業者ガイドライン（第1.0版）」を取りまとめました。（注）AI開発ガイドライン（平成29年、総務省）、AI利活用ガイドライン（令和元年、総務省）、AI原則実践のためのガバナンスガイドラインVer1.1（令和4年、経済産業省）概要 AI戦略会議（座長：松尾豊東京大学大学院工学研究科教授）で取りまとめられた「AIに関する暫定的な論点整理」（令和5年5月26日（金曜日））において、近年の生成AIの普及を踏まえ、既存のガイドラインに関して必要な改訂などを検討する必要性が示されました。それを受けて経済産業省及び総務省では、既存のガイドラインを統合・アップデートし、広範なAI事業者向けの統一的で分かりやすいガイドラインの検討を

misshiki 2024/04/22

“経産省と総務省は、生成AIの普及など近年の技術の急激な変化等に対応すべく、有識者等と議論を重ね、関連する既存のガイドラインを統合・アップデートし、「AI事業者ガイドライン（第1.0版）」を取りまとめた。”

リンク

「AI事業者ガイドライン（第1.0版）」　総務省と経産省が公開　既存ガイドラインを統合してアップデート、パブコメも反映

関連記事文化庁「AIと著作権の考え方」の“パブコメ反映版”はどんな内容？　弁護士が注目ポイント解説文化庁が公開した「AIと著作権に関する考え方について（素案）」に対するパブリックコメント。計2万4938件の意見が集まり、この結果を反映した「考え方」の最新版（2024年2月29日版）はどのような内容になったのか。弁護士が解説する。文化庁の「AIと著作権の考え方」を理解するための“3つのポイント”　弁護士が簡潔に解説約2万5000件のパブリックコメントが集まり、話題となっている文化庁の「AIと著作権に関する考え方について（素案）」。3月に発表となる最終版の発表を前に、その簡単な概要や位置付けについて紹介する。「AI事業者ガイドライン案」のパブコメ、20日から募集開始　生成AIの社会的リスクとどう向き合う？経済産業省と総務省は、生成AIの普及を踏まえてとりまとめた「AI事業者ガイドラ

misshiki 2024/04/22

“経済産業省と総務省は4月19日、「AI事業者ガイドライン（第1.0版）」を公開した。AI事業者向けに日本のAIガバナンスの指針を示した資料で、全36ページ。”

リンク

「ＡＩが発明者」企業・団体の８割が懸念…特許庁調査、実現性が検証されていない技術「増える」

【読売新聞】　特許庁の有識者委員会による調査で、人工知能（ＡＩ）を発明者と認めることの是非を聞いたところ、回答した企業・団体の８割が「問題をもたらす恐れがある」と懸念を示したことがわかった。製品や技術の実現性が検証されていない発明が

misshiki 2024/04/22

“人工知能（ＡＩ）を発明者と認めることの是非を聞いたところ、回答した企業・団体の８割が「問題をもたらす恐れがある」と懸念を示したことがわかった。”

リンク

さくらインターネット、生成AI向けクラウドサービス「高火力」を拡張整備 | さくらインターネット

また、さくらインターネットは、昨年6月にも「クラウドプログラム」の供給確保計画に関する経済産業省の認定を受けています。計画は大きく上回る引き合いがあり、前倒しで整備を実施しており2024年6月末までに完了する予定です。なお、本サービスの提供を予定している石狩データセンターは、北海道の冷涼な外気を活用した外気冷房および水力発電を中心とした再生可能エネルギー電源100％のCO2排出量ゼロを実現するデータセンターです。国内のAIインフラ市場規模は、IDC Japanによると、2022年から年間平均成長率16.6％で推移し、2027年には1,615億5,000万円になると予測されます※2。さくらインターネットでは、AIに関わるコンピューティングリソースを安定供給確保することが、日本のデジタル社会を発展させるために必要不可欠と考え、今回の整備を決定しました。さくらインターネットは今後も高まる

misshiki 2024/04/22

“生成AI向けクラウドサービス「高火力」には、2024年3月に発表された最新の「NVIDIA HGX B200 システム」をはじめとするGPUが約10,000基搭載され、合計約18.9EFLOPSの計算能力が整備されます。”

人工知能

リンク

産総研、NVIDIAと量子計算システム　有償で民間に - 日本経済新聞

経済産業省所管の研究機関である産業技術総合研究所は、米エヌビディアと協力して量子計算ができるシステムをつくる。2025年度以降に企業や研究者が有償で使えるようにする。量子計算は高速で複雑な計算処理が可能で、創薬研究や物流の効率改善につなげる。産総研がスーパーコンピューターと量子コンピューターをつなげた計算基盤「ABCI-Q」の運用を始める。量子コンピューターは単独では計算ミスが多い課題がある。

misshiki 2024/04/22

NVIDIA

リンク

生成AIのためのGPU投資、さくらインターネットが1000億円、KDDIも1000億円、GMOは100億円規模を発表。経済産業省の認定プログラムを受け

生成AIのためのGPU 投資、さくらインターネットが1000億円、KDDIも1000億円、GMOは100億円規模を発表。経済産業省の認定プログラムを受け経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのクラウドプログラムの認定を相次いで発表しました。認定を受けた企業は助成金を得ることができます。そしてこの助成金を含めた、生成AIのためのクラウド基盤整備に向けた投資計画を各社が明らかにしています。さくらインターネットやKDDIが1000億円をGPU関連に投資今回最大の助成金を受け取るのはさくらインターネットで、最大約500億円の助成金を受けることが発表されました。さくらインターネットは、すでに73億円の助成金が予定され、生成AI向けのクラウドサービスに3年間で130億円の投資をすると発表しています。そして今回の追

misshiki 2024/04/22

“今回最大の助成金を受け取るのはさくらインターネットで、最大約500億円の助成金を受けることが発表されました。”

人工知能

リンク

KDDI、AIスパコン参入へ　経産省がさくらインターネット・GMOなど5社に補助　【イブニングスクープ】 - 日本経済新聞

経済産業省は人工知能（AI）を開発する際に使うスーパーコンピューターの国内整備に乗り出す。AI開発が経済安全保障の観点で重要だと判断し、KDDIやさくらインターネットなど5社のAIスパコンの整備に計725億円を補助する。KDDIがAIスパコン事業に参入するのは初となる。膨大なデータ学習を必要とするAIや生成AIの開発には、高性能なコンピューターが欠かせない。日本国内の計算基盤は乏しく、AIの開

misshiki 2024/04/22

“AI開発が経済安全保障の観点で重要だと判断し、KDDIやさくらインターネットなど5社のAIスパコンの整備に計725億円を補助する。KDDIがAIスパコン事業に参入するのは初となる。”

人工知能

リンク

東工大スパコン「TSUBAME4.0」稼働開始！Webブラウザから利用可、創薬からLLMまで幅広く活用

misshiki 2024/04/22

“次世代スパコン「TSUBAME 4.0」を2024年4月1日にすずかけ台キャンパスで稼動開始した。前世代に比べて半精度演算で20倍の理論ピーク性能を持ち、AIやコンバージェンス/サイエンス(総合知/科学の収斂)に活用される。”

人工知能

リンク

AI（ChatGPT/Claude）で抄読会のスライド作成を瞬殺する方法｜genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

多くの研究者や医療従事者にとって、抄読会は情報収集と知識共有の重要な機会ですが、スライド作成には多くの時間と労力を費やしてしまいがちです。そこで、このプロセスを自動化するプロンプトを作成しました。使い方は簡単です。論文のPDFを添付し、プロンプトを入力するだけで、AIがその論文の要点をまとめたスライドの下書きを自動で生成してくれます。背景、方法、結果、考察、結論の各セクションごとにスライドが作成され、重要な情報が簡潔にまとめられます。ただし、このプロンプトを最大限活用するには、抄読会で取り上げるべき適切な論文を選ぶことが大切です。抄読会で選ぶべき論文のルールがある場合はそれをよく確認し、他の先生の貴重な時間を使って行うものなので、なるべく価値のある論文を選ぶようにしましょう。自信がない場合には選択が合っているか上級医に確認しましょう。具体的には、以下のような基準を満たす論文がおすすめで

misshiki 2024/04/22

“論文のPDFを添付し、プロンプトを入力するだけで、AIがその論文の要点をまとめたスライドの下書きを自動で生成してくれます。”

人工知能

リンク

GPT-4が眼科の医療試験で人間の専門医に匹敵するスコアをたたき出したとの研究結果

2018年に人間の医師と同等の精度で目の病気を診断できるAIが登場し、糖尿病が関連する眼病に至っては専門医より正確な診断が可能となるなど、AIは眼科の分野で目覚ましい進歩を遂げています。OpenAIの言語モデルを使用した新しい研究により、AIは目の状態を評価することにかけては人間の眼科医に引けを取らないことが確かめられました。 Large language models approach expert-level clinical knowledge and reasoning in ophthalmology: A head-to-head cross-sectional study | PLOS Digital Health https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000341 O

misshiki 2024/04/22

“OpenAIの言語モデルを使用した新しい研究により、AIは目の状態を評価することにかけては人間の眼科医に引けを取らないことが確かめられました。”

リンク

生成AIを使って漫画を1本描いてみた話｜とりにく

で、できたー！！！！！！！！！！！！！！『自分の絵でかつ、なるべくAIを活用する』方向で頑張ってみました！！！！リプ欄にAIの使いどころ続きます。 https://t.co/pNiqo2KDx8 pic.twitter.com/OZVT8fmR3f — とりにく (@tori29umai) April 14, 2024 今回は日記的な備忘録です。最後にちょっとだけ技術的なネタも話すけど。まぁ内容は、タイトルとおりです。本題に入る前に自己紹介を。私はとりにくです。気が付いたらフリーランスのエンジニアになっていた絵もちょっと描く人です。漫画を描いた経験は殆どありません。 AI以前だと、クリスタを購入してテンション上がった時の漫画？がありましたがなんかこう、そういう感じです（刀剣乱舞二次創作） AI以前に描いた漫画まぁ御覧の通り、ほとんど漫画カラテもお絵描きカラテもないことがわかるでし

misshiki 2024/04/22

AIの使いどころ： ①お手本を描かせる、②陰影を描かせる、③線画に入り抜きを付ける

人工知能

リンク

怒っている顔画像をAIであまり怒っていない表情に変形させる（笑って怒ってハイチーズ！に使われている技術_前編）

はじめにこんにちは！ Whatever Co. でエンジニアをしている登山です。お台場にある日本科学未来館では、2023 年 11 月に常設展示の大規模リニューアルが行われました。その中の一つである「老いパーク」では、「老い」をテーマに、老化による目・耳・運動器・脳の変化を疑似体験できるコンテンツが展示されています。日本科学未来館 web ページより引用 Whatever Co. は、「老いパーク」の企画・設計・制作を担当しました。（クレジットはこちらからご確認ください）本記事では、自分がテクニカルディレクションおよび実装を担当した、脳の変化を疑似体験できるコンテンツ「笑って怒ってハイチーズ！」の開発で使用した技術について解説します。（2 本立ての前編です。後編はこちら）どんなコンテンツ？「笑って怒ってハイチーズ！」（通称わらおこ）は、「年をとると、相手の怒りや悲しみな

misshiki 2024/04/22

“こんなに怒っていても、こんなふうに伝わるかも？でも、喜びの表情は伝わりやすい！”

リンク

ChatGPTや他3種の生成AIに、人生キャリアを相談して、各生成AIの応対を比較 →性能差・各特徴が見られる - Qiita

ChatGPT 3.5 無料版 ChatGPTに聞いてみます。質問結果全体: https://chat.openai.com/share/f21c9a9c-c445-4dd3-ae9d-328b03f28788 ▼私(人間) 研究開発(数値計算・定式化・最適化)をやっていたが、それから10年雑用係、これから何をしたらいい？ ▼ChatGPT(自動応答) 研究開発から雑用係に移行した後、新たなキャリアパスを模索することは一般的です。以下にいくつかのアイデアを提供しますが、これはあなたの興味やスキル、目標によって異なる可能性があります。それぞれのアイデアについて、関連するスキルや経験を活かす方法も考慮してみてください。従来の技術との関連性を活かしたキャリア: 数値計算や最適化の経験を生かし、関連する業界や企業でのポジションを探すことができます。例えば、エネルギー、製造業、自動車、航空宇宙な

misshiki 2024/04/22

人工知能

リンク

ファミマ、生成AIで一部業務の作業時間を約50％削減　対象となった業務は？

ファミリーマートは、生成AIの導入により、一部業務で作業時間を約50％削減できたと発表した。2023年12月から3カ月間にわたる実証実験を行い削減できる業務を特定したことで、新たに創出した時間をメディア事業など高付加価値の業務に活用する。作業時間の削減効果があった業務は、各種アンケートの集計作業や、社内文書および社員教育資料の作成、店舗経営を支援するスーパーバイザー（SV）から本部担当社員への問い合わせ対応。今後はSVの店舗コンサルティング業務領域で検証を継続し、加盟店に対してより効果的なコンサルティング業務の実現を目指す。導入した生成AIは、人型AIアシスタントの「レイチェル／アキラ」にも搭載し、効果的な店長業務の支援にもつなげていくという。ファミリーマートでは、生成AI活用の推進にあたり、全社横断の「生成AI プロジェクト」を立ち上げている。50人のプロジェクトメンバーが「セキュリテ

misshiki 2024/04/22

“ファミリーマートは、生成AIの導入により、一部業務で作業時間を約50％削減できたと発表した。”

人工知能

リンク

話題のAI「Command R+」無料iPhoneアプリで試せるように

AI関連企業Hugging FaceのJulien Chaumond CTOは4月18日、自身のXアカウントで、AIチャットサービス「HuggingChat」のiOS版アプリを発表した。 we just shipped HuggingChat on iOS 💬 The app is super polished and gives you access to the community's best open AI models, on the go. Give it a try! link to Appstore below ⤵️ pic.twitter.com/ZItn9NLpay — Julien Chaumond (@julien_c) April 18, 2024 HuggingChatは2023年4月、ブラウザー版の提供が始まったオープンソースのチャットAIサービス。メタのL

misshiki 2024/04/22

“AI関連企業Hugging FaceのJulien Chaumond CTOは4月18日、自身のXアカウントで、AIチャットサービス「HuggingChat」のiOS版アプリを発表した。 ”

人工知能

リンク

ローカルやOpenAIのモデルを使ってAIの力を借りながらメモを作成できるアプリ「Reor」を使ってみた

「Reor」はメモを書いている時に過去のメモの関連する部分が表示されたり、AIにメモの内容について質問したりできるメモ作成アプリです。AIモデルとしてOpenAIのモデルのほか、ローカルのモデルも利用可能とのことだったので、実際に使ってみました。 Reor https://www.reorproject.org/ Reorの公式サイトにアクセスし、「Downloads」をクリック。「Download for Windows」をクリックします。ダウンロードした実行ファイルをダブルクリック。「詳細情報」をクリックします。「実行」をクリック。インストーラーが起動するので「次へ」をクリックします。今回は特にインストール先を変更せず、そのまま「インストール」をクリックしました。「Reorを実行」にチェックマークが入っているのを確認し、「完了」をクリック。無事Reorが起動しました。初

misshiki 2024/04/22

“「Reor」はメモを書いている時に過去のメモの関連する部分が表示されたり、AIにメモの内容について質問したりできるメモ作成アプリ。AIモデルとしてOpenAIのモデルのほか、ローカルのモデルも利用可能。”

人工知能

リンク

10年後「AI」にできないことは❓ - Madenokoujiのブログ

「AI」が人類を超える日は早まっている「AI」研究の世界的権威であるレイ・カールワイツ博士は、2045年に「AI」が人類の知能と並ぶ、または超えるだろうと予想した。しかし、Chat GPTの登場など近年の動きは、この見方よりも早く到達しそうである。「AI」の進歩のスピードが速まっていることは、おそらく間違いない。最近「AI」に関しては、実際に企業で行われている取り組みや、それにより組織・人事・採用がどう変わるかとの内容へシフトしてきている。今後の社会にどんなインパクトをもたらすか、強い不安を感じる。より深刻に捉えているのは、30代，40代を中心とした、いわゆる社会の中堅の方達だと思われる。今後10年、或いはもっと短い期間で社会が大きく変わると予測し、行く末をより現実的に考えるなら、これからの自身の「食い扶持」をどうすればいいのかを気にしない訳にはいかないのだろう。 10年後も生き残る

misshiki 2024/04/22

“10年後”は結構長いから、予測が難しいと感じた。今予測できるのは、1年後とか、せめて3年後とかではないかと。

人工知能

リンク

「Valkey」がRedisを急速に置き換えつつあるーバックエンドエンジニアは地殻変動に備えよう

4月20日、DevOps.comが「Valkeyが急速にRedisを置き換えつつある（Valkey is Rapidly Overtaking Redis）」と題した記事を公開した。この記事では、Redisのソース利用可能なライセンスへの移行と、その結果として生じたValkeyへの大規模な移行について詳しく紹介されている。以下に、ポイントを絞って内容を紹介する。 Redisのライセンス変更による影響ちょうど一ヶ月ほど前（3/20）、 RedisがBSD 3-clauseライセンスからRedis Source Available License (RSALv2)およびServer Side Public License (SSPLv1)へとライセンスを変更した。 BSD 3-clauseライセンスは非常に寛容なオープンソースライセンスで、著作権表示と免責事項の維持が含まれるが、商用利用

misshiki 2024/04/22

“4月20日、DevOps.comが「Valkeyが急速にRedisを置き換えつつある（Valkey is Rapidly Overtaking Redis）」と題した記事を公開した。”

DB／ストレージ

リンク

Redisをフォークした「Valkey 7.2.5」安定版が早くも登場。AWS、Google、Oracle、Heroku、Alibaba Cloudなど賛同が広がる

Redisをフォークした「Valkey 7.2.5」安定版が早くも登場。AWS、Google、Oracle、Heroku、Alibaba Cloudなど賛同が広がる RedisをフォークしたValkeyが早くも安定版「Valkey 7.2.5」をリリース。Valkeyブランドのためのコードの変更が行われた。AWS主導で始まったが、Google CloudやOracle、Heroku、Alibaba Cloudなど賛同が広がっている。 Valkey 7.2.5のリリースノートによると、このバージョンはフォーク元であるRedis 7.2.4からブランド名をValkeyへ変更するための変更をソースコードに対して行ったものであり、Redis 7.2.4からプロトコル、API、リターン値、データファイルフォーマットなどの変更は行われていないと説明されています。 ValkeyはRedisをフォークした

misshiki 2024/04/22

“Linux Foundation傘下のValkeyプロジェクトは、同プロジェクトとして初めての正式版となる「Valkey 7.2.5」のリリースを発表しました。”

DB／ストレージ

リンク

タグ

2024年4月22日のブックマーク (51件)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス