[B! programming] myrmecoleonのブックマーク

Constructing knowledge graphs from text using OpenAI functions: Leveraging knowledge graphs to power LangChain Applications

myrmecoleon 2024/05/24

リンク

ベクトル検索の苦手を克服。ナレッジグラフでRAGを作る

TL;DR ベクトル検索だと、複数のステップを踏まないと答えられない質問の検索がむずい「TomにEmil Eifrém（Neo4jのCEO）を紹介してくれる人は？」とかを検索むずいナレッジグラフは構造化データと非構造化データをうまく扱えてベクトル検索の苦手を補える課題はあるけどナレッジグラフは、Neo４jとLangchainで構築できるよ。はじめに今回はベクトル検索の苦手分野をどうしても補ってあげたいとおもっている筆者やまぐちが、ベクトル検索の苦手を補ってあげられるナレッジグラフに関してまとめていこうと思います。少々長い記事ですが、ベクトル検索を労ってあげたいと思っている方はぜひ読んでください。ベクトル検索の限界以前の記事の最後にも少しだけ記載しましたが、ベクトル検索は以下の問題点があります。必要な情報がTop Kのドキュメントには含まれていない可能性がある。チャンクの

myrmecoleon 2024/05/24

リンク

最近ローカルLLMがアツいらしい

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

myrmecoleon 2024/05/22

リンク

海外「日本人は真面目過ぎるんだよ」何で日本人は万能なのにこの分野だけは苦手なんだ？

コンピューター分野において「ハードウェア」の対比語で、何らかの処理を行うコンピュータ・プログラムや、関連する文書などを指す言葉である「ソフトウェア」。一般的にはワープロソフト等のアプリケーションソフトウェアや、 OSなどのシステムソフトウェアに分類されています。今回の翻訳元では、そのソフトウェアと日本人を絡めた投稿が。「日本人は基本的にどんな技術でも優れており、より勤勉に作業に取り組むにもかかわらず、なぜかそれがソフトウェア面では当てはまらないのは奇妙だ。偉大なソフトウェアに、日本発のものは存在しない」と、ソフトウェア技術が唯一と言える日本人の弱点だと指摘しています。この投稿に対し、外国人から様々な見解が寄せられていました。その一部をご紹介しますので、ごらんください。「日本は天才の宝庫だ！」『世界を変えた日本の発明』の数々に海外から称賛の声 PexelsによるPi

myrmecoleon 2024/02/27

21世紀にもなってソフトウェア開発者の国籍を問題にすることの意味がわからない。一国籍のプログラマだけで作られてるソフトウェアの方が珍しくない？

リンク

全俳句データベースVer.2

ぜんぶの俳句のデータベースです

myrmecoleon 2024/01/08

リンク

祖母が就寝するとDBインサートができなくなる - Qiita

世の中には、一見関係なさそうな物理現象がITシステムに不可思議な影響を及ぼすことがあります例えば,500マイル以上離れた場所にメールが送れないという話だったり中国人のAさんがお茶を入れると会社のネットが繋がらなくなるという話があります。私の場合は、祖母が就寝するとDBインサートが失敗する、という状況でした実家の見守りシステム問題が起きているのは、離れた実家にいる一人暮らしの祖母の状態を見守るために作成した自作のシステムです。気温や湿度、CO2濃度、明るさ、部屋のドアの開閉、冷蔵庫の開閉の状況をモニタリングできるようにしています。 Raspberry Piに各種センサが接続され、定期的にInflux DBに送信し、Grafanaという可視化ツールでいつでも見られるようにしています。これらの情報を見ることで、祖母の家の部屋の温度が適切か、活動しているか、部屋にいるかなどが分かりま

myrmecoleon 2024/01/08

えっ　となったが理由は納得。面白かった。

リンク

ゲームエンジン「Godot Engine」の利用者が急増中。Unityの新料金システム発表を受け、乗り換えを模索する動き活発化か - AUTOMATON

ゲームエンジン「Godot Engine」の利用者が、ここ数日大きく増加しているようだ。同エンジンは公式サイトやGitHubのほか、PC ゲームストアを通じても配布されており、Steamでの同時接続ユーザー数が連日過去最高を更新している。 Godot Engineは、PC/モバイル/Web向けゲームおよびアプリを制作できる2D/3Dゲームエンジンだ。開発者のひとりJuan Linietsky氏が、かつて自身のスタジオのために手がけた内製エンジンがルーツとなっており、その後2014年に一般に公開された。オープンソースとして提供され、完全無料で利用可能。開発にかかるコストは寄付によって賄われているとのこと。上に掲載した動画は、Godot Engineを用いて開発されたPC/コンソールゲームの紹介映像だ。『Brotato』や『Cassette Beasts』『Dome Keeper』などの人気タ

myrmecoleon 2023/09/18

リンク

自然言語処理のサンプルデータセットを簡単に取り扱えるライブラリdatasetsの紹介 - Qiita

datasetsで公開されているデータセットはdatasets.list_datasets()で確認できます。本記事の投稿現在（2021年2月24日）では680件のデータセットが公開されているようです。 import datasets # 公開されているデータセット一覧 print(datasets.list_datasets()[:10]) # 最初の10件だけ表示 print(len(datasets.list_datasets())) # 全件数も確認 # ['acronym_identification', 'ade_corpus_v2', 'adversarial_qa', 'aeslc', 'afrikaans_ner_corpus', 'ag_news', 'ai2_arc', 'air_dialogue', 'ajgt_twitter_ar', 'allegro_revi

myrmecoleon 2023/03/14

リンク

もし「リーダブルコード」を弁護士が読んだら？ - MNTSQ Techブログ

こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。例えば、リーダブルコードは「関数には空虚な名前（tmpとかretvalとか）でなく、エンティティの実体に即した名前をつけよう！」と提案しています。これめっちゃわかります！！！なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット

myrmecoleon 2022/12/27

リンク

ベクトル埋め込みの最適化によるアイデンティティを保ったキャラクター生成 Preferred Networks Research & Development

本記事は、2022年夏季インターンシッププログラムで勤務された早川知志さんによる寄稿です。はじめまして。2022年度のPFN夏季インターンに参加した早川知志です。普段はオックスフォード大学で数学（確率論・数値解析）の博士学生をしており、確率測度の離散化やそれにまつわる理論や応用に興味があります。今回は、大学でやっていることとは趣旨を変えて、深層学習のエンターテインメント応用として二次元キャラクターの学習・生成タスクに取り組みました。学んだキャラクターのCLIP embeddingを用いた生成例 1. Motivation オリジナルのキャラクターを描くときに角度や表情を微調整するのには途轍もない労力が必要です。筆者はイギリスでのロックダウン以来趣味でイラストや漫画を描こうとすることが増えたのですが、その過程でこのことに気付きました。生成モデルの力を借りて今までに描いたことのない構図で

myrmecoleon 2022/11/08

やりたかったことをやってるなあ。現在i2iと呼ばれてるのは初期ノイズとして任意の画像を使うことだけど、原理的に文章プロンプトの代わりに画像も使えるはず、と思ってたのが実現されてる。

リンク

イーロン・マスクがTwitter買ってからやったことまとめ

イーロン・マスクがTwitter買ってからやったことまとめ2022.11.02 20:00205,229 satomi 洗面台もって水曜初出社のイーロン・マスク。 27日木曜深夜には買収が成立してツイートに、粛清に、マスコミ対応にと大忙しです。1週間の主な動きをまとめてみました。トップを解任買収成立後真っ先にやったのがトップの解任です。具体的にはパラグ・アグラヴァル最高経営責任者（CEO）、ネド・シーガル最高財務責任者（CFO）、ショーン・エジェット最高法務責任者（GC）、ヴィジャヤ・ガッデ信頼＆安全最高責任者が27日深夜のうちに一斉解任となりました。ゴールデンパラシュート（巨額退職金）の金額については、解任理由を明示することで計2億～6億ドル（約30億～89億円）もの巨額退職金の支払いを回避しようとしており、粛清された幹部たちが対抗手段を検討中です。取締役会を解散してCEOに就任

myrmecoleon 2022/11/03

リンク

2ちゃんねるの開設当初の裏話をひろゆきが発言

rei@サブアカウント @Shanice79540635 2chのシステムは実はひろゆき氏が作ったものではなく「あめぞう掲示板」の全コピーであり、尚且つあめぞうは全盛期は（カウンタが正確なら）日本1のアクセス数を達成していた…という事実はインターネット古参勢もあまり知っていないんだよな twitter.com/iikagenni_siro… 2022-10-10 21:41:28 小山（凍） @iikagenni_siro_ ゼロ年代初頭のITバブル期に日本で最大級アクセスが集まるサイトでありながら、金融機関からの融資もIPOも経ずひたすら個人サイトの延長で運営し続け、最終的にオワコンになった2chって日本の起業風土がゴミカスであることの象徴みたいな事例だと思うんですよね。ひろゆきの無能だけが理由ではない。 2022-10-10 19:52:28

myrmecoleon 2022/10/15

リンク

画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解

高精度な画像を生成できることで話題となっている「Stable Diffusion」が、どのように入力されたテキスト(プロンプト)からイラストを生成しているのかについて、機械学習関連のトピックについての解説動画などを投稿しているジェイ・アラマー氏が解説しています。 The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine learning one concept at a time. https://jalammar.github.io/illustrated-stable-diffusion/ アラマー氏は、テキストから印象的な画像を生成するAIの登場が、人間がアートを作成する方法が変わることを示していると主張。Stable Diffusionのリリースにより、比較的安いリソースで使用で誰もが高性能なモデルを使

myrmecoleon 2022/10/09

リンク

NovelAIのリークで何が終わったのか？

10月6日、NovelAIのGitHubとかのプライベートリポジトリに第三者が侵入して、AIモデルやソースコードを丸っと盗んで流出させた。 [Announcement: Proprietary Software & Source Code Leaks] Greetings, NovelAI Community. On 10/6/2022, we experienced an unauthorized breach in the company's GitHub and secondary repositories. The leak contained proprietary software and source code for the services we provide. — NovelAI (@novelaiofficial) October 7, 2022

myrmecoleon 2022/10/09

リンク

Stable Diffusionを「いらすとや」で追加学習する - TadaoYamaokaの開発日記

前回、Stable Diffusionをdanbooruデータセットを使用して追加学習することを試した。今回は、自分でデータセットを作成して追加学習することを試す。データセットには、画像とキャプションが揃っている必要があり、キャプションがない場合はCLIPで疑似ラベルを生成するなどする必要がある。今回は、画像に対するキャプションがある「いらすとや」をスクレイピングして、データセットを作成した。データセット作成「いらすとや」から全ての画像とキャプションを取得した。画像に複数バリエーションがある場合は、1つ目の画像のみを使用した。キャプションは、日本語になっているため、Googleスレッドシートで、「=GOOGLETRANSLATE(XX,"ja","en")」を使って英語に変換を行った。合計で、22891枚の画像とキャプションのセットが用意できた。画像サイズ変換画像は、5

myrmecoleon 2022/09/19

リンク

写真から筆跡を学習し、ペンで代筆するAI手書き「手書きくん」を正式リリース

手書きDX事業を展開するエスパリアール合同会社（本社：東京都渋谷区　代表社員：濵田純哉）は、AI手書き「手書きくん」を9月15日より法人向けサービスとしてリリース致します。 ■手書きくんとは？写真で撮った手書き文字をAI学習させ、あなたの文字で代筆し、送付まで行うAI手書き営業マンです。「手書きくん」は筆跡、筆圧、文字の大きさを学習し人間と同水準の手紙を作成可能です。（下記、参考動画） ■「手書きくん」のサービスの流れ ■自分の文字に自信が無い人でも安心「手書きくん」はペン字師範の文字を学習済みなので、ペン字師範の文字で代筆可能です。 ■新しい手紙DX体験　ご利用シーン例 M&A仲介業者：新規営業のDMをペン字プロの文字で代筆し、お手紙をお届け。不動産業界：お電話がつながらなかったお客様にお手紙を担当者の直筆でお届けすることでアポイントを獲得。自治体：担当者の直筆文字を学習さ

myrmecoleon 2022/09/16

リンク

【画像生成AI】素材画像を作るWebサービスを作りました【無料】 - ニートの言葉

どうもこんにちは、あんどう(@t_andou)です。今回はかいどうさん(@odiak_)と一緒に、画像を入れるとそれに似た画像素材を生成してくれるサービスを作りましたので紹介させてください。経緯作ったもの機能紹介比較比較1.お皿に何個かのいちごが乗っている写真比較1-1.StableDiffusionのimg2imgを呪文無しで使った場合比較1-2.ImageMartで生成したもの比較2.某魔法の映画に出てきそうな男の人の画像比較2-1.StableDiffusionのimg2imgを呪文無しで使った場合比較2-2.ImageMartで生成したものその他の例最後に本記事で利用した画像経緯以前、画像生成AIで書き出した画像を配布するサイトを作りましたが、その際に今後は『検索をするように画像を生成して使うようになる。』そして『生成をするための文章をうまく表現す

myrmecoleon 2022/09/13

こういうimg2imgできると使い勝手良さそうだなあと思ってた。どうやって実装してるのだろ。

リンク

Stable Diffusionでmorphing - すぎゃーんメモ

#stablediffusion 完全に理解した pic.twitter.com/IR5yjnL07Y— すぎゃーん💯 (@sugyan) August 31, 2022 ということで少し触って遊んでみたのでメモ。 Stable Diffusion をザックリ理解先月公開された Stable Diffusion。 stability.ai 高精度で美しい画像を出力できる高性能なモデルながら、Google Colab などでも手軽に動かせるし、 Apple silicon でもそれなりに動かせる、というのが魅力だ。中身については以下の記事の "How does Stable Diffusion work?" 以降のところが分かりやすい。 huggingface.co 図をそのまま引用させていただくとという仕組みになっていて、受け取る入力は "User Prompt" と "Late

myrmecoleon 2022/09/08

面白い

リンク

23億枚もの画像で構成された画像生成AI「Stable Diffusion」のデータセットのうち1200万枚がどこから入手した画像かを調査した結果が公開される

画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか？」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0

myrmecoleon 2022/09/01

リンク

Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権｜知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

ホームブログ人工知能（ＡＩ）、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権｜知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ（画像）自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章（呪文）を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です（サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが）。で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま

myrmecoleon 2022/09/01

“実は著作権が発生しないAI生成物の方が少数なのかもしれません。”これ、触る以前は別の考えだったのだけど、実際にAIで生成してみると確かに妥当なんだよな。AIによる自動生成てかなり人が関わる必要がある。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (404)

programmingに関するmyrmecoleonのブックマーク (859)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス