TL;DR ベクトル検索だと、複数のステップを踏まないと答えられない質問の検索がむずい 「TomにEmil Eifrém(Neo4jのCEO)を紹介してくれる人は?」とかを検索むずい ナレッジグラフは構造化データと非構造化データをうまく扱えてベクトル検索の苦手を補える 課題はあるけどナレッジグラフは、Neo4jとLangchainで構築できるよ。 はじめに 今回はベクトル検索の苦手分野をどうしても補ってあげたいとおもっている筆者やまぐちが、ベクトル検索の苦手を補ってあげられるナレッジグラフに関してまとめていこうと思います。 少々長い記事ですが、ベクトル検索を労ってあげたいと思っている方はぜひ読んでください。 ベクトル検索の限界 以前の記事の最後にも少しだけ記載しましたが、ベクトル検索は以下の問題点があります。 必要な情報がTop Kのドキュメントには含まれていない可能性がある。 チャンクの
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し
コンピューター分野において「ハードウェア」の対比語で、 何らかの処理を行うコンピュータ・プログラムや、 関連する文書などを指す言葉である「ソフトウェア」。 一般的にはワープロソフト等のアプリケーションソフトウェアや、 OSなどのシステムソフトウェアに分類されています。 今回の翻訳元では、そのソフトウェアと日本人を絡めた投稿が。 「日本人は基本的にどんな技術でも優れており、 より勤勉に作業に取り組むにもかかわらず、 なぜかそれがソフトウェア面では当てはまらないのは奇妙だ。 偉大なソフトウェアに、日本発のものは存在しない」と、 ソフトウェア技術が唯一と言える日本人の弱点だと指摘しています。 この投稿に対し、外国人から様々な見解が寄せられていました。 その一部をご紹介しますので、ごらんください。 「日本は天才の宝庫だ!」 『世界を変えた日本の発明』の数々に海外から称賛の声 PexelsによるPi
世の中には、一見関係なさそうな物理現象がITシステムに不可思議な影響を及ぼすことがあります 例えば,500マイル以上離れた場所にメールが送れないという話だったり 中国人のAさんがお茶を入れると会社のネットが繋がらなくなる という話があります。 私の場合は、祖母が就寝するとDBインサートが失敗する、という状況でした 実家の見守りシステム 問題が起きているのは、離れた実家にいる一人暮らしの祖母の状態を見守るために作成した自作のシステムです。 気温や湿度、CO2濃度、明るさ、部屋のドアの開閉、冷蔵庫の開閉の状況をモニタリングできるようにしています。 Raspberry Piに各種センサが接続され、定期的にInfluxDBに送信し、Grafanaという可視化ツールでいつでも見られるようにしています。 これらの情報を見ることで、祖母の家の部屋の温度が適切か、活動しているか、部屋にいるかなどが分かりま
ゲームエンジン「Godot Engine」の利用者が、ここ数日大きく増加しているようだ。同エンジンは公式サイトやGitHubのほか、PCゲームストアを通じても配布されており、Steamでの同時接続ユーザー数が連日過去最高を更新している。 Godot Engineは、PC/モバイル/Web向けゲームおよびアプリを制作できる2D/3Dゲームエンジンだ。開発者のひとりJuan Linietsky氏が、かつて自身のスタジオのために手がけた内製エンジンがルーツとなっており、その後2014年に一般に公開された。オープンソースとして提供され、完全無料で利用可能。開発にかかるコストは寄付によって賄われているとのこと。 上に掲載した動画は、Godot Engineを用いて開発されたPC/コンソールゲームの紹介映像だ。『Brotato』や『Cassette Beasts』『Dome Keeper』などの人気タ
datasetsで公開されているデータセットはdatasets.list_datasets()で確認できます。 本記事の投稿現在(2021年2月24日)では680件のデータセットが公開されているようです。 import datasets # 公開されているデータセット一覧 print(datasets.list_datasets()[:10]) # 最初の10件だけ表示 print(len(datasets.list_datasets())) # 全件数も確認 # ['acronym_identification', 'ade_corpus_v2', 'adversarial_qa', 'aeslc', 'afrikaans_ner_corpus', 'ag_news', 'ai2_arc', 'air_dialogue', 'ajgt_twitter_ar', 'allegro_revi
こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。 なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。 例えば、リーダブルコードは「関数には空虚な名前(tmpとかretvalとか)でなく、エンティティの実体に即した名前をつけよう!」と提案しています。 これめっちゃわかります!!!なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。 しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット
本記事は、2022年夏季インターンシッププログラムで勤務された早川知志さんによる寄稿です。 はじめまして。2022年度のPFN夏季インターンに参加した早川知志です。普段はオックスフォード大学で数学(確率論・数値解析)の博士学生をしており、確率測度の離散化やそれにまつわる理論や応用に興味があります。 今回は、大学でやっていることとは趣旨を変えて、深層学習のエンターテインメント応用として二次元キャラクターの学習・生成タスクに取り組みました。 学んだキャラクターのCLIP embeddingを用いた生成例 1. Motivation オリジナルのキャラクターを描くときに角度や表情を微調整するのには途轍もない労力が必要です。筆者はイギリスでのロックダウン以来趣味でイラストや漫画を描こうとすることが増えたのですが、その過程でこのことに気付きました。生成モデルの力を借りて今までに描いたことのない構図で
イーロン・マスクがTwitter買ってからやったことまとめ2022.11.02 20:00205,229 satomi 洗面台もって水曜初出社のイーロン・マスク。 27日木曜深夜には買収が成立してツイートに、粛清に、マスコミ対応にと大忙しです。1週間の主な動きをまとめてみました。 トップを解任買収成立後真っ先にやったのがトップの解任です。具体的にはパラグ・アグラヴァル最高経営責任者(CEO)、ネド・シーガル最高財務責任者(CFO)、ショーン・エジェット最高法務責任者(GC)、ヴィジャヤ・ガッデ信頼&安全最高責任者が27日深夜のうちに一斉解任となりました。 ゴールデンパラシュート(巨額退職金)の金額については、 解任理由を明示することで計2億~6億ドル(約30億~89億円)もの巨額退職金の支払いを回避しようとしており、粛清された幹部たちが対抗手段を検討中です。 取締役会を解散してCEOに就任
rei@サブアカウント @Shanice79540635 2chのシステムは実はひろゆき氏が作ったものではなく「あめぞう掲示板」の全コピーであり、尚且つあめぞうは全盛期は(カウンタが正確なら)日本1のアクセス数を達成していた…という事実はインターネット古参勢もあまり知っていないんだよな twitter.com/iikagenni_siro… 2022-10-10 21:41:28 小山(凍) @iikagenni_siro_ ゼロ年代初頭のITバブル期に日本で最大級アクセスが集まるサイトでありながら、金融機関からの融資もIPOも経ずひたすら個人サイトの延長で運営し続け、最終的にオワコンになった2chって日本の起業風土がゴミカスであることの象徴みたいな事例だと思うんですよね。ひろゆきの無能だけが理由ではない。 2022-10-10 19:52:28
高精度な画像を生成できることで話題となっている「Stable Diffusion」が、どのように入力されたテキスト(プロンプト)からイラストを生成しているのかについて、機械学習関連のトピックについての解説動画などを投稿しているジェイ・アラマー氏が解説しています。 The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine learning one concept at a time. https://jalammar.github.io/illustrated-stable-diffusion/ アラマー氏は、テキストから印象的な画像を生成するAIの登場が、人間がアートを作成する方法が変わることを示していると主張。Stable Diffusionのリリースにより、比較的安いリソースで使用で誰もが高性能なモデルを使
10月6日、NovelAIのGitHubとかのプライベートリポジトリに第三者が侵入して、AIモデルやソースコードを丸っと盗んで流出させた。 [Announcement: Proprietary Software & Source Code Leaks] Greetings, NovelAI Community. On 10/6/2022, we experienced an unauthorized breach in the company's GitHub and secondary repositories. The leak contained proprietary software and source code for the services we provide. — NovelAI (@novelaiofficial) October 7, 2022
前回、Stable Diffusionをdanbooruデータセットを使用して追加学習することを試した。 今回は、自分でデータセットを作成して追加学習することを試す。 データセットには、画像とキャプションが揃っている必要があり、キャプションがない場合はCLIPで疑似ラベルを生成するなどする必要がある。 今回は、画像に対するキャプションがある「いらすとや」をスクレイピングして、データセットを作成した。 データセット作成 「いらすとや」から全ての画像とキャプションを取得した。 画像に複数バリエーションがある場合は、1つ目の画像のみを使用した。 キャプションは、日本語になっているため、Googleスレッドシートで、「=GOOGLETRANSLATE(XX,"ja","en")」を使って英語に変換を行った。 合計で、22891枚の画像とキャプションのセットが用意できた。 画像サイズ変換 画像は、5
手書きDX事業を展開するエスパリアール合同会社(本社:東京都渋谷区 代表社員:濵田純哉)は、AI手書き「手書きくん」を9月15日より法人向けサービスとしてリリース致します。 ■手書きくんとは? 写真で撮った手書き文字をAI学習させ、あなたの文字で代筆し、送付まで行うAI手書き営業マンです。 「手書きくん」は筆跡、筆圧、文字の大きさを学習し人間と同水準の手紙を作成可能です。(下記、参考動画) ■「手書きくん」のサービスの流れ ■自分の文字に自信が無い人でも安心 「手書きくん」はペン字師範の文字を学習済みなので、ペン字師範の文字で代筆可能です。 ■新しい手紙DX体験 ご利用シーン例 M&A仲介業者:新規営業のDMをペン字プロの文字で代筆し、お手紙をお届け。 不動産業界:お電話がつながらなかったお客様にお手紙を担当者の直筆でお届けすることでアポイントを獲得。 自治体:担当者の直筆文字を学習さ
どうもこんにちは、あんどう(@t_andou)です。 今回はかいどうさん(@odiak_)と一緒に、画像を入れるとそれに似た画像素材を生成してくれるサービスを作りましたので紹介させてください。 経緯 作ったもの 機能紹介 比較 比較1.お皿に何個かのいちごが乗っている写真 比較1-1.StableDiffusionのimg2imgを呪文無しで使った場合 比較1-2.ImageMartで生成したもの 比較2.某魔法の映画に出てきそうな男の人の画像 比較2-1.StableDiffusionのimg2imgを呪文無しで使った場合 比較2-2.ImageMartで生成したもの その他の例 最後に 本記事で利用した画像 経緯 以前、画像生成AIで書き出した画像を配布するサイトを作りましたが、その際に 今後は『検索をするように画像を生成して使うようになる。』そして『生成をするための文章をうまく表現す
#stablediffusion 完全に理解した pic.twitter.com/IR5yjnL07Y— すぎゃーん💯 (@sugyan) August 31, 2022 ということで少し触って遊んでみたのでメモ。 Stable Diffusion をザックリ理解 先月公開された Stable Diffusion。 stability.ai 高精度で美しい画像を出力できる高性能なモデルながら、Google Colab などでも手軽に動かせるし、 Apple silicon でもそれなりに動かせる、というのが魅力だ。 中身については 以下の記事の "How does Stable Diffusion work?" 以降のところが分かりやすい。 huggingface.co 図をそのまま引用させていただくと という仕組みになっていて、受け取る入力は "User Prompt" と "Late
画像生成AI「Stable Diffusion」は入力したキーワードに沿って画像を出力してくれるAIで、簡単なお絵かきとキーワードを合わせて意図した画像を生成したり、「この画像っぽい○○」といった指示でイメージを形にできたりと、さまざまな機能や手法が生み出されています。そんなStable Diffusionについて、「画像を学習するAIは、ウェブ上のどのような画像を学習しているのか?」という疑問を解明するために、23億枚のデータセットから1200万枚を抜粋して集計した調査結果を、技術者・ブロガーのアンディ・バイオ氏が公開しています。 Exploring 12 Million of the 2.3 Billion Images Used to Train Stable Diffusion's Image Generator - Waxy.org https://waxy.org/2022/0
ホーム ブログ 人工知能(AI)、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く