このnoteでは現役のWebメディア編集者の目線で、 文章や写真、コンテンツ作成について語っています。 最近こんな投稿をしたところ、さまざまな反響を得られました。 このアカウント@tokakudo で古写真をアップしているんだけど、人物写真をあげると、ここ最近「AIだろ」とコメントが付くようになったわよ。 むしろAIと思われるような、現代人には不可能な表現や活動をしていた人がいたことを反応から分かって、改めて歴史って面白いなと感じている。 pic.twitter.com/kCxZFIYG81 — 勝田健太郎 (@katsuta_kentaro) July 19, 2024 この写真は昭和10年(1935年)に毎日新聞社によって撮影されたもので、 写真に映るのは今はなき有楽町更科さんです。 現代だとUberEatsの配達員さんは目にするものの、 蕎麦屋のクラシックな出前スタイルを見る光景はな
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提
「当然の時代の流れだった」と思っているという話。 最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。 あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。 それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストで食っていた。 ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。 ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGやVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。 (そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う) 絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ
(普段日記みたいな物を書かない癖に勢いで書き殴っているからすごい読みにくいと思う、また題名でお察しだが反AIに対し攻撃的な事書くから嫌な方はブラウザバック推奨) 「何でAI絵師をリツイートやフォローして回るオタクがこんなに居るんだ?気が知れなすぎる。脳に障害あるだろコイツら、それとも全員業者なのか?」 数週間前、上記のようなツイートがフォローしていた絵師のリツイートから流れてきた。 大元のツイート投稿者も絵描きで、完全に一言一句を覚えている訳ではないが「脳に障害あるだろ」という言葉はよく覚えている。 一応私はAI絵と分かる投稿垢は気分的に殆どリツイートもフォローもしていなかった。法に照らして問題は無いんだぞと言われても倫理的には別だろう、三店方式スパチャや転売等と同じであまりにやり方がモラルを欠いていると否定的な意識を抱いていた。 しかしFF内の友人達には違う者も多かった。特に親しい親友の
経済産業省では、進化・発展を続けている生成AIのコンテンツ制作への利活用の可能性に着目し、コンテンツ制作に携わる産業界のみなさまに向けて、利活用の方向性をお示しするガイドブックを作成・公表しました。 趣旨・概要 経済産業省では、進化・発展を続けている生成AIのコンテンツ産業における活用可能性に着目し、利活用の促進に向けて、特にゲーム・アニメ・広告の各産業における利活用ケースを調査し整理するとともに、政府関係省庁の各種ガイドライン等を前提として、コンテンツ制作において生成AIを利活用する際の法的留意点及び対応策を検討してまいりました。このたび、それらの調査・検討等の成果として、コンテンツ制作に携わる産業界のみなさまに向けて、知的財産権等の権利・利益の保護に十分に配慮した、コンテンツ制作における生成AIの適切な利活用の方向性をお示しするものとして、「コンテンツ制作のための生成AI利活用ガイドブ
大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ
かなり前から「ChatGPTに学術論文を(英語で)書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。 もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告!📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。 (限界助教先生の記事
はじめに 「Knowledge Graph(知識グラフ)」は、情報を関連付けて構造化するグラフベースのデータモデルです。エンティティ(例:人、物、場所、概念など)間の関係をノードとエッジで表現することができます。以前紹介したRetrieval(本記事の下に該当記事へのリンクがあります)を用いた方法と似ているのですが、Retrievalが基本的には1:Xでデータベースから回答に関連した情報を探しにいくのに対し、知識グラフでは、逆引きを含むX:Xのような情報が複雑に関連している場合や、複雑なクエリの解決に役立ちます。一方で、情報の正確性確保やスケーラビリティの問題などの課題も存在します。 今回は、Langchainを使用して、テキストから知識グラフを構築し、その知識グラフを基に質問応答を行う方法について解説します。知識グラフを使うことで、ChatGPTだけでは回答の難しい、現在の出来事や専門知
TL;DR ベクトル検索だと、複数のステップを踏まないと答えられない質問の検索がむずい 「TomにEmil Eifrém(Neo4jのCEO)を紹介してくれる人は?」とかを検索むずい ナレッジグラフは構造化データと非構造化データをうまく扱えてベクトル検索の苦手を補える 課題はあるけどナレッジグラフは、Neo4jとLangchainで構築できるよ。 はじめに 今回はベクトル検索の苦手分野をどうしても補ってあげたいとおもっている筆者やまぐちが、ベクトル検索の苦手を補ってあげられるナレッジグラフに関してまとめていこうと思います。 少々長い記事ですが、ベクトル検索を労ってあげたいと思っている方はぜひ読んでください。 ベクトル検索の限界 以前の記事の最後にも少しだけ記載しましたが、ベクトル検索は以下の問題点があります。 必要な情報がTop Kのドキュメントには含まれていない可能性がある。 チャンクの
最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。 ローカルLLMって何じゃ?というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。 オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。 だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題 & OpenAIがAIベンチャー皆殺しにしてしまう問題 まず「結局GPTのAPIを叩いてサービス運営して成功し
日本を代表する文化の1つである漫画。近年、漫画制作においても生成AIの活用が進展している。生成AIは、キャラクター設定から背景描写までさまざまな段階で作家を支援するだけでなく、効率性や創造性の向上にも寄与している。本講演では、創作の現場でAIを活用している漫画家ユニット「うめ」の小沢高広氏に、現役の漫画家が生成AI技術をどのように取り入れているのか、現在連載中の作品においての実際の使用例を中心に紹介いただいた。テキスト生成AIと画像生成AIのそれぞれの具体例、さらに、生成AIの普及が漫画業界に与える影響や今後の展望、生成AIが将来的に漫画家の仕事を奪うのか否かなど、多角的に考察いただいた。 二人組漫画家「うめ」のシナリオ・演出を担当している小沢高広と申します。僕はいろんなことを割と早め早めにやってしまう方で、2004年に原稿のデジタル入稿をやったり、Twitter(現X)を漫画に登場させた
樋口紀信@疫神のカルテ全3巻 @susujinkou 《読者の皆様へ》【二次創作禁止のお知らせ】 LoRAの話題から離れている間は全く平気なのですが、この話題になるとかなり辛いです。 申し訳ありませんが、『樋口紀信LoRA』を使われる可能性から、ファンアートを含めた自著の二次創作を一切禁止します。(続) 2024-03-20 16:47:07 樋口紀信@疫神のカルテ全3巻 @susujinkou あのLoRAで自著のキャラを描かれるのも、その他の画像生成AIで二次創作されるのも、それらと手描きの区別をつけなければならないのも、今は無理です。 耐性が付き次第、また解禁します…!! ホントすみません!! 2024-03-20 16:47:08 リンク となりのヤングジャンプ [第1話] 疫神のカルテ - 樋口紀信 | となりのヤングジャンプ 「疫神症候群」それは超常能力を発現し、やがて死に至る
2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について(素案)」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント(パブコメ)」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について(素案)令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。 文化庁 文化審議会 著作権分科会 法制度小委員会(第7回) パブコメへの反応は「素案の内容周知」 発表物から議論を集めたのが発表資料に「パブコメの結果」が追加
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く