タグ

aiに関するmventuraのブックマーク (493)

  • 【聞いてくれ】増田がAIの文で埋まり始めてる件について思うこと

    最近増田を読んでて何か引っかかることが増えた 内容はそれっぽいのにどうも心に引っかからない 感情が見えないというか読み終わったあとに何も残らない よくよく見てると多分あれAIで書かれてる文章なんだよな 一見それっぽくて共感できそうなのに人間臭さが抜け落ちてる 体験談にしては起伏がなくて妙にまとまりすぎてる 悩みごともどこか抽象的でふわっとしててリアルじゃない 増田ってもっと生々しくて時に読んでてキツいくらいリア実ある場所だったと思う だから読む側も気持ちを寄せられたし時には救われたりもした もしそれがAIで量産された空っぽな共感風の文章に置き換わったら あの場の意味が薄れてしまう気がする 人の弱さとか矛盾とかそういうめんどくさい部分があるからこそ価値があったのに それを丸めた文章が増えるならただのきれいな言葉置き場になっちまうかもなと思った 当に増田たちは「内容が面白ければAI生成でもよ

    【聞いてくれ】増田がAIの文で埋まり始めてる件について思うこと
    mventura
    mventura 2025/04/21
    さっき魂の叫びを投稿してきたから、見つけてブクマしておくれ
  • ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) | テクノエッジ TechnoEdge

    OpenAIChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。 新モデルの特徴は、これまでで最高に強力なreasoning機能を持ち、Pythonを駆使してさまざまな解析を行い、Web検索も行い、さらに画像生成もできる。双方向にマルチモーダルな、いわば「全部入り」です。 OpenAIはさらに、「Codex CLI」というターミナルベースのプログラミング環境をオープンソースとして公開しました。OpenAI API Keyが必須のため、完全に無料ではありませんが、2万5000ドル分のAPI利用を提供する取り組みもスタート(最大で100万ドル)するとしています。 ChatGPT o3、音楽の分析はできる?では自分はまず何を試すかというと、Sunoなどを使って自

    ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) | テクノエッジ TechnoEdge
    mventura
    mventura 2025/04/17
    「(ここに良い感じのピアノソロ挿入)」
  • プログラミングの終焉は、世界の終焉を意味するのかもしれない|d

    最近、「AIによってプログラミングが終わる」みたいな話をよく聞くようになりました。 僕がなんとなく想像してたのは、AIが出てきたことで、今までの「プログラミング」っていう概念が変わるんだろうな、ということでした。 AIを使わない昔ながらのプログラマは、だんだん仕事がなくなっていくかもしれない。でも、AIをうまく使いこなせるプログラマは、たくさんのAIを部下みたいに使って、めちゃくちゃすごい成果を出すようになる。そんな風に、二極化する未来を考えていたんですよね。 たぶん、普段からAIに触れている人たちの間では、こういう考えって割と普通なんじゃないかな、と思います。 でも、最近になって、もしかしたらちょっと違う未来もあるのかもしれない、と感じるようになってきたんです。 AIがプログラミングを完全にできるようになるって、ただ人間が書いてたコードをAIが書くようになる、っていうだけの話じゃないのか

    mventura
    mventura 2025/04/13
  • 1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox) | テクノエッジ TechnoEdge

    最近、AIで曲を作りました。そのワークフローが結果的に、いろいろなAIツールを少しずつ使っていく、ちょっと面白いものになったので、その流れを紹介しつつ、最近のAIツールの進化についても触れていければと思います。 まず、完成したミュージックビデオを紹介しましょう。ここで使った動画の一部については、別記事で解説しています。 音楽パートの大まかな流れとしては、曲のモチーフ→曲の断片→歌詞制作→曲の完成→ボーカルの置き換え→メロディーの変更→コード譜取得→ピアノパートの追加→コーラスパートの追加→マスタリング、となります。 では、このワークフローを振り返っていきます。 曲のモチーフ:HeyGenのPhoto Avatarで桜の季節の画像を生成曲のモチーフは、桜が咲いている中にいるのイメージ。AI画像生成は、最初はDream BoothでファインチューニングしたStable Diffusion

    1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox) | テクノエッジ TechnoEdge
    mventura
    mventura 2025/04/08
    すでにやってみたいを超えるレベルの熱意
  • グーグルの「NotebookLM」、情報源の自動収集が可能に

    Lance Whitney (Special to ZDNET.com) 翻訳校正: 矢倉美登里 長谷睦 (ガリレオ) 2025-04-04 10:03 Googleの「NotebookLM」は便利なノート作成サービスで、広範囲の調査が必要なあらゆるタイプのプロジェクトをノートの形でまとめるのに理想的なツールだ。ただし通常の使い方では、必要なソース(情報源)をユーザーが収集して追加しなければならず、その後にNotebookLMがこれらのソースをプロジェクトに組み込むという流れになる。だが今後は、NotebookLM自体が適切なソースを収集してくれるので、ユーザーはさらに時間を節約できると、同サービスはうたっている。 米国時間4月2日に公開されたブログ投稿で、GoogleNotebookLMの新たなツール「Discover」を発表した。適切なソースを求めて手動でウェブを徹底的に調べる代わり

    グーグルの「NotebookLM」、情報源の自動収集が可能に
    mventura
    mventura 2025/04/05
  • 動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び (1/5)

    アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 圧倒的に性能が高い「Wan 2.1」の衝撃 ▲ファンタジー風の戦車を動かしている動画 Wan 2.1の性能の高さを

    動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び (1/5)
    mventura
    mventura 2025/04/01
  • 自分の画像をChatGPTでどんどん抽象化させていったけど、ちゃんと感性と時間をかけたアウトプットに見える「イラスト業界は本当に厳しいな…」

    油井俊哉 / Toshiya Yui @yui1048kitenoz AIは双眼鏡のように世界の解像度を変えられるツールだと思って接すると楽しい。 いろんな人にピントを合わせられるし、世界の新しい見方を教えてくれて発見がある。 2025-03-27 00:17:23

    自分の画像をChatGPTでどんどん抽象化させていったけど、ちゃんと感性と時間をかけたアウトプットに見える「イラスト業界は本当に厳しいな…」
  • ChatGPTの無料で使える画像生成がAI業界に革新を起こしたぞ!使い方&何ができるのか試してみた | ライフハッカー・ジャパン

    ChatGPT画像生成機能の使い方これまでChatGPTでは、新機能が搭載されると画面上のタブに新しいAIのモデル名が追加されるシステムが取られていました。 しかし、今回追加されたChatGPT画像生成機能は専用のモデルが用意されておらず、無料プランでも使うことができるChatGPT-4oに内蔵される形式となっています。 なので、画像生成を使ってみたいときは「GPT-4o」を選択すればOK。また、「GPT-4o」は無料ユーザーでも利用可能なので、登録さえすれば誰でもどこでも画像生成し放題なんです。 ではでは、さっそく画像生成を試していきましょう。 生成AIの中でも、画像生成ってイメージしたものがポンって出てきにくい印象があるんですよね。完成図を極限までイメージして、それを正確にAIに伝えられて、ようやく完成度60%レベルの画像が出てくる……って感じ。 それこそ、普段私の場合はざっくりイ

    ChatGPTの無料で使える画像生成がAI業界に革新を起こしたぞ!使い方&何ができるのか試してみた | ライフハッカー・ジャパン
    mventura
    mventura 2025/03/28
  • GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか

    はじめに Googleが2025年3月14日に発表したGemini-2.0と、続けてOpenAIが2025年3月26日に発表したGPT-4oの画像生成能力は、これまでの画像生成AIでは到達しえないレベルの制御性・品質での画像生成を実現しました。 ここ1年半ほど画像生成AIいじりを仕事にしてきた者としては、これまで積み上げてきた成果や進捗がすべて無に帰すレベルでの進化が突然起き、巨人にすべてを蹴散らされたという感じです。別のスキルを身につけたほうがいいかな… しかし一方で、この進化は決して1日にして為されたものではなく、これまでの研究成果が地道に蓄積された結果です。記事では、その驚異的な画像生成能力、ひいてはAny-to-Anyの生成能力の裏にある技術的な背景を、分かる範囲でサクッと解説していきます。 これまでの画像生成AI TL;DR: これまで広く利用されてきた画像生成AIは、拡散モデ

    GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか
    mventura
    mventura 2025/03/28
  • ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所

    時間2025年3月26日、OpenAIChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:

    ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所
    mventura
    mventura 2025/03/28
    修正が(自分で作成してるデータほどに思うようには)効かないというのが
  • なんか私のChatGPTだけ生成下手じゃない? なんでみんなそんなに上手にコントロールできるの?

    ふっく|AIと働く経営者🤖 @fukku_ai_BD Chat GPTとの壁打ちがビミョー、、、、って時は、「しっくりこないので話を戻します。フレームワーク〇〇〇〇を用いて、1つずつ丁寧に質問して。」と伝えると、一変するの知ってた? 敢えて壁打ちの途中で話を戻すことで、 「しっくりきてない現状」も理解してくれるので 経緯も読み取って精度の高い質問をしてくれます。 「その視点は無かった…」って人は ぜひコレを使い倒してください🙌 AIの活用法を学んでいても 特定の仕事の質や生産性しか向上しません。 賢いAIを賢いパートナーだと捉えるんです。 「AIとの働き方」を学ぶのが これからの時代で得する働き方ですよ。 2025-03-26 07:27:55

    なんか私のChatGPTだけ生成下手じゃない? なんでみんなそんなに上手にコントロールできるの?
  • ポイント・オブ・ノーリターン:プログラミング、AGI、アメリカ

    ポイント・オブ・ノーリターン:プログラミング、AGI、アメリカ 2025.03.26 Updated by yomoyomo on March 26, 2025, 00:00 am JST オライリー・メディアのコンテンツ戦略担当バイスプレジデントを務めるマイク・ルキダスは、以前よりプログラミングの未来について文章を書いており、ワタシもそれをフォローしてきました。 2019年5月には、プログラミング・ツールに関し、我々は未だ「パンチカード」を使っているようなものだと不満を表明した上で、「配管工」にたとえられる「ブルーカラー」のプログラマーにとってのプログラミングが、もっと視覚的なものになるべきと論じていますが、その背景には人工知能のコード作成機能がそうしたグラフィカル化を実現してくれるのではという期待がありました。 そして、この年の末には、ソフトウエアはニューラルネットワークの重み付けとし

    ポイント・オブ・ノーリターン:プログラミング、AGI、アメリカ
    mventura
    mventura 2025/03/26
  • ChatGPTの予測能力を爆上げするプロンプトが判明、「物語プロンプト」とはいったい何か? 【生成AI事件簿】ロシアによるウクライナ戦争の帰趨についても驚きの回答が | JBpress (ジェイビープレス)

    ChatGPTに「○○は将来どうなりますか?」と直接的に尋ねても、大抵は「確かなことは言えません」といった控えめな返答しか得られない。その背景には、未来の出来事を予測しないようChatGPTの頭脳であるLLM(大規模言語モデル)に調整が施されている可能性も指摘されている。ところが、プロンプトにある工夫を加えると、雄弁に未来を語り出すという。どういう工夫なのだろうか。(小林 啓倫:経営コンサルタント) 生成AIの予測力を上げるには 質問すれば何でも答えてくれる、便利な生成AI。いっそ未来のことも聞けないかというわけで、さまざまな形で生成AIを未来予測に活用する取り組みが行われてきたことは、この連載でも何度か取り上げた。 たとえば、専門家が編み出した「未来予測手法」に従うよう指示した生成AIは、予測精度が上がるという研究結果が出ている(参照記事)。 しかし、もっと簡単にChatGPTの予測精度

    ChatGPTの予測能力を爆上げするプロンプトが判明、「物語プロンプト」とはいったい何か? 【生成AI事件簿】ロシアによるウクライナ戦争の帰趨についても驚きの回答が | JBpress (ジェイビープレス)
    mventura
    mventura 2025/03/23
  • 【決定版】 Claude 3.7 Sonnetで作成した図解やプレゼンをPowerPointで編集可能にする方法(HTML対応)|Mavericks, Inc

    Claude 3.7 Sonnetのデザインセンスは極めて高く、イケてる図解やスライドをポン出しで生成することができます。以下のような投稿を見て感動し、Claudeに課金して、ワクワクしながら試してみた方も多いのではないでしょうか。 Claude 3.7 Sonnetの図解デザイン能力、あまりにもすごい。 ㅤ バズった「グラレコプロンプト」を参考に作成した、 ㅤ 幅広く使える有益デザインプロンプト10選をまとめました👇🧵 pic.twitter.com/al5n7Udf3c — すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) March 9, 2025 しかし残念なことに、生成された図解の編集は困難を極めます。Claudeに指示を出すことである程度は修正できるものの、言うことを中々聞いてくれずトークン切れにあったり、時間がかかりすぎて時短になっていなかったり、自

    【決定版】 Claude 3.7 Sonnetで作成した図解やプレゼンをPowerPointで編集可能にする方法(HTML対応)|Mavericks, Inc
    mventura
    mventura 2025/03/14
  • はじめてAIに感動したかもしれん

    youtube徘徊してたらおススメされた動画 【総集編】AIでクロノトリガーのオープニングからエンディングまで再現してみた (Chrono Trigger AI generated movie) https://www.youtube.com/watch?v=gu10UJlvNJo (またAIの粗製乱造クソ動画かよ) と思いながらも(そういやクロノトリガー30周年ってホッテントリで見たな)などと思い、 また、(AIのくせに結構尺長いし40万も再生されてんのすごいな)とちょっとだけ興味を惹かれたので ついタップしてしまった。 想像を超えてきた。 ちゃんとキャラがカッコいくてかわしいくて理想的な実写キャストになってて、映像表現もまあ割と破綻してるところ多いけどアクションとかに目をつむれば許容範囲だし、 セリフ[AI音声]は声色豊富で演技もギリ許せるレベルだし、なにより音楽[家音源無断使用[こ

    はじめてAIに感動したかもしれん
  • AIをシステム開発に活かすコツ、全部書く|kmagai

    今や、AIを活用してソフトウェア開発すること自体は一般的になり、一種のブームと化している。 しかし、Web上で見かけるのはワンショットでテトリスを作る程度の小規模なプロジェクトの話がほとんどで、驚けるものの、正直あまり実用性は無いように感じる。 俺たちが当に知りたいのはテトリスの作り方じゃねえ!現実の中規模以上のシステム開発で、いかに楽に良いものを作れるかだろ! ということで、まずは弊社から現時点のノウハウを全公開しようと思う。 弊社ではCursorを1年以上活用(サービスがGAになったタイミングから全社員で利用)しており、一定のノウハウを蓄積してきている自負がある。ただ、あくまで一例ではあるので、ぜひみなさんの現場での活用事例も共有してほしい! 免責事項AIエディタでの開発は、LLMとAIエディタの進化に伴い、常に変化している。 そのため、この記事で述べる方法論は、現時点での、弊社での

    AIをシステム開発に活かすコツ、全部書く|kmagai
  • CLINEに全部賭けろ

    Cline を使い始めて2ヶ月ぐらい経った。 自分の直感として、Cline は真のイノベーションの入口であり、そして開けてはいけないパンドラの箱でもあったと思う。 ここでいう Cline は Cline型コーディングエージェントであり、広義には Devin / Cursor や Copilot Agent 等を含む話。だが、後述するように Cline でしか見えない世界がある。 その先の未来に、プログラマとしての自分はフルベットする、という話をする。 私たちが知っているプログラミングの終焉 大事なことは次の記事に全部書いてある。まずこれを読んでほしい。 (Google翻訳) Steve Yegge 氏は、置き換えられるのはジュニアおよび中級レベルのプログラマーではなく、新しいプログラミング ツールやパラダイムを受け入れず過去に固執するプログラマーであると指摘しています。 <略> これはプロ

    CLINEに全部賭けろ
    mventura
    mventura 2025/02/27
  • いま文章を書くのに「CURSOR」を使わないのは損だ

    粘土板からプロンプトへ 人間が「ことば」を記録するようになったのは、紀元前3300年頃のメソポタミアでのことだそうだ。シュメール人たちが、粘土板に楔型文字を使って文字を印した。この人間が「ことば」を記録するという営みが、いま生成AIによって大きく変化しはじめている。 生成AIで「ことば」を生み出すといえば、ChatGPTでメールの返事を書かせたり、人間が書いたとしか思えない小説ができたといった話題もある。それらはどちらかというと、何か小石のようなものをジャラジャラとシャッフルして自分の納得するパターンを見つける特別な仕掛けのようなものだ。 それに対して、自分の頭の中にあるものを言葉として表現して、相手に伝えるための手段として生成AIを使うことも始まっている。それをいまのところいちばん理想に近い形で実現していると見られているのが、コードエディタ「CURSOR」(カーソル、カーサー)のようだ。

    いま文章を書くのに「CURSOR」を使わないのは損だ
    mventura
    mventura 2025/02/27
    自分は想像スピードに筆が追いつかず小説の完成を諦めたが、台本のような走り書きは大量に残っている。当時AIがあれば書き上げていたかもしれんと思った。
  • 米グーグルの倫理規範、「兵器にAIを使用せず」の文言を削除

    グーグルの倫理規範が改定され「兵器にAIを使用せず」としていた文言が削除された/David Paul Morris/Bloomberg/Getty Images ニューヨーク(CNN) 米グーグル人工知能(AI)の使用に関する倫理規範を改定し、「兵器や監視活動にAIを使用しない」としていた文言を削除した。 改定前の倫理規範には、兵器など人の殺傷を目的とした技術や、国際的な規範を超えた監視活動に使われる技術にはAIを使用しないと明記していた。 しかし改定後の倫理規範からは、そうした文言が消えていた。 米オープンAIが2022年に「チャットGPT」を公開して以来、AIをめぐる競争がとてつもないペースで激化する一方、透明性や倫理性に関する法規制は利用増大に追い付かなくなった。そうした中でグーグルは、自らに課した制約を緩めることにしたらしい。 グーグルは4日、公式ブログで「複雑化が進む地政学的

    米グーグルの倫理規範、「兵器にAIを使用せず」の文言を削除
    mventura
    mventura 2025/02/05
    軍事を産業にしたらダメなのよ。縮小する方に向かないと文明は破綻するんだけど、まあ遠い位置にいるよね。
  • 卒論指導してるんだが、色々ともう難しいかもしれない

    生成AIの登場で卒論クオリティは様々な面で変化した 高偏差値大学ではあるので,卒論そのものが生成AIによって書かれている,なんてことはさすがにあり得ない 大体,教員が与えたテーマは答えがまだないことが多いので,自動生成は難しいのだ では,どこに出てくるかというと,卒論生が書くコードと計算結果だ 「こういうモデル作って,こういう計算してみたら,こういう結果になると思うから,計算してみて」と指示すると 1週間も経たずに計算結果を出してくる.すごい!今年の卒論生は優秀だ!と思い,計算結果をよくよく眺めると,何かおかしい. 「こういう傾向になるのは理屈上おかしい気がするなぁ.ほんとにこの結果だと大発見だけど,僕の勘では計算コードにバグがあると思う.確認してくれる?」 と尋ねると,全く進捗報告をしてくれなくなる. 「こないだの計算のバグかもって話どうなった?」って聞くと, 「ChatGPTが書いたコ

    卒論指導してるんだが、色々ともう難しいかもしれない