ふだん、AIとどんな対話したり、どうやってプロンプトを組み立ててるの?ときかれたので、最近のGemini pro 2.5さんとの対話のコピペ。こういうの会話してると、普通に1日とけたり徹夜できてしまうので怖い。 問1ロボットの形状を人間に似せてしまうと、ロボットの自由度が人間の形状に制約され、探索可能な可能性空間が限定される。同様の問題は形而上でも発生すると類推できるので、AIの思考形態や思考法を人間に似せてしまうと、同様に探索可能な可能性空間が限定されてしまう… という仮説について考察 深津の質問Gemini内部推論1ユーザーは、ロボットの形状を人間に似せると自由度が制約されるように、AIの思考形態を人間に似せると思考の可能性空間が限定されるのではないか、という仮説について考察を求めている。 この仮説について、以下の点を考慮して考察を展開する。仮説の根拠(類推の妥当性): ロボットの物理
📝 Markdown Generation 🧹 Clean Markdown: Generates clean, structured Markdown with accurate formatting. 🎯 Fit Markdown: Heuristic-based filtering to remove noise and irrelevant parts for AI-friendly processing. 🔗 Citations and References: Converts page links into a numbered reference list with clean citations. 🛠️ Custom Strategies: Users can create their own Markdown generation strategies tail
2025年3月20日、OpenAIから音声エージェントの可能性を一気に広げる最新のAudio APIが公開されました。特に注目したいのは、今回発表されたテキスト読み上げ(Text-to-Speech, TTS)モデルの『GPT-4o-mini-tts』です。 このモデルの最大の特徴は、これまでのTTSモデルとは違い、単に「何を話すか」だけでなく、「どのように話すか」を具体的に指示できるようになったことです。たとえば、「明るく元気なラジオDJのように話して」「カスタマーサービス担当者風でお願い」など、話し方のスタイルや感情まで自在にカスタマイズすることが可能になっています。 これにより、音声エージェントはこれまで以上に人間らしく、自然なコミュニケーションが可能になります。 現時点では、このモデルは英語に最適化されていますが、日本語でも十分に自然で品質の高い音声を生成できるため、日本国内の開発
この記事は「LLM・LLM活用 Advent Calendar 2024」シリーズ2の参加記事です。 この記事はCC0ライセンスで利用できます。許諾も対価もなしで、転載も加工も学習も自由に行えます。末尾に有料部分を設定していますが、中身は空っぽで、全て無料で読めます。 はじめに先日第3回AIアートグランプリにて、『Qveria - 空想世界事典』という作品で佳作をいただきました。 Qveria - 空想世界事典この作品はテキストと画像を生成するAIを使って架空の世界を構築し、その世界についての事典を生成したものです。似た試みはあまりないようで関心持っていただけました。 この記事では同じような遊びをもう少し簡単な題材で、しかし自分の世界を広げて辿れるよう詳しく解説します。 作業の大半は無料で使えるサービスを使い、誰でも気軽に試せるようにしています。ぜひ世界作りと、そこからAIが創作してくれる
この記事はCC0ライセンスで利用できます。許諾も対価もなしで、転載も加工も学習も自由に行えます。末尾の有料部分は空っぽで、最後まで全て無料で読めます。 長い記事なので、ChatGPTやClaude、Geminiなどを使った要約もお勧めします。要約する際は自分の求める長さを指示したり、「たとえを使って」とか「面白おかしく」とか、読みやすい文章に変えるのもお勧めです。そして要約が面白ければ、ぜひ記事を直接ご覧ください。 なお、この記事は以下と薄く連なるものです。こちらも長いですが、合わせて読むとより楽しめます。 はじめに何か短いお話を作って。ファンタジーで面白いやつ。こんな風に指示してAIに物語を生成させると、最初はその流暢さに驚き感心しますが、何度か試しているとすぐ壁にぶち当たります。そもそも筋が成立していないとか、つまらないとか、短いとか、矛盾があるとか、文体が好みでないとか、言いようのな
なお、筆者が所有しているのは、 Thirdwave XA7C-R48:80GB RAM、Core i7 13700F CPU搭載。RTX 4090(24GB VRAM)に換装 MacBook Pro:M4 Max 128GB Unified Memory この2つがメインで、このほかにiMac M1(16GB)、Mac mini M4(16GB)、MacBook Air M2(24GB)など。 そして、NVIDIA DGX Sparkを某所経由で予約済みです。 また、512GB M3 Ultra Mac Studio、5090搭載PCは複数の知人が購入しています。128GB M4 Max MacBook Proはもっと多くの知人が使っています。512GB Mac Studioを買い足している人も何人か。 もともと筆者が挙げていた4つのオプションに、リプライで提案された3つを加え、7つの選択
はじめに 最近、あるプロジェクトでGitHubリポジトリの内容をAIに分析させたくて、「どうやってClaudeとGitHubを連携させればいいんだろう...」と頭を抱えていたんです。何時間もネットで調べた末に出会ったのがMCPサーバーでした。これが本当に目から鱗だったんですよ!😲 「石の上にも三年」というように、私は根気強く数週間かけて様々なMCPサーバーを試してきました。そして今日は、私の開発ワークフローを劇的に変えた10個の素晴らしいMCPサーバーを、4つの主要カテゴリーに分けて紹介したいと思います! そもそもMCPサーバーって何?🤔 リストに入る前に、MCPサーバーについて簡単に説明しますね。MCPは「Model Context Protocol」の略で、AIモデルが外部ツールやデータソースと安全かつシームレスに連携するためのオープンスタンダードなんです。 簡単に言えば、お気に入
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、人工知能を促進することを目的とした国際的な学術団体「AAAI」(Association for the Advancement of Artificial Intelligence)が2025年3月に公開したレポート「AAAI 2025 PRESIDENTIAL PANEL ON THE Published March 2025 Future of AI Research」に注目します。 ▲レポートのトップページ このレポートはAAAI会長の指揮のもと25名のAI研
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く