タグ

ブックマーク / note.com/it_navi (6)

  • Claude Opus 4.6で作る、PowerPointでそのまま編集できる高品質スライド|IT navi

    AIを使ったスライド作成は以前から可能でしたが、作った後に編集できないという課題がついて回りました。例えばNotebookLMでは、多彩なデザインのスライドをpptxファイルとして出力できるものの、各ページが1枚の画像として埋め込まれるため、文字や図表を後から修正するのが困難です。 その点、Claudeで作成したスライドはパーツごとに分かれたpptxファイルとしてダウンロードできるため、PowerPoint上でそのまま編集できるのが大きな強みです。さらに、専用のスキルを活用すれば、洗練されたデザインのスライドを安定して繰り返し生成できます。 記事では、このパワポスライド作成用スキルの作り方と使い方を解説します。今回作成したスキルも公開しますので、ぜひご活用ください。 1.パワポスライド作成用スキルの作り方(1) 参考にするスライドの準備最初に、参考にするスライドやスライド作成のためのプロ

    Claude Opus 4.6で作る、PowerPointでそのまま編集できる高品質スライド|IT navi
  • NotebookLMのスライド作成機能の斬新な使い方|IT navi

    11月20日、GoogleNotebookLMにスライド作成機能が追加されました。収集した情報を美しいスライドに変換できるこの機能は、その利便性の高さから大きな注目を集めています。論文PDFやYouTube動画のスライド化はもちろんですが、実はまだ知られていない「裏技」的な使い道も存在します。 記事では、NotebookLMのポテンシャルを最大限に引き出す、斬新な活用術を解説します。 1.ソース無しでもスライド作成実は、ほとんどソース無しでも、Geminiが最初から持っている知識を生かしてスライドを作成することができます。 (1) 「生成AI」をテーマとしたスライドの作成まず、NotebookLMにアクセスして、「ノートブックを新規作成」をクリックします。すると、以下のような画面が表示されます。 ここで、「コピーしたテキスト」を選択し、「生成AI」とだけ入力して挿入をクリックします。

    NotebookLMのスライド作成機能の斬新な使い方|IT navi
  • Nano Banana(Gemini 2.5 Flash Image)の使い方|IT navi

    8月26日、Googleが新しいAIモデルのGemini 2.5 Flash Imageをリリースしました。 これは、少し前にLMArenaでnano-bananaという名前で登場し、その編集性能の高さやキャラクターの一貫性でAI界隈を驚かせた画像生成・編集モデルです。 筆者も早速その性能をテストしてみましたので、このモデルの使い方や実際の使用例について紹介したいと思います。 1.特徴Gemini 2.5 Flash Image(旧 nano-banana)は、Googleが開発した最新の画像生成・編集モデルです。このモデルは、文章による指示だけで高度な画像生成や編集を行うことができ、既存画像の編集や合成にも対応しています。 高速な画像生成: 1枚当たり数秒という高速な画像生成が可能で、競合モデルより格段に速い。コスト効率も高い。 画像編集に特化した設計: 画像編集に強く、文章で指示するだ

    Nano Banana(Gemini 2.5 Flash Image)の使い方|IT navi
  • 芥川賞作家 九段理江さんのAIを利用した小説執筆手法について|IT navi

    このプロジェクトのルールは以下のようになっています。 作品の文字数は 4,000字以内とする。 95%を生成AI、残り5%を九段理江氏が執筆する。 ただし、その「%」の解釈については九段理江氏に委ねる。 生成AIは九段理江氏が使い慣れているものを使用する。 プロンプトは作品の一部として今後全文公開する。(文字数制限は無し) 今回、「影の雨」の執筆に際して、九段理江さんから生成AIに指示を出した「プロンプト」の全文がネットで公開されたので、九段さんのAIを利用した小説執筆手法を分析しました。 2.小説執筆に使用されたプロンプトの分析(その1)(1) プロンプトの特徴 “影の雨”を生むための〈物語的プロンプト・エンジニアリング〉1. 導入フェーズ 挨拶で始め、AI に〈九段理江〉という存在を認識させる。 作品歴や翻訳予定を AI が自発的に列挙するよう促す。 ↳ 狙い: AI が既に保持してい

    芥川賞作家 九段理江さんのAIを利用した小説執筆手法について|IT navi
  • ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi

    2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。 また、Googleは、2024年12月6日にGemini-Exp-1206(Gemini 2.0 Experimental Advanced)、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。 AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル(o1とGem

    ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi
  • ChatGPTのDALL-E 3による画像コントロール|IT navi

    ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、

    ChatGPTのDALL-E 3による画像コントロール|IT navi
  • 1