Discover amazing ML apps made by the community
![Animagine XL 3.0 - a Hugging Face Space by Linaqruf](https://cdn-ak-scissors.b.st-hatena.com/image/square/18b1b9ed4ba2815710be3e69556003473aaff092/height=288;version=1;width=512/https%3A%2F%2Fcdn-thumbnails.huggingface.co%2Fsocial-thumbnails%2Fspaces%2FLinaqruf%2Fanimagine-xl.png)
Discover amazing ML apps made by the community
お題箱から 797.生成aiについて無知なので質問です 下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか? https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日 質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地
おれたちは生成AIに苦手なことをやらせがち〇〇について教えて系の質問は全部ダメ。堂々と嘘をつくのは勿論、回答が抽象的すぎて役に立たないことが露呈した。 この批判がまさにそうなのだが、どうもわれわれ日本人は「ChatGPTが一番苦手なこと(≒自分が知らないことを教えてもらう)にChatGPTを使おうとする」という傾向があるらしい。日本の経営者に聞いたChatGPTの使い道のアンケートでは、「仕事で調べものをする時に活用する」が39.3%でトップだ。これが米国の職場でのChatGPT利用法の調査だと、上から順に、 アイディアを出すコンテンツを作成するメールに返信するプログラムコードを書くレジュメやカバーレターを書くプレゼンテーションを作成する となっていて、情報検索や調べもののタスクは上位5位に入っていない。総じて米国の働き手は、ChatGPTを自分に情報をインプットするためのツールではなく、
1973年、愛知県生まれ。 1998年、トヨタ自動車株式会社に入社。スーパーカー「LFA」やF1の空力(エアロダイナミクス)開発に携わったのち、トヨタ自動車製品企画部(Z)にて量産車開発マネジメントを担当。 2011年、孫正義後継者育成プログラム「ソフトバンクアカデミア」 に外部第一期生として参加し、翌年ソフトバンク株式会社に入社。感情認識パーソナルロボット「Pepper(ペッパー)」プロジェクトに参画。 2015年、GROOVE X株式会社を創業。 2018年、家族型ロボット「LOVOT(らぼっと)」を発表。翌年、出荷を開始。 ラスベガスで開催されている世界最大規模の家電見本市「CES」において、2019年にThe VERGE「BEST ROBOT」、2020年には「イノベーションアワード」を受賞。 2021年、第9回ロボット大賞にて「総務大臣賞」、2022年、第3回IP BASE AW
AIチャットボット「ChatGPT」が注目を集めている。どのように仕事に活用すればよいのか。初期の頃からChatGPTを“使い倒している”という深津貴之さんは「ChatGPTは、結構知ったかぶりしてウソをついたりするので、検索エンジンのように使うのはお勧めしない。しかし、コツを押さえて使うと、アシスタントのように使えて仕事にとても役立つ」という――。 ChatGPTは「確率で話す」 ChatGPTの最大の特徴は「コンピューター言語(プログラミング言語)などではなく、人間の使う言葉で命令でき、回答してくれること」です。 うまく使えば、仕事の効率化や高度化が実現しますが、そのためにはChatGPTにできることとできないこと、またChatGPTの得意なことと不得意なことを理解する必要があります。 まず覚えておきたいのは、「ChatGPTは確率でしゃべるマシンである」ということです。基本的には、こ
AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた:清水亮の「世界を変えるAI」(1/4 ページ) NHKの取材も来たし、週末だけ浅草橋の駅前で開店している「技研バー」では毎回その話題になる。 ごく一部で注目されていて、まあもともとが下手すぎる漫画なのでまじめに読んでもらっても困るのだが、つい先日、あの「宇宙兄弟」のプロデューサーである佐渡島庸平さんともお話しする機会を賜り、個人的にはずっと俺得という状況が続いていた。 AIの課題「欲しいポーズが出せない」 最初にAIで漫画を描くときのハードルは、「同じキャラクターが出せない」というものだったが、これはDreamBooth(Memeplexではカスタムモデル学習)を使うことで解決できた。 次のハードルは、「欲しいポーズが出せない」というものである。 また一方で、誰かが描いたイラストをAIに下書きとして渡して、顔や
なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方:清水亮の「世界を変えるAI」(1/8 ページ) OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたAIチャットボットを投入し、巻き返しを図る。 側から見ていると急展開に心が躍る一方、果たしてこの戦いは本当に意味のあるものになっているのか。チャットボットを長年ウォッチしてきた筆者としてはハラハラする気持ちも少なくない。 まずは現状のAIチャットボット関連をまとめ、それからチャットボットの歴史を振り返り、現状、そして未来を予想してみたい。 深層学習チャットボット百花繚乱の2023年 最近になって深層学習をベースとしたチャットボットが注目を集めている。Open
ご意見:この写真はAIの成果物で、そこを忘れないようにしないと ご意見:筆者の精神がおかしくなっていそう 忘れていないので、こうして記事にしているわけです。ただ、これをブラックボックスとして出してしまうと、信じてしまう人が出てくるかもしれません。そういう意味でもこういうことが技術的に可能であることを知ってもらう意義はあると思っています。 熱愛していた人を取り戻そうという人物は、そのために人類を補完しようとか、怪獣の細胞と合体させたり、ミトコンドリアがどうのこうのとかやりがちなのはフィクションのことで、彼らにも筆者のような技術があれば悪の道に走らなかったのではないかと、個人的には思います。残されたものの精神の安定には役立つと思います。現に、妻の歌声をコンピュータで再現する取り組みについては、死別し残された人の心のケアをするグリーフケアの観点から何度か取材を受けています。 ご意見:捏造した写真
・はじめに:自己紹介とAI絵師になったきっかけ ・AI絵師を始めたきっかけ ・AIイラストをどのように売るか ・そもそも、現状のAI絵師を取り巻く環境は? ・AIイラストの強みと弱みを理解する ・AI絵師にとって一番の脅威は「画像生成AIを使いこなす神絵師」 ・AIイラストに価値を感じさせるために ・どのようにAI絵師は自身をブランディングするか? ・AIイラストのクオリティアップに真面目に取り組む ・AI絵師はこれからどのように稼ぐ? ・1年以内にできること ・画像生成AIは倫理的な正当性を獲得できるか? ・最後に ・はじめに:自己紹介とAI絵師になったきっかけ 本記事はあるふ氏が主催の「画像生成AIアドベントカレンダー」に寄稿したものである。主に、自分がAI絵師としてお金稼ぎをする上で考えたことや、その方法について紹介しようと思う。 先に、AI絵師としてお金稼ぎをする際のエッセンスにつ
萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。 そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。 すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン
今話題の画像生成モデル「Stable Diffusion」をいらすとやの画像でfinetuneしてみたところ、任意のテキストに対していらすとやっぽい画像を作れるモデルが出来上がりました。 Stable Diffusionとは Stable Diffusionは、指定されたテキスト(文字列)に対応する画像を生成する機械学習モデルのひとつです。ソースコードと学習済みモデルは無償で公開されていて、誰でも利用できるようになっています。 (Stable DiffusionのGitHubページより引用) 今回は、この画像生成モデルをいらすとやの画像でfinetune(微調整)することで、入力テキストに対応する画像をいらすとやのようなスタイルで出力させることを試みました。 開発環境 開発環境はGoogle Colab Pro+で、主にプレミアムGPU(NVIDIA A100)を使いました。Stable
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く