タグ

nekoneneneのブックマーク (644)

  • DMMボイスはエロゲーを学習している(という仮説とその考察)

    注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。 DMMボイス最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。 https://ai-voice.dmm.com/ それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。 まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。) 追記11/7現在アクセス増大でサービス一時停止しており、サンプルボイスさえ聞けないので、サンプルボイス集を作っておいた: https://whyp.it/collections/3281/dmm利用規約についてのツッコミ動画が

    DMMボイスはエロゲーを学習している(という仮説とその考察)
  • 強盗団の件、犯罪エアプの人達は平和ボケしすぎ

    https://anond.hatelabo.jp/20241019210503 俺は普通に地元が荒れまくっていて、何人か友達も死んでるし、俺自身も犯罪に巻き込まれたことがある被害者だ。 こういうのを見る度に思うのだけれど、「頭が悪いから犯罪する」だとか、「能力が不足しているから犯罪をする」という思考に流されすぎ。 いいか、今話題の強盗団は「何も悪くないのに強盗になってしまう」ことが一番の問題なんだ。 倫理意識が高かろうが、頭が良かろうが強盗になる。それがこれからの世の中。 お前が言っているのは「詐欺は騙される方が悪い」とかそういうレベルの極論。何も悪くなくても詐欺の被害者にはなる。 普通の人達が社会人をやってる時間を「どうやったら犯罪で一儲けするか」に振っている人間達がいるという思考をしろ。これは単純な労働力投下量の問題であって倫理の問題ではない。 まずこの文章を読んで、お前も、俺も、い

    強盗団の件、犯罪エアプの人達は平和ボケしすぎ
  • わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge

    筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。

    わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge
  • 個人ユーザーに有料ウイルス対策アプリは必要か--OS標準機能の進歩と標的の変化

    Ed Bott (Special to ZDNET.com) 翻訳校正: 川村インターナショナル 2024-10-09 07:00 米商務省は6月、Kaspersky製ソフトウェアの禁止を発表した。米ZDNETに寄稿するLance Whitney氏が報じたように、Kasperskyは米国時間9月29日から、禁止された製品のウイルス対策シグネチャーの更新とコードの更新を米国の顧客に提供できなくなった。同社は100万人の顧客をあまり知られていない代替製品に移行させる措置まで講じた。 そのニュースを読んで、筆者は誰よりもショックを受けた。1999年にタイムスリップするボタンを誰かが誤って押してしまったのだろうか。サードパーティー製ウイルス対策ソフトウェアにお金を払っている人がまだいるというのか。 どうやらそのようだが、2024年のウイルス対策ソフトウェア市場について、信頼できる情報を見つけるのは

    個人ユーザーに有料ウイルス対策アプリは必要か--OS標準機能の進歩と標的の変化
  • How to Autogenerate GraphQL API Documentation | Nordic APIs |

  • GitHubの削除されたリポジトリや非公開のリポジトリに誰でもアクセスできてしまうのは仕様通り

    GitHubでは削除されていたりプライベートに設定されていたりするフォークやリポジトリに誰でもアクセスでき、さらにその動作が欠陥ではなく仕様通りであるとオープンソースセキュリティ企業のTruffle Securityがブログに投稿しました。 Anyone can Access Deleted and Private Repository Data on GitHub ◆ Truffle Security Co. https://trufflesecurity.com/blog/anyone-can-access-deleted-and-private-repo-data-github GitHubでの一般的なワークフローとして、「新しいフォークを作成する」「コミットする」「フォークを削除する」というものを考えてみます。 この時、削除したはずのフォークの中身を誰でも確認できてしまうとのこと。

    GitHubの削除されたリポジトリや非公開のリポジトリに誰でもアクセスできてしまうのは仕様通り
  • 投資家たちはどう見る? ラクスルの新CEO報酬設計は「雇われ経営者」ではなく「第二の創業者」を生み出すか| Stock Journal

    投資家たちはどう見る? ラクスルの新CEO報酬設計は「雇われ経営者」ではなく「第二の創業者」を生み出すかラクスル株式会社代表取締役社長CEO永見 世央

    投資家たちはどう見る? ラクスルの新CEO報酬設計は「雇われ経営者」ではなく「第二の創業者」を生み出すか| Stock Journal
  • DeepLearning画像分類モデルの処理速度計測 - ユニファ開発者ブログ

    こんにちは、R&Dチームの宮崎です。 DeepLearningの有名どころの画像分類モデルを用いて、CPU環境での推論時の処理速度を計測しましたので、共有したいと思います。 背景 DeepLearningモデルをサービスに適用する際、精度と同様に推論時の処理速度も重要になってきます。AWSなど時間課金の基盤上でモデルを動かす場合、処理速度が2倍になると運用にかかるコストは1/2になるためです。 しかし、論文などでは精度やパラメータ数、FLOPSなどについては言及されているものの、処理速度についてはあまり記述がありません。あったとしてもGPU上での値だったりします。これらの値はCPUで動かした際の処理速度と比例しないため、モデル開発後にデプロイして評価してみると、想定より遅く、こんなはずじゃなかったとなったりします。 一方で、DeepLearningのモデルは、同じネットワーク構造と実行環境

    DeepLearning画像分類モデルの処理速度計測 - ユニファ開発者ブログ
  • 無料でX(旧Twitter)・Facebook・Mastodonにまとめて投稿や予約投稿ができるオープンソースの「Mixpost」をセルフホストしてみた

    MixpostはXやFacebook、MastodonなどさまざまなSNSの複数のアカウントを一括で管理できるツールとのこと。同時投稿のほか時間を指定して投稿することも可能とのことなので、さっそくセルフホストして使ってみました。 Self-hosted, Open Source Social Media Management - Mixpost https://mixpost.app/ 公式サイトにアクセスし、「Get started」をクリック。 「Free」の欄に表示されている「Github」をクリックします。 Laravelアプリケーションに追加することも可能とのことですが、今回はスタンドアローンアプリ版を使用するので「use Composer to create this standalone app」をクリック。 さらに今回はDocker版を使用します。Docker版の詳細につい

    無料でX(旧Twitter)・Facebook・Mastodonにまとめて投稿や予約投稿ができるオープンソースの「Mixpost」をセルフホストしてみた
  • 発達障害かどうかってのは多分関係ない。いわゆる健常者だってそういう言..

    発達障害かどうかってのは多分関係ない。いわゆる健常者だってそういう言動をすることはよくある。自分の欠点を、自分の意志の欠如の結果ではなく、単なる現象として説明する言説を手に入れると、人はどうしてもそれを使ってしまう。なにせ責任を取る必要がないわけだから。 意志と責任はセットの概念で、自分の意志で行ったのだからこそその責任を取らなければならない、というのがこの社会のルールになっている。でもまあそんなのフィクションなわけだ。人間はただの物理現象で、原子分子がエネルギーポテンシャルの坂道を転がった結果でしかない。とはいえ、人間は意志というフィクションを共有することで互いに関係することができている、というのも事実である。もちろん、人間は皆ただの物理現象であって自由意志なんてない、ということを合意することで回る社会というのもありうると思うが、少なくとも現状そうなっていない。個人が意志を持って行動し、

    発達障害かどうかってのは多分関係ない。いわゆる健常者だってそういう言..
  • WebUI vs ComfyUI 検証(RTX3060-laptop 6GB環境)|runo0044

    StableDiffusion GUIの選択肢として有力なComfyUIの実力を実機環境で検証した。ミドルレンジ~ローエンドGPU環境で画像生成を行う場合は特に参考になるだろう。 [時間がない人向けの結論] ComfyUIが圧倒的に良い。 環境CPU : i7-10875H GPU : RTX3600-laptop (6GB) Memory : 32GB WebUIstable-diffusion-webui [cf2772f](2023/12/16 15:58) version: v1.0.0-pre-3046-gcf2772fa python: 3.10.6 torch: 2.0.1+cu118 xformers: 0.0.20 gradio: 3.41.2 arguments : --xformers --xformers-flash-attention --opt-channels

    WebUI vs ComfyUI 検証(RTX3060-laptop 6GB環境)|runo0044
  • 経営者になるには?必要な知識や資格、方法を解説

    起業して経営者になろう」「社長になって会社を経営したい」と思う人は多いですが、経営者になるにはどうすればいいか、どのような知識や資格が必要なのかはあまり知られていません。 実は特別な知識や経験、資格がなくても、税務署に開業届を提出すれば個人事業主として経営者になることは可能です。 しかし、継続して事業を行うため、従業員を雇うなどして組織を率いるためには、経営者として持っておくべき知識があることも事実です。 記事では、経営者を目指す人がもっておきたい知識や役立つ資格、経営者になる方法を解説します。 「経営者」とは何か経営者とは、企業の経営方針や経営計画を考え決定し、経営に最終的な責任をもつ人のこと。 企業によって最高経営責任者(CEO)や社長、代表取締役など、さまざまな役職で呼ばれます。 基的に経営者の役職は自由に名乗ることができますが、代表取締役は会社法に定義されている、株式会社を代

    経営者になるには?必要な知識や資格、方法を解説
  • 動作・行動のプロンプト(呪文)一覧【Stable Diffusion】 

    SoreNutsからのお知らせ 新規記事 3/20に【ComfyUI】ランダムなカラーパターンからイラストを作る方法を公開! 2/28に【ComfyUIでControlNet】img2imgのワークフローの解説を公開! 2/2にComfyUIの保存先を指定する方法を公開! 更新記事 3/21にカメラ・構図のプロンプト(呪文)一覧を更新! Stable Diffusion Web UI(Automatic1111)で活用できる動作や行動に関するプロンプト(呪文)を網羅しています。ポージングとはまた少し違いますが、参考にしてみてください。

  • Stable Diffusionのメモリ不足対策・解決策まとめ | taziku / AI × クリエイティブ | 東京・名古屋

    様々なモデルを駆使して自分の思うがままの画像を生成できる「Stable Diffusion」。動作には高速なグラフィックボードと大容量のVRAMが必要です。 公式では4GB以上で動作するとされていますが、実際実用的に動かすためには8GBでなんとか、色々な処理を実行しようとすると、12GBは欲しく、欲を言えば24GB、さらにとVRAMはあればあるほど良いです。 メモリ不足のエラーが発生 メモリが足りないと、画像生成時に「RuntimeError: CUDA out of memory」とエラーが出現します。この場合画像の生成が中断され、正しく画像を生成できなくなってしまいます。このメモリ不足は生成画像のサイズに対してVRAMが足りていないという場合がほとんどなので、生成する画像の解像度を下げることで、ある程度回避できるのですが、大きい画像をどうしても生成したいという場合いくつかのStable

    Stable Diffusionのメモリ不足対策・解決策まとめ | taziku / AI × クリエイティブ | 東京・名古屋
  • 画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

    10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日語で「の画像を作ってください」などと入れるだけでかわいいの画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンべる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女とが遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

    画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)
  • GitHubコマテク集 - OpenWork Tech Blog

    インフラチームの西川です。 当社ではGitHubを利用しています。いろいろ便利な機能があるのですが社内でコマテクを募集してみたところ意外と知らないものがあったので共有してみます。 行動の見える化 特定コミットのリンク取得 通知 行動規範 ガイドライン .github リポジトリ テンプレートリポジトリ タグをたくさんプッシュさせない ドラフトプルリクエスト チケットの自動リンク化 ベースブランチの更新を取り込む まだレビューが終わってないプルリクエストの一覧化 レビュアーの自動割り当て コードの所有者 ファイル単位でレビュー済みをチェックする レビュー中のファイルを全部閉じる 具体的な修正を提案する レビューコメントをラベル化 デプロイ管理 リリースノートを自動作成 行動の見える化 以下の設定をすることで、GitHub上の行動を見える化することができます。 docs.github.com

    GitHubコマテク集 - OpenWork Tech Blog
  • ネコがのどを「ゴロゴロ」鳴らす仕組みがついに明らかに

    ネコはリラックスしている時などにのどを「ゴロゴロ」と鳴らしますが、その仕組みは正確には明らかになっていませんでした。そんな中、学術誌のCurrent Biologyに掲載された新しい論文が、このメカニズムを解き明かすことに成功しています。 Domestic cat larynges can produce purring frequencies without neural input: Current Biology https://www.cell.com/current-biology/fulltext/S0960-9822(23)01230-7 We now know how cats purr—why they purr is still up for debate | Ars Technica https://arstechnica.com/science/2023/10/we

    ネコがのどを「ゴロゴロ」鳴らす仕組みがついに明らかに
  • スタジオ真榊【AIイラスト術解説】|pixivFANBOX

    StableDiffusionNovelAIを使ったAIイラスト制作の研究ノート。日最大級のWildcardつきプロンプト超辞典、手書きイラストとの共創手法、ControlnetやLoRAといった拡張技術の解説などを120以上の記事にまとめています。 ★初めての方は、支援しなくても最後まで読めるメインコンテンツ「AIイラストが理解る!Stabl...

    スタジオ真榊【AIイラスト術解説】|pixivFANBOX
  • グーグル流「構造化面接」を成功させる評価基準と質問の作り方

    この連載「元Googleの人事が解説--どんな企業でも実践できる『新卒採用』の極意」では、グーグルで新卒採用を担当していた筆者が、企業がそれぞれの採用プロセスにおいて、どのように自社にあった「才能」を獲得・育成していけばいいのかを具体案を交えてご紹介していきます。 第9回となる前回(「役員の一存で採用が決まる?--採用面接のブラックボックス化を防ぐ『構造化面接』とは」)は、面接のブラックボックス化を防ぐ「構造化面接」について、その特徴や効果についてお話をしました。 今回はいよいよ構造化面接の具体的な運用方法について説明していきます。前回の内容を踏まえてお話しますので、まだご覧になっていない方はぜひそちらもご一読ください。 「構造化面接」の設計 早速ですが、実際の採用の現場において構造化面接を設計する際、注意すべきポイントについて紹介していきましょう。 構造化面接の実践では次の3ステップが必

    グーグル流「構造化面接」を成功させる評価基準と質問の作り方
  • ネコニキの開発雑記

    AWS CDKをStackを分けて構築する前回、AWS CDKを使ってVPCを作成し、その中にLambdaを入れるまでを行いました。 実際に動作しているシステムを動かす場合は、サービスが複雑に絡み合うため、 どこかでStackを切り分けたほうがいいです。 今回はその辺りの方法について紹介します。 おさらい 前回までの記事は以下の通りです。 AWS CDKを使ってLamda in VPCを構築する 上記の記事で作成したものベースで話を進めるので、実際に手元で動かしてみたい方は参照ください。 Stackを分割する 前回までは1つのStackの中で以下のことを行なっていました。 IAMロールを作成 VPCを作成 Lambdaを作成し、実行ロールとして1のものを、格納するものとして2のVPCを指定 この3つの処理は対応するAWSのサービスが異なるため、スタックを切り分けたいと思います。 依存関係と