タグ

ソフトウェアと技術に関するadstyのブックマーク (10)

  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    adsty
    adsty 2023/12/04
    生成AIとペイントソフトの組み合わせは将来性がある。
  • ChatGPTをオープンソースで再現、わずか1.6GBのGPUメモリですぐに使用でき7.73倍高速なトレーニングが可能

    OpenAIの対話型AIChatGPT」は史上最も急速な成長で「月間1億ユーザー」をわずか2カ月で達成するなど、大いに注目を集めています。それに伴い、GoogleChatGPTのライバルとなる会話型AIBard」を発表したり、中国企業が続々とChatGPTAIを開発していると報道されている一方で、OpenAIChatGPTのコードを公開していないためChatGPTを効果的に複製することは難しくなっています。AIのディープラーニングトレーニングを最適化するオープンソースプラットフォームのColossal-AIが、ChatGPTトレーニングプロセスをわずか1.6ギガバイトのGPUメモリで7.73倍高速なトレーニングに再現したと告知し、オープンソースで公開しています。 Open-source replication of ChatGPT implementation process!

    ChatGPTをオープンソースで再現、わずか1.6GBのGPUメモリですぐに使用でき7.73倍高速なトレーニングが可能
    adsty
    adsty 2023/02/24
    ChatGPTトレーニングのプロセスをオープンソースの方法で複製した。
  • AIの権威による「ChatGPT」の説明が分かりやすい! 東大松尾教授の資料が話題

    ChatGPTって何?」と聞かれたら、取りあえずこの資料を渡せば良い──2022年11月末に登場してすぐに世間を驚かせたAIChatGPT」。自民党AIには注目しており、「AIの進化と実装に関するプロジェクトチーム」を開催しているのだが、そこで東京大学の松尾豊教授が提出した資料が「分かりやすい」と話題だ。 資料が提出されたのは2月17日開催の第2回会議。「AIの進化と日の戦略」というタイトルで、大規模言語モデルの仕組みやChatGPT、今後の日の戦略について説明するものだ。同資料は塩崎彰久衆議院議員が投稿したnote記事からダウンロードできる。 ChatGPTについては、その学習方法から、高度な会話を実現できた理由、ChatGPTでできること、利用場面や受け取られ方まで網羅的にまとめられている。 例えば、高度な会話後実現できた理由のパートでは、従来のモデルには「生成分が人間の好み

    AIの権威による「ChatGPT」の説明が分かりやすい! 東大松尾教授の資料が話題
    adsty
    adsty 2023/02/22
    「AIの進化と日本の戦略」という解説資料。
  • 設計書・仕様書のレビュー方法を定めたJIS規格登場 チェック体制を標準化しやすく

    経済産業省は11月22日、システム開発時に使う設計書・仕様書などの「作業生産物」のレビュー工程についてJIS規格を制定したと発表した。仕様書などの見直し方や観点などを規格化し、ソフトウェアの品質向上や開発の効率化を促す。 「JIS X 20246」は、設計書・仕様書の見直し作業を「計画作業」「レビューの立ち上げ」「個々人のレビュー」「要検討項目の共有および分析」「修正作業および報告作業」の順に整理し、実行するべきタスクや手順を規定するもの。システム開発や試験、保守などの場面で作るあらゆる仕様書に適用可能。 レビューの曖昧さをなくすため、「目的」「役割」などのレビューの観点10種、「執筆者確認」「同僚との机上確認」などのレビュー手法9種を定めた。JIS制定により、組織や個人のノウハウに依存することなく一定水準のレビューができるようになり、ソフトウェアなどの制作物の品質向上につながるとしている

    設計書・仕様書のレビュー方法を定めたJIS規格登場 チェック体制を標準化しやすく
    adsty
    adsty 2021/11/23
    作業生産物のレビュー工程についてJIS規格を制定した。
  • コンテナ・Docker・Kubernetesについて初心者にも分かりやすく解説するとこうなる

    DockerKubernetesなどのコンテナ技術は多くのシステムで用いられていますが、初心者が概要を理解するのは難しいもの。そんなコンテナ技術の概要について、クラウドストレージサービスを運営するBackblazeが分かりやすくまとめています。 What Are Containers? https://www.backblaze.com/blog/what-are-containers/ ・目次 ◆コンテナとは何か? ◆コンテナと仮想マシンの違いは? ◆コンテナのメリットは? ◆コンテナの用途は? ◆Dockerとは何か? ◆Kubernetesとは何か? ◆コンテナとは何か? 物流の世界における「コンテナ」は、形状やサイズを規格化し、異なるメーカーが製造した船舶・電車・トラックなどの移動手段や、世界中の港などの「異なる環境」でも同じように物を運んだり保管したりできるようにしたものです。

    コンテナ・Docker・Kubernetesについて初心者にも分かりやすく解説するとこうなる
    adsty
    adsty 2021/11/04
    コンテナ技術の概要に関する解説。
  • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

    オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

    adsty
    adsty 2021/08/01
    自ら中品質と位置付けるテキスト読み上げソフトウェア。
  • 画像の専門家も「魔法のようだ」と驚愕! ピンぼけ写真を修復できるプログラムが開発される | ロケットニュース24

    画像の専門家も「魔法のようだ」と驚愕! ピンぼけ写真を修復できるプログラムが開発される 2012年10月26日 わーん、街で偶然アイドルを見かけたから急いでカメラのシャッター切ったら案の定ピンぼけして、どこかのおばちゃんみたいに見えるわーっ! 街の名前が書かれた看板の字すらボケすぎて何がなんだかわからんわーっ! これじゃ何の証拠にもならへんやーんっ!! そんなアナタの切実なお悩みが近々解消されるかもしれないから、ピンぼけデータもしっかり保存しておくといいかもしれぬぞ。 というのも、ピントや手ぶれなどでぼやけている写真を修復してくれるプログラム「SmartDeblur」がプログラマーVladimir Yuzhikov氏によって開発されたというのである。 例えばピンぼけした風景の元画像と、処理後の画像を見てみると、その差は歴然! それまで何がなんだか区別できなかったボケボケの風景が、プログラム

    画像の専門家も「魔法のようだ」と驚愕! ピンぼけ写真を修復できるプログラムが開発される | ロケットニュース24
    adsty
    adsty 2012/10/26
    ピンぼけ写真を謎の技術で修復してくれるという「SmartDeblur」。
  • ニコニコ動画のキャッシュを皆で共有するソフト「Genkidama」をリリースしまふ。 - syuu1228's blog

    なにこれ ニコニコ動画の動画ファイルのキャッシュファイルを皆で共有しあってより快適にニコ動を楽しめるソフトです。 これで一般会員でも回線混雑時に通常画質で動画が見れるかもしれない・・・!って訳です(誰かが以前その動画を通常画質で見ていてくれれば、の話なんだけどね)。 えいさあさんのNicoCacheをベースにP2P技術を用いてキャッシュ情報をGenkidamaを起動しているPC同士で共有する仕組みを追加してあります。 えいさあさん良いプログラムをソース公開してくれて感謝です。 動作環境 Java 6.0が動くシステム(Windows, Linuxで動作確認済み) たぶんMacでもおk。 ルータにグローバルIPが振られていて、UPnPでポート解放出来る必要あり。 使い方 Windows ブラウザのプロキシ設定でlocalhost:8080を指定。 Genkidama.batを実行する。 使い

    ニコニコ動画のキャッシュを皆で共有するソフト「Genkidama」をリリースしまふ。 - syuu1228's blog
    adsty
    adsty 2009/04/27
    分散ハッシュテーブル(DHT)というP2P技術を使ってキャッシュ情報をPC間でやりとり。
  • インターネットを過激に加速するアプリdolipoの種明かし− @IT

    Webブラウジングでのクライアントのレスポンスを向上するプロキシソフト「dolipo」。使い方とともに、高速化の仕組みを解説する 少しでもネットワークを高速化したいヨーロッパ圏から学ぶ こんにちは、dolipoを開発したdrikinです。dolipoの着眼点は、ネットワークの技術的な側面だけでなく、Webアプリケーションの開発時に悩むネットワーク速度の問題に対しても、面白いアプローチになっています。 僕のこの技術との出合いは偶然でした。dolipoの元となったPolipoのプログラムを発見したときその効果に感動し、何とかこの素晴らしさをより簡単にもっと多くの人に伝えたいと思いdolipoを作りました。 日では、光ファイバなどの高速回線の普及度が高く、サービスの品質も高いため、ネットワークサービスを開発する際にも、ネットワークのスピード自体はほとんど問題ではありません。いかにクライアントや

    adsty
    adsty 2008/08/20
    dolipoの技術解説。
  • 自分の声で音声合成 OKIがソフト発売

    沖電気工業(OKI)は7月24日、自分の声から音声を合成し、入力したテキストを読み上げられる音声合成ソフト「Polluxstar」(ポルックスター)を発売した。あらかじめ録音しておいた自分の声のデータベースを元に音声を合成する仕組みだ。 病気などで声を失った人に、自分の声の代わりとして使ってもらうといった用途を想定している。価格は音声データベース製作費用を含めて105万円。 「カスタム原稿」でイントネーションや方言も再現 あらかじめ録音しておいた声を「音素」と呼ばれる細かい単位に分解してデータベースを作成。PC上で入力したテキスト通りの音素を抜き出して組み合わせ、音声を再生する。 データベースを作る作業は、ユーザーの声の録音から始まる。同社が用意した自然文の原稿をユーザーに朗読してもらい、その声を録音。原稿の長さは1000文ほどで、読み上げると60分くらい。収録には2~3時間かかるという。

    自分の声で音声合成 OKIがソフト発売
    adsty
    adsty 2008/07/26
    価格は音声データベース製作費用を含めて105万円。
  • 1