タグ

モデルに関するlyiaseのブックマーク (7)

  • Sakana AI

    概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes (モデルマージの進化的最適化)」を公開しました。 このリリースの要点は以下の通りです。 進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合(マージ)して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既

    Sakana AI
    lyiase
    lyiase 2024/03/21
    複数のモデルを進化的アルゴリズムのアプローチでマージする方法の提案。今までのAI構築法の常識を破る方法で非常に興味深い
  • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

    こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000に目を通し、70程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

    Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
  • rinnaのYouri 7Bで8GB GPUでもLLM翻訳ができるかも - きしだのHatena

    rinnaからLlama 2 7Bに日語を追加学習させたYouri 7Bが公開されました。 rinna、Llama 2の日語継続事前学習モデル「Youri 7B」を公開|rinna株式会社 このうち、Youri 7B Instructionが指示に応じた返答をするモデルになっています。このモデルを使って「この英文を日語に翻訳して」などというと、和訳ができるわけです。 さらに、AutoGPTQを使った4bit量子化モデルも用意されているので、これを使うと8GBメモリくらいで日英翻訳ができそうです。 ということで、gradioでUIを作ってみました。 ソースはこちら。 https://gist.github.com/kishida/66b4e456e9e14362eb3d339f19815477 メモリは9GBを超えているけど、起動前後で4GBくらいを消費しているので、6GBくらいの余裕

    rinnaのYouri 7Bで8GB GPUでもLLM翻訳ができるかも - きしだのHatena
  • TechCrunch | Startup and Technology News

    Today marked the kickoff of Apple’s WorldWide Developer Conference (WWDC), the annual event where Apple announces some of the biggest features headed to its devices, apps and software. And this…

    TechCrunch | Startup and Technology News
  • シモセラ エドガー ラフスケッチの自動線画化

    研究では、畳込みニューラルネットワークを用いてラフスケッチを線画に自動変換する手法を提案する。既存のスケッチ簡略化手法の多くは単純なラフスケッチのベクター画像のみを対象としており、スキャンした鉛筆画など、ラスター形式の複雑なラフスケッチを線画化するのは困難であった。これに対し提案手法では、3種類の畳込み層から構成されるニューラルネットワークモデルによって複雑なラフと線画の対応を学習することで、ラスター形式の様々なラフスケッチを良好に線画化することができる。提案モデルでは、任意のサイズやアスペクト比をもつ画像を入力として扱うことが可能であり、出力される線画は入力画像と同じサイズになる。また、このような多層構造をもつモデルを学習させるため、ラフスケッチと線画がペアになった新しいデータセットを構築し、モデルを効果的に学習させる方法を提案した。得られた結果についてユーザテストを行い、提案手法の性

    シモセラ エドガー ラフスケッチの自動線画化
  • ビジネス実務の現場で有用な統計学・機械学習・データマイニング及びその他のデータ分析手法10+2選(2016年版) - 渋谷駅前で働くデータサイエンティストのブログ

    そう言えば3年前にこんなまとめ的エントリを書いたのでした。この内容はそのままかなりの部分が2年前に刊行した拙著の原案にもなったということで、色々思い出深いエントリです。 なのですが。・・・この3年の間に統計学・機械学習・データマイニングの諸手法及びそれを取り巻くビジネスニーズには様々な進歩があり、そろそろこの内容にも陳腐化が目立つようになってきました。ということで、3年間の進歩を反映してアップデートした記事を書いてみようと思います。前回は「10選」でしたが、今回は「10+2選」に改めました。そのラインナップは以下の通り。 統計学的検定(t検定・カイ二乗検定・ANOVAなど) t検定 カイ二乗検定 ANOVA(分散分析) その他の検定 重回帰分析(線形回帰モデル) 一般化線形モデル(GLM:ロジスティック回帰・ポアソン回帰など) ロジスティック回帰 ポアソン回帰 正則化(L1 / L2ノルム

    ビジネス実務の現場で有用な統計学・機械学習・データマイニング及びその他のデータ分析手法10+2選(2016年版) - 渋谷駅前で働くデータサイエンティストのブログ
  • なんかいろいろしてみます ダウンロード

    音響モデル 音声合成ソフトSHABERUで使用できる音響モデルを配布します ファイル形式はhtsvoiceなので、対応しているソフトであればSHABERU以外でも利用可能です。利用する場合は各種音響モデルの利用規約を守ってお使いください。各キャラクターの利用規約も守ってください

    lyiase
    lyiase 2016/02/19
    音声合成ソフトSHABERUで使用できる音響モデルを配布します
  • 1