The open source AI model you can fine-tune, distill and deploy anywhere. Our latest models are available in 8B, 70B, and 405B variants.
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。 それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。 春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。 そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース
クリエイターに出会ったり、もっとファンになったり、noteで創作をつづけたくなるようなイベントを開催する「noteイベント」。今回は「チャットAI使いこなし最前線」をテーマに、黎明期からチャットAIを活用しているnote CXOの深津貴之氏が登壇しました。こちらの記事では、ChatGPTユーザーの悩みを解決するプロンプトなどが語られました。 ChatGPTユーザーの悩みを解決するプロンプト 徳力基彦氏(以下、徳力):まず今日はChatGPTの使い方をしっかり覚えていただきたいと思います。ここで「深津式汎用プロンプト」。 深津貴之氏(以下、深津):僕は1個1個、個別の例を出すのはあんまり好きではないです。さっき言ったように原理原則を1個理解すれば、全部その原理原則から引っ張れる方向が好きですね。 なので今日も、細かいプロンプトを出すよりは、だいたいあなたの悩みのすべてを解決するプロンプトを1
OpenAIの対話型AI「ChatGPT」は史上最も急速な成長で「月間1億ユーザー」をわずか2カ月で達成するなど、大いに注目を集めています。それに伴い、GoogleがChatGPTのライバルとなる会話型AI「Bard」を発表したり、中国企業が続々とChatGPT風AIを開発していると報道されている一方で、OpenAIはChatGPTのコードを公開していないためChatGPTを効果的に複製することは難しくなっています。AIのディープラーニングトレーニングを最適化するオープンソースプラットフォームのColossal-AIが、ChatGPTトレーニングプロセスをわずか1.6ギガバイトのGPUメモリで7.73倍高速なトレーニングに再現したと告知し、オープンソースで公開しています。 Open-source replication of ChatGPT implementation process!
2022年8月に一般公開されたStable Diffusionは、入力した言葉に従って画像を自動で生成してくれるAIです。そんなStable Diffusionを画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使う方法について、ソフトウェアエンジニアのマシュー・ビュールマン氏が解説しています。 Stable Diffusion based Image Compression | by Matthias Bühlmann | Sep, 2022 | Medium https://matthias-buehlmann.medium.com/stable-diffusion-based-image-compresssion-6f1f0a399202 実際に以下の画像はすべて512×512ピクセルに圧縮した画像で、サンフランシスコ市街を撮影したもの。1枚目がJPEG形式、2枚目がWeb
2012年頃に「ディープラーニング」や「ニューラルネットワーク」が多くの分野で使われるようになってから、人工知能(AI)の分野は目覚ましい発展をみせてきました。「100年以内にAIは人間を超える」と言われることもありますが、AIが人間と同様の「意識」を持つことは将来的に起こりうるのか、神経学者が「意識」と「知能」の違いに言及しつつ解説しています。 Can AI Become Conscious? | News | Communications of the ACM https://cacm.acm.org/news/244846-can-ai-become-conscious/fulltext カリフォルニア工科大学教授であり神経学者でもあるクリストフ・コッホ氏はDNAの二重らせん構造を発見したフランシス・クリックとともに神経科学としての「意識」の研究に取り組んだ人物。またコッホ氏は同じく
人工知能ブームの先に起こること 松田雄馬氏(以下、松田):とうとう終わりに近づいてまいりましたよ。先ほど人工知能ブームを終わらせたがっている人がいる、ということを言いましたが、その人たちは人工知能ブームを今からどこに向かわせようとしているのか? それについて、残り10分弱ほどお話をしたいと思います。 人工知能ブームがこれから先どうなるのかということを考える上で、とても大事な視点は、僕自身はこれだと思っています。 (スライドを指して)この人はビスマルクさんといって、昔のプロイセンの首相ですね。彼はこんなことを言いました。「愚者は経験に学び、賢者は歴史に学ぶ」ということです。歴史は繰り返すなんていうこともいいますが。過去の歴史に学ぶことで、これからなにが起こるかが予想できると。 そういうわけで、実は過去の歴史の中でも、これまでも何度か人工知能ブームというのがありました。とくに、1番最初のブーム
アラヤ:ディープラーニングの演算量削減技術を保有 ディープラーニング、機械学習で予測モデルの構築やビッグデータの解析を行っている企業。 データ分析・予測に基づき最適なアクションを提案するソリューション、ディープラーニングを活用して画像・センサーから得られるデータで人や物を識別するソリューション、ディープラーニング小型化ソリューションなどがそのサービスとして挙げられる。 アラヤが開発したディープラーニングを小型化するためのディープラーニング演算量削減技術は「Microsoft Innovation Award 2018」の最優秀賞を受賞している。 https://www.araya.org/ エイシング:機械制御に特化したAIアルゴリズムを採用 機械への組み込みを前提としたAIアルゴリズムを開発・提供している企業。コア技術「DBT(Deep Binary Tree)」は少変量データを高速・高
この記事は、Filip Piekniewski氏のブログ記事 "AI Winter Is Well On Its Way" の翻訳です。 追記:Filip Piekniewski氏による本記事への補足も合わせてご覧ください。 翻訳:AIの冬はますます近付いている (Filip Piekniewski) AI Winter Is Well On Its Way ここ数年、ディープラーニングはいわゆるAI革命の最前線に位置付けられてきた。そして、多くの人が信じてきたところによると、ディープラーニングは我々をシンギュラリティ (汎用人工知能) という驚異の世界へと導いてくれる銀の弾丸なのだという。2014年、2015年そして2016年には多くの投資が行なわれ、AlphaGo のように新しい境界線が押し広げられていった。テスラといった企業は、CEOの口を通して完全な自動運転車はすぐ近くに迫っている
「AI開発ミステリー ~そして誰も作らなかった~」 とある大手製造業の怖いハナシ:マスクド・アナライズのAIベンチャー場外乱闘!(1/5 ページ) ITmedia NEWS読者の皆さん、はじめまして。マスクド・アナライズと申します。自称“AI(人工知能)ベンチャーで働きながら、情報発信するマスクマン”です。 日々、さまざまな企業から相談を受ける立場として、記事を通じてAI開発のリアルな現状をお伝えしたいと思います。AIやIoT、データ分析における華々しい成功事例やプレスリリースとは一線を画し、道理の通らぬ世の中にあえて挑戦する“シュートスタイル”を目指しております。 口火を切ったITmedia NEWSによる取材記事もご参照ください。 「開発の丸投げやめて」 疲弊するAIベンダーの静かな怒りと、依頼主に“最低限”望むこと 今回は「AI開発ミステリー ~そして誰も作らなかった~」と題し、AI
しばらく前のことだが、マイクロソフト社の開発したチャット・ボット(おしゃべりロボット)Tayがツイッターで不適切な発言をしたということで大騒ぎになった。ヒトラーの名をあげて人種差別的な攻撃をしたり、口汚くみだらな発言をくりかえしたりしという。一時的にサービスは停止され、マイクロソフト社は謝罪せざるをえなかった。TayはAI(人工知能)の自然言語処理技術にもとづくチャット・ボットだが、ソフトウェアそのものが悪いのではなく、一部のユーザが対話を通じてTayに「好ましくない調教」をほどこした、というのが真相のようである。 だが、なぜそんな大事件になったのだろうか。同様の差別発言をする人間は幾らでもいる。チャット・ボットつまりAIの発言だから非難が集中したわけで、そこにはAIは公平中立であり正確な知識をもっている、という一般人の思い込みがある。つまり、レイ・カーツワイルやニック・ボストロムなど超人
ハーバード・ビジネス・スクールのクレイトン・M・クリステンセン教授が書いた『ジョブ理論』(現訳は『Competing Against Luck』。日本語訳は2017年に刊行)には、私のような“ひよっこデータサイエンティスト”が仕事をする上で忘れてはならない教訓が記されています。 データは、顧客が「なぜ」ある選択をするのかについては、何も教えてくれない 教授は自身の身長や家族構成などのデモグラフィックを例に挙げ、「今朝、ニューヨーク・タイムズを買うという行動を私に選択させたのは、こうした特徴のせいではない」として、相関関係と因果関係を取り違えてはならないと強く訴えます。 この話を思い出すたびに、「手元にあるデータが世界の全て」だと思い込んで分析するとロクな結果にならないと、身につまされる思いでいっぱいになります。 苦労してたどり着いたダンジョンの奥にある宝箱には、絶対に強い武器や防具が入って
自己対戦と深層学習でマシンにコネクトフォー(Connect4:四目並べ)の戦略を学習させましょう。 この記事では次の3つの話をします。 AlphaZeroが人工知能(AI)への大きなステップである2つの理由 AlphaZeroの方法論のレプリカを 作って コネクト4のゲームをプレイさせる方法 そのレプリカを改良して他のゲームをプラグインする方法 AlphaGo→AlphaGo Zero→AlphaZero 2016年3月、DeepmindのAlphaGo(アルファ碁)が、囲碁の18回の世界王者、李世乭(イー・セドル)との五番勝負で、2億人の見守る中、4-1で勝利しました。機械が超人的な囲碁の技を学習したのです。不可能だとか、少なくとも10年間は達成できないと思われていた偉業です。 AlphaGo 対 李世乭の第3局 このことだけでも驚くべき功績ですが、DeepMindは、2017年10月、
脳の神経回路の構造を模倣 ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。 このニューラルネットワークのモデルを学習させるには、まず手書き文字画素データをピクセル単位に分割した上で、各ピクセル値を入力層に入力する。図3のモデルでは縦横28ドットで分割していることから、784個が入力層に並ぶ。 入力データを受け取った入力層は、受け取った値に「重み付け」をした上で、後段にある隠れ層のニューロン(神経細胞。CPUのような役割を担う)に伝達する。 同様に隠れ層の各ニューロンは、入力層から受け取った値をすべて加算し、その
ディープマインド(DeepMind)は10月12日、次世代の人工知能技術として「ディファレンシャブル・ニューラル・コンピューター(Differentiable Neural Computers:DNC)」を発表した。 ディープマインドは人工知能AlphaGoによって囲碁世界チャンピオンを打ち負かしたことが記憶に新しいグーグルのAI研究チーム。近年ではコンピューター・ゲームのルールを自分で学びクリアする「DQN(Deep Q-Network)」を発表している。新AI技術のDNC(機械式計算機として名高いバベッジのディファレンシャル・エンジンを連想させる名前)は、DQNの技術を更に進化させたアーキテクチャを採用し、既存ディープラーニングよりも学習精度や汎用性が高いAI技術のようだ。
2017/07/20 追記 本記事の内容に関してTwitter・メールで問い合わせをいただきますが、全員に対して返信を差し上げることが出来ないため、VALU保有者優先で相談を受けます。 valu.is 対象読者 自前のデータでディープラーニングを体験したい人 tensorflowなどのチュートリアルまでやったが、その次の道が見えない人 株価の予測に興味がある人 はじめに こんにちは。あんどう(@t_andou)です。 最近、人工知能の技術の一種「ディープラーニング」に注目しています。 ディープラーニングとは、簡単に言うと「これまでは人間が教えていた『特徴』を機械が勝手に見つけてくれる」ものらしいです。 最初は画像処理系のプログラムで遊んでみました。 ディープラーニングという言葉はよく耳にするようになってきましたが、何ができるかわからなかったので、まずは体験するためにまずはディープラーニング
一般物体検出アルゴリズムの紹介 今回CNNを用いた一般物体検出アルゴリズムの有名な論文を順を追って説明します。 コンピュータビジョンの分野において、一般物体検出とは下記の図のように、ある画像の中から定められた物体の位置とカテゴリー(クラス)を検出することを指します。 [6]より引用 Deep Learningアルゴリズムの発展によって、一般物体認識の精度は目まぐるしい勢いで進歩しております。 そこで今回はDeep Learning(CNN)を応用した、一般物体検出アルゴリズムの有名な論文を説明したいと思います。 R-CNN (Regions with CNN features) (CVPR 2014) [1] かの有名なCNNの論文[8]で、ILSVRC 2012の物体認識チャレンジで大差をつけて1位になりました。 このチャレンジでは1枚の画像が1000クラスのうちどれに属するかを推定する
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く