タグ

ブックマーク / wirelesswire.jp (5)

  • 加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
  • OpenAI/GPT-3のプロンプトプログラミングとは何か?実際にやってみる

    OpenAI/GPT-3のプロンプトプログラミングとは何か?実際にやってみる 2021.04.27 Updated by Ryo Shimizu on April 27, 2021, 08:05 am JST GPT-3は、イーロン・マスクMicrosoftらが支援するOpenAIという組織によって公開された世界最高峰の自然言語AIと言われている。 膨大なパラメータを持ち、インターネット上のありとあらゆる文字情報を学習したもので、あまりに自然な文章が作れてしまうので一般公開が制限されるという、いわく付きのAIだ。 GPT-3を利用したアプリケーションには「プロンプトプログラミング」という手法が使われている。 これを使えば、欲しいプログラムが簡単に書けるのである。 これは非常に画期的なパラダイム(考え方)で、「プログラミング」という概念を大きく広げるものだと言える。 そこで「プログラミング

    OpenAI/GPT-3のプロンプトプログラミングとは何か?実際にやってみる
  • AIとオセロで考える「説明可能なAI」に求められる要件とは

    AIとオセロで考える「説明可能なAI」に求められる要件とは 2020.08.17 Updated by Ryo Shimizu on August 17, 2020, 15:16 pm JST もともとオセロのAIというのは基中の基である。チェスのAIと並んで、いや、それ以上に日ではポピュラーだった。オセロのAIは、日で最初にマネタイズに成功したAIと言ってもいいだろう。 厳密にはオセロはツクダオリジナルの商標なので、一般にはリバーシと呼ぶのだが、オセロのほうが馴染みがいいので稿ではオセロとリバーシを区別しないことにする。 オセロAI歴史を紐解くと、故・森田和郎さんという伝説的プログラマーが出てくる。 森田さんはゲームAI開発の先駆者で、オセロを皮切りに、晩年は将棋ゲームの傑作AIを数多く作った。 森田さんは当時から思考アルゴリズムをオープンにし、開かれた場でAIの議論を活発に

    AIとオセロで考える「説明可能なAI」に求められる要件とは
  • 2021年、AIには何ができて、何ができないか

    2021年、AIには何ができて、何ができないか 2021.01.04 Updated by Ryo Shimizu on January 4, 2021, 10:02 am JST AIは近年、驚くような変化が毎月のように訪れている。 筆者の主宰する私塾では、上級会員向けに月に一回、AIに関する最新情報をシェアし、考察を加えるといったことを4年ほど続けている。 始めた当初は「そんなに毎月話すことがあるだろうか」と不安だったが、恐るべきことに毎月色々なことが起きているのでここ数年全く退屈するということがない。 そんなわけで、一年前には想像もつかなかったようなことがAIで実現している。2020年だけでも、GPT-3、ImageGPT、VisionTransformer、AlphaFoldといったイノベーションがあった。 特にGPT-3に関しては、GPTそのものは2019年末に発表されていたもの

    2021年、AIには何ができて、何ができないか
  • ブラウザから手軽に深層学習AIを教育できるオープンソースソフトウェア

    ブラウザから手軽に深層学習AI教育できるオープンソースソフトウェア You can train a deep neural network on your web browser 2015.12.24 Updated by Ryo Shimizu on December 24, 2015, 06:00 am JST 先日発表した深層学習(ディープラーニング)をWebブラウザ上から手軽に行うためのオープンソース・ソフトウェア、「DEEPstation(ディープステーション)」をついに公開しました。現在、Githubより誰でもダウンロードして使用することが出来ます(https://github.com/uei/deepstation)。 DEEPstationは、ディープラーニングを手軽に実験するためのGUIベースのアプリケーションで、以下のような特徴があります。 国産ディープラーニングフレ

    ブラウザから手軽に深層学習AIを教育できるオープンソースソフトウェア
  • 1