タグ

ブックマーク / note.com/shi3zblog (7)

  • Apple Vision ProはHoloLensの完成形。現時点での限界値|shi3z

    昔は海外の電波を発する新製品は国内で使用できなかったが、今は総務省の技適の特例制度を利用することでいち早く試すことができる。 「海外法令」云々のところで多少つまづいたが、これはFCC IDを検索すれば解決した。 https://fccid.io/BCGA2117 VisionProのFCC IDはBCGA2117だった。 これで準備完了。 吾輩は、かつては1990年代にキヤノンのMR(混合現実感)システムや理化学研究所のSR(代替現実感)システムを試し、大学院の履修生をやっていた頃はVR特講を受講し、学生対抗国際VR(人工現実感)コンテストに参加したこともある。htc Viveでいくつかのデモを作り(ほとんどは非公開)、Oculusもほとんど持ってるくらいはHMD好きである。片目リトラクタブルHMDで自転車の走行を支援するシステムのデモも2008年頃に作った。 2017年には機械学習したM

    Apple Vision ProはHoloLensの完成形。現時点での限界値|shi3z
    tsimo
    tsimo 2024/02/08
  • 高次元ベクトルを「矢印」とイメージするのがちょっとしっくりこない理由|shi3z

    なぜAIを考える時にベクトルを「矢印」と捉えるべきではないのか。 実際には矢印として考えたほうがいい例外もあります。 たとえば、特徴空間の任意の2点の引き算や足し算をするとき。 矢印のメタファーが使えます。 あるベクトルAから別のベクトルBを引いたベクトルCは、BからAへ伸びる矢印としてイメージするのは大丈夫です。 この性質を利用して、プロンプト芸が成り立つケースもあります。 たとえば画像生成AIで使われるネガティブプロンプトはそういう性質を使っています。 しかし、根的に、我々が普段イメージする二次元の矢印で示されるベクトルと、十次元以上の高次空間のベクトルは、全く異なる性質をもっていると考えるべきです。低次のベクトルと、高次のベクトルでは、共通する要素はあるけれども、それはごく一部に過ぎないということです。 例を挙げましょう。 1次元のベクトルは、正負の向きと大きさを持ちます。 数直

    高次元ベクトルを「矢印」とイメージするのがちょっとしっくりこない理由|shi3z
    tsimo
    tsimo 2023/06/16
  • MacBookPro M2MAXを買った|shi3z

    MacBookAir M1を愛用していた。 軽くて小さくて高性能。まさに相棒。好きだった。いまでも好きだけれども。 しかし、3年前にMBAを買った時には全く想定していない使い方をするようになった。なぜかWebサービスを作る日々に戻ってしまったのである。 これも、ChatGPTとか使うと恐ろしくはかどる。 SublimeTextちゃんを長年愛用してきたが、GPT4との接続性を考えるとVSCodeに変更せざるを得ない。ファイラー付いてた方が便利だし。 Webサービスに限らず、何らかのフロントエンドを含むものを作る時の大原則は、画面がでかいということである。 次の問題は、ストレージだった。 MBAのストレージは2TB。これでもとうじは積めるだけ積んでいた。 今もMBAは2TBが限界じゃないかな。 しかし2TBが埋まってしまった。 僕は職業柄、UberEats配達員のとき以外は講演とかをすることが

    MacBookPro M2MAXを買った|shi3z
    tsimo
    tsimo 2023/03/28
  • GPT-4 APIがやってきた!3.5と"性能"を比較する|shi3z

    Waiting Listにもっと時間がかかるかと思ったのだが、予想外に早く(一日)APIのロックが解除された。ただしまずは8Kトークン版のみ。 GPT-3.5が4Kトークンだったから倍の長さのストーリーが出せるということだ。 ただし値段はChatGPT APIの10倍。元に戻った感じ。 これはどっちを使うべきか結構悩むぞ。 こんな感じで呼ぶ % curl https://api.openai.com/v1/chat/completions \ -H 'Content-Type: application/json' \ -H 'Authorization: Bearer APIKEY'\ -d '{ "model": "gpt-4", "messages": [{"role": "user", "content": "宮崎駿について"}], "temperature": 0.7 }'答えはこ

    GPT-4 APIがやってきた!3.5と"性能"を比較する|shi3z
    tsimo
    tsimo 2023/03/27
  • 完全フリーで3GBのVRAMでも超高速に動く14B大規模言語モデルRWKVを試す|shi3z

    Transformerは分散できる代償として計算量が爆発的に多いという不利がある。 一度みんなが忘れていたリカレントニューラルネットワーク(RNN)もボケーっとしている場合ではなかった。 なんと、GPT3並の性能を持つ、しかも完全にオープンな大規模言語モデルが公開されていた。 そのなもRWKV(RuwaKuvと発音しろと書いてある。ルワクフ?) RWKVはRNNなのでGPUメモリをそれほど大量に必要としない。 3GBのVRAMでも動くという。 時間がない方はビデオをご覧ください 僕の失敗は、何も考えずにgit lfs installでディレクトリごとコピーしようとしたこと。 このディレクトリには過去のモデルデータが全部あるので、ひとつ30GBのモデルデータを何十個もダウンロードしようとしていて終わらなかったのだ。 モデルデータは一とつあれば十分なのでひとつだけにする。 次に、chatのリポ

    完全フリーで3GBのVRAMでも超高速に動く14B大規模言語モデルRWKVを試す|shi3z
    tsimo
    tsimo 2023/03/27
  • コンピュータは難しすぎる|shi3z|note

    コンピュータは非常に便利なのだが、ほとんどのコンピュータユーザーがその能力の1%も使えてないのではないか。そんな気がするのだ。 というか、コンピュータの能力が人類の進歩に比べて上がり過ぎてる。 おかげでゲームAIもビデオ編集も手軽になった。 MacBookの新しいCPUが発表されたのだが、40%高速化したというニューラルエンジンを一体全体何に使えばいいのか、人工知能の研究者である吾輩にもわからないので、これを使いこなすことができる人は将来登場するのだろうか。 コンピュータの能力を真に最大限引き出すには、残念ながらプログラマーになるしかない。しかも、マシン語レベルの最適化ができるプログラマーである。 プログラムさえ丁寧につくればコンピュータの持つ潜在能力は圧倒的に高い。だがコンピュータに比べて人間は頭が悪すぎる。 結局のところ、道具がどれだけ進歩しても使う側の人間の想像力が追いつかないと全

    コンピュータは難しすぎる|shi3z|note
    tsimo
    tsimo 2023/01/19
  • 今日から俺は、|shi3z|note

    私、社長ではなくなりました。 思えば、会社を飛び出して19年、海外に行ったり、個人事業主になったり、結局会社を作ったり、ゲームを作ったり、CMSを作ったり、ハードを作ったり、やりたい放題やってきて、つくづく思っていたのは、「俺は社長には向いてない」ということでした。 過去のブログでも度々言及していたように、社長ほど割りに合わない仕事はありません。 給料が高くていいなあと思うかもしれませんが、中小企業の社長なんて、少しお金が貯まれば、すぐに自社株買いに回さなくてはなりません。結局、形を変えて会社にお金を戻していたわけです。 川上量生さんも以前言っていたように社長になるというのは、社長を辞めるゲームの始まりです。いかにいい形で社長を辞めることが出来るか。会社が軌道に乗り、自分が一から百までやらなくても、社員が自律的に行動し判断し、会社が持続的に成長出来るようになること、そのために必要な幹部社員

    今日から俺は、|shi3z|note
    tsimo
    tsimo 2021/11/01
  • 1