タグ

2023年7月20日のブックマーク (9件)

  • [データ分析]順位と偏差値 ~ 私の成績順位はどのあたり?

    データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回。集団の中での位置をパーセント単位で求めたり、偏差値を求めたりする方法と、その考え方を説明します。偏差値は大学や高校のランク付けによく使われていますが、序列を付けるためのものではなく、異なる分布の集団の間でも位置が比較できるとても便利な値です。 連載目次 データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回です。これまでは、集団のばらつきの度合いを表す散布度について見てきました。具体的には、前々回は間隔尺度や比率尺度で使われる分散/標準偏差を、前回は、順序尺度で使われる四分位範囲/四分位偏差と、名義尺度で使われる平均情報量/相対情報量を紹介しました。今回は、集団そのものの特徴から少し視点を変えて、集団の中にある個々の値に注目していきます。個々の値が集団の中でどの位置にあるのかをパーセ

    [データ分析]順位と偏差値 ~ 私の成績順位はどのあたり?
    misshiki
    misshiki 2023/07/20
    単純に順位を求める方法、ある点数が全体の何パーセントに位置するかを求める方法、パーセント位置から必要な点数を求める方法、偏差値などについての考え方を説明している。
  • 大規模言語モデル(LLM)の作り方 GPT-NeoX編 Part 1

    はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 の藤井(@okoge_kaz)です。 大規模モデルへの注目の高さを肌で感じる今日このごろですが、事前学習の知見については依然として十分に共有されているとは言い難いと個人的に感じています。 Turing株式会社では、次世代の自動運転技術を支える技術の1つとして大規模言語モデルに注目しており、独自に研究開発を行っています。今回は大規模言語モデルを学習する際、用いるライブラリ候補の1つに上がるであろうGPT-NeoXについて解説します。 以下で環境構築方法、学習を行う方法などについて詳しく解説します。 GPT-NeoXとは EleutherAIが管理しているNIDIA/Megatron-LM ベースの大規模言語モデル(Large Language Model: LLM)を学習するためのライブラリです。 Mi

    大規模言語モデル(LLM)の作り方 GPT-NeoX編 Part 1
    misshiki
    misshiki 2023/07/20
    “GPT-NeoXとは、EleutherAIが管理しているNIDIA/Megatron-LM ベースの大規模言語モデル(Large Language Model: LLM)を学習するためのライブラリです。” 環境構築から実行方法まで紹介。Part 2の記事も今後アップされる模様。
  • Llama.cpp で Llama 2 を試す|npaka

    「Llama.cpp」で「Llama 2」を試したので、まとめました。 ・macOS 13.4.1 ・Windows 11 前回 1. Llama.cpp「Llama.cpp」はC言語で記述されたLLMのランタイムです。「Llama.cpp」の主な目標は、MacBookで4bit量子化を使用してLLAMAモデルを実行することです。 特徴は、次のとおりです。 ・依存関係のないプレーンなC/C++実装 ・Appleシリコンファースト (ARM NEON、Accelerate、Metalを介して最適化) ・x86アーキテクチャのAVX、AVX2、AVX512のサポート ・Mixed F16/F32精度 ・4bit、5bit、8bit量子化サポート ・BLASでOpenBLAS/Apple BLAS/ARM Performance Lib/ATLAS/BLIS/Intel MKL/NVHPC/AC

    Llama.cpp で Llama 2 を試す|npaka
    misshiki
    misshiki 2023/07/20
    “「Llama.cpp」(llama-cpp-python)はC言語で記述されたLLMのランタイムです。高速推論が可能で、CPUでも動作します。”ローカルで実行方法までが紹介されている。簡単そう。
  • Llama 2 をDocker使ってローカルで動かす

    Llama 2 発表! Metaから商用利用可能なライセンスでオープンなLLMであるLlama 2が発表されました。 こりゃすごそうだけど、しばらくは様子見かなーと思っていたら、npakaさんが一瞬で動かしているではありませんか。 こりゃやるしかないと、ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの仮想環境の準備」を詳しく書いたものです。 DockerでLlama 2を動かす Dockerファイルは、以下リポジトリに格納してあります。 セットアップ方法は、以下参照ください。Linux/Windows前提です。Mac(Apple Silicon)では残念ながら今のところ動きませんでした。 Macでも動きますが、時間が非常にかかるので実用的ではないです。 Dockerのイメージ作成(ビルド)まで実施したらOKです。 続いて量子化されたモデルlla

    Llama 2 をDocker使ってローカルで動かす
    misshiki
    misshiki 2023/07/20
    “ローカルでDockerで動かしてみました。要は、npakaさんの記事の「(1) Pythonの仮想環境の準備」を詳しく書いたものです。”
  • 「安心して使える」国産の生成AI・大規模言語モデル(LLM) の開発を開始

    「安心して使える」国産の生成AI・大規模言語モデル(LLM) の開発を開始さくらインターネットのGPUサービスを採用予定。2023年中に生成AI・LLMのプロトタイプ提供を目指す 企業および官公庁が安心して利用できる目的特化型の大規模言語モデル(LLM) の提供に向けて、AIコンサル開発を手がけるRidge-i(以下、リッジアイ)が開発を開始しました。GPTを中心とした生成AI・LLMの活用は多くの企業が注目しています。一方で秘匿性の高いデータを共有することに関して、セキュリティリスクへの懸念や、ファインチューニング(業務や目的に合わせた精度向上)のニーズが高まっています。そこで、リッジアイでは、業務や目的に合わせた目的特化型の生成AIの開発を、国産のクラウド提供事業者であるさくらインターネット株式会社(以下、さくらインターネット)の環境下で構築し、企業および官公庁が安心・安全に利用でき

    「安心して使える」国産の生成AI・大規模言語モデル(LLM) の開発を開始
    misshiki
    misshiki 2023/07/20
    Ridge-iもLLMを開発中。“2023年中にプロトタイプ版の提供開始、2024年からは企業向けの生成AI・LLM活用サービスの提供を目指します。”
  • アップル、生成AIツールの自社開発を急ぐ-関係者

    An Apple internal chatbot, dubbed by some as “Apple GPT,” bears similarities to OpenAI’s ChatGPT, pictured. Photographer: Gabby Jones/Bloomberg 米アップルは、オープンAIやアルファベット傘下グーグルなどの製品に対抗できる人工知能(AI)ツールの開発をひそかに進めている。事情に詳しい複数の関係者が明らかにした。ただ、消費者への提供に向けた明確な戦略を立てるまでには至っていないという。 アップルの広報担当者はコメントを差し控えた。 関係者によると、アップルはオープンAIの「ChatGPT(チャットGPT)」やグーグルの「Bard(バード)」といったAIサービスの中核である大規模言語モデルを作成するための独自フレームワークを構築。また、一部のエンジニア

    アップル、生成AIツールの自社開発を急ぐ-関係者
    misshiki
    misshiki 2023/07/20
    “大規模言語モデルを作成するための独自フレームワークを構築。また、一部のエンジニアが「アップルGPT」と呼ぶチャットボットも作られたという。”
  • GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限

    GPT-4の画像認識機能に備わった特定の個人を識別するという能力がプライバシー法に違反する可能性があるという懸念から、OpenAIが顔認識機能に制限をかける措置を取っていることが明らかになりました。 A ChatGPT That Recognizes Faces? OpenAI Worries World Isn’t Ready. - The New York Times https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html Report: OpenAI holding back GPT-4 image features on fears of privacy issues | Ars Technica https://arstechnica.com/information-

    GPT-4の顔認識性能を懸念してOpenAIが顔認識機能を制限
    misshiki
    misshiki 2023/07/20
    “GPT-4の画像認識機能に備わった特定の個人を識別するという能力がプライバシー法に違反する可能性があるという懸念から、OpenAIが顔認識機能に制限をかける措置を取っていることが明らかに”
  • 8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名

    生成AIのトレーニングに作家の著作が無断で使用されているとして、全米作家協会が「AIトレーニングに著作権で保護された素材を無断で使用するな」とOpenAIAlphabet、MetaなどのAI開発企業へ訴える公開書簡を発表しました。この公開書簡には「ハンガー・ゲーム」シリーズで知られるスーザン・コリンズ氏、カナダを代表する作家であり2019年に「誓願」でブッカー賞を受賞したマーガレット・アトウッド氏など、8500人を超える作家が署名しています。 Open Letter to Generative AI Leaders https://actionnetwork.org/petitions/authors-guild-open-letter-to-generative-ai-leaders Nora Roberts, Margaret Atwood sign Authors Guild le

    8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名
    misshiki
    misshiki 2023/07/20
    “この公開書簡には「ハンガー・ゲーム」シリーズで知られるスーザン・コリンズ氏、カナダを代表する作家であり2019年に「誓願」でブッカー賞を受賞したマーガレット・アトウッド氏など、8500人を超える作家が署名”
  • AI「保護率39%」、児相は一時保護見送り…… 三重の“4歳女児暴行事件”をAIガバナンス観点で考える

    AI「保護率39%」、児相は一時保護見送り…… 三重の“4歳女児暴行事件”をAIガバナンス観点で考える:事例で学ぶAIガバナンス(1/3 ページ) 三重県で痛ましい事件が起きてしまった。津市で4歳の女児が親から暴行され、死亡したのである。まず何より、こうした虐待死事件が1件でも減り、また育児に問題を抱える親には支援の手が差し伸べられるようになることを願いたい。 この事件が報じられる中で、三重県の児童相談所のある対応が注目を集めた。虐待を受けていた女児を事件の1年以上前から「要保護児童」と認定し、一時保護を検討していたが、結局実行しなかったのだ。三重県はその一因として「AIによる判断」があったことを明らかにした。 この児童相談所では2020年に、人手不足や担当者の経験不足を補うために、AIを活用した児童保護の支援システムを導入していた。このシステムには「一時保護率」という類似の過去事例での保

    AI「保護率39%」、児相は一時保護見送り…… 三重の“4歳女児暴行事件”をAIガバナンス観点で考える
    misshiki
    misshiki 2023/07/20
    “今回の39%というのは、過去同様の状況下において、およそ5回に2回保護が行われていたということ”