タグ

2024年4月18日のブックマーク (24件)

  • MATLABの配列操作からの入門〔※ 特にPython経験者向け〕 - Qiita

    はじめに 私は今まで科学計算や機械学習などはPythonを使ってきましたが、今仕事の関係でMATLABを使う必要になったのです。 私がPythonを使い始める前からMATLABのことは知っていたが、実際に使ったことないのでほとんどゼロから勉強です。 汎用性が高いPythonと違ってMATLABは数値解析に特化する言語なので、配列操作はほとんど全てで、どんな場面でも使うので配列の動作を理解することはとても重要です。 配列の扱いに関しては意外と色々Pythonのnumpyと似ていてPythonに慣れている人にとって勉強しやすくてすぐ飲み込みできますが、それでもある程度の違いや注意点も多くて、それを意識しながら使うのも重要です。 この記事は主にPythonを使っていた人に向いているMATLABの入門となります。 Pythonを使ったことない人でも読めると思いますが、ここでは主に「Pythonで普

    MATLABの配列操作からの入門〔※ 特にPython経験者向け〕 - Qiita
    misshiki
    misshiki 2024/04/18
    “主にPythonを使っていた人に向いているMATLABの入門”
  • pandasから移行する人向け polars使用ガイド - Qiita

    pandasから移行する人向け polars使用ガイド polarsは、Pythonの表計算ライブラリです。Pythonではpandasがこの分野ですでに支配的となっていますが、polarsはパフォーマンス上pandasより優れているとされます。記事はpandasからpolarsに移行する人にとりあえず知っておくべきいくつかの知識とユースケースを提供します。 polarsは更新が活発で、頻繁に新しい関数の実装やたまに仕様変更が行われています。都度、公式の最新のドキュメントを確認することをおすすめします。 Github 公式APIリファレンス 公式ガイド 記事の内容はバージョン0.20.1 (2023/12/19)で確認しています。 基礎 polarsのデータ構造はpandasと同様です。一つの一次元配列をシリーズ(pl.Series)と呼びます。また、一つ以上のシリーズが集まってできた

    pandasから移行する人向け polars使用ガイド - Qiita
  • Pandas → Polars 早見表

    データサイエンスやデータエンジニアリングの分野において、効率的かつ柔軟なデータ処理を実現するためには、適切なツールの選択が不可欠です。最近では、高速かつ省メモリなデータ操作ライブラリであるPolarsが注目を浴びています。記事では、この新たなライブラリと既存のデータ処理ツールであるPandasとの対応関係を簡潔にまとめます。特に、Polarsへの移行やトライアルをスムーズに進めるために、両ライブラリの使い方に焦点を当てて解説します。 逆引きクックブックのようなイメージです。 ブログの見方 以下のフォーマットでまとめています。 <処理概要>

    Pandas → Polars 早見表
    misshiki
    misshiki 2024/04/18
    書き方がやや面倒になっていると思うが、思ったより互換性もありそう。
  • Index - Polars user guide

    Polars is a blazingly fast DataFrame library for manipulating structured data. The core is written in Rust, and available for Python, R and NodeJS. Key features Fast: Written from scratch in Rust, designed close to the machine and without external dependencies. I/O: First class support for all common data storage layers: local, cloud storage & databases. Intuitive API: Write your queries the way t

    misshiki
    misshiki 2024/04/18
    “Polars ユーザーガイド”
  • Polars

    01FastPolars is written from the ground up with performance in mind. Its multi-threaded query engine is written in Rust and designed for effective parallelism. Its vectorized and columnar processing enables cache-coherent algorithms and high performance on modern processors. 02Easy to useYou will feel right at home with Polars if you are familiar with data wrangling. Its expressions are intuitive

    Polars
    misshiki
    misshiki 2024/04/18
    公式サイト。“新しい時代のデータフレーム”
  • PandasからPolarsへ移行した方がいいのか - Qiita

    なぜこの記事を書くのか 皆さん、データ解析を行う際にどのようなライブラリを用いているでしょうか。 おそらく大半の人はpandasを使っているのではないでしょうか。 私もpandas使ってます。簡単だよね(´・ω・`) しかし、業務でバカクソでけえデータを読み込もうとしたときに、読み込み時間がとんでもなくかかったり、メモリ不足でそもそも読み込めもしないことが起きていました。 読み込みにメモリわれすぎて他の作業ができずに待機した挙句、燃え尽きたかのようにノーパソのファンが止まると同時にメモリ不足のエラーが出たときには切れ散らかします。 (画像元:葬送のフリーレン公式Xアカウントのポストより) そんなこともあり、AWSなどのクラウドサービスでメモリに余裕を持たせるためにめちゃくちゃ良いインスタンスを使用していましたが、コストの問題で断念しました。 しかし、どうしても読み込みたいということもあり

    PandasからPolarsへ移行した方がいいのか - Qiita
    misshiki
    misshiki 2024/04/18
    “生物としてもパンダは白熊に勝てないのは明らかであって、PolarsとPandasを比較しても圧倒的な速度の差があり、ライブラリとしての性能もPolarsが圧勝しています。”
  • 反実仮想機械学習とは何か

    @『反実仮想機械学習』出版記念イベント#1 https://cfml.connpass.com/event/313112/ Amazon: https://www.amazon.co.jp/dp/4297140292 質疑応答: https://docs.google.com/document/d/1P9C6ajiJZVGL0u77TbHvspJs_vfLE_b9puTxlSrVVuM/edit?usp=sharing 概要: 反実仮想(Counterfactual)─ 起こり得たけれども実際には起こらなかった状況 ─ に関する正確な情報を得ることは、機械学習や意思決定最適化の応用において必要不可欠です。例えば、「現在運用している推薦アルゴリズムを仮に別のアルゴリズムに変えたとしたら、ユーザの行動はどのように変化するだろうか?」や「仮に個々の生徒ごとに個別化されたカリキュラムを採用したら、

    反実仮想機械学習とは何か
    misshiki
    misshiki 2024/04/18
    全58ページのスライド資料。
  • Evolutionary Optimization of�Model Merging Recipes (2024/04/17, NLPコロキウム)

    Evolutionary Optimization of�Model Merging Recipes (2024/04/17, NLPコロキウム)

    Evolutionary Optimization of�Model Merging Recipes (2024/04/17, NLPコロキウム)
    misshiki
    misshiki 2024/04/18
    全39ページのスライド資料。
  • 継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development

    この記事は、金融チームエンジニアの今城(@imos)と金融チームリサーチャーの平野(@_mhirano)による寄稿です。 概要 稿では、ドメインに特化したLLMの構築の一環として、金融ドメイン特化のLLMの構築の検証を行いました。継続事前学習によるドメイン知識の獲得を模索し、特定のドメイン向けに専用のパラメータ数が多い高性能なLLMを提供を可能にすることを目指します。 実験では、nekomata-14bとPFNで構築した金融に特化したデータセットを用いて、継続事前学習を実施しました。 継続事前学習の結果として、金融ベンチマーク性能が向上することが確認できました。 出力の差としては、Instruction Tuningを施していないため、大きな差は見られないものの、一定の差が見られるケースもありました。 継続事前学習後のモデルは、https://huggingface.co/pfnet/n

    継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development
    misshiki
    misshiki 2024/04/18
    “ドメイン適合のための、継続事前学習を、日本語LLMに対して金融ドメインで実施しました。その結果、金融分野における、性能の向上を確認することができました。”
  • RAGを複雑な質問に強くする手法「CoA」について

    記事では、「Chain-of-Abstraction (CoA) Reasoning」についてざっくり理解します。軽めの記事です。 株式会社ナレッジセンスでは普段の業務で、生成AIやRAGシステムを活用したサービスを開発しています。 この記事は何 この記事は、最近聞くようになった「Chain-of-Abstraction (CoA) Reasoning」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー LLMが外部ツールを使って回答を生成するときの、回答精度を高める手法についての論文です。Metaの研究者らによって2024年1月に提案されました。「Chain-of-Abstraction (CoA)」という手法を使うメリットは、RAGに応用することで

    RAGを複雑な質問に強くする手法「CoA」について
    misshiki
    misshiki 2024/04/18
    と“CoAでは、問題(ユーザーからの質問)を複数の問題に分解し、複数回のドキュメント検索を行った上で総合的な回答を生成。類似手法の「Chain-of-Thought (CoT)」と違い、回答時間が短くて済むのが特徴。”
  • 1BitLLMの実力を見る|shi3z

    1BitLLMは当に実現可能なのか?そして、実現されると予告されていることに意味はあるのか? ようやく再現実装に成功した人が現れたので僕も試してみた。 ちなみに1Bit(1.58bit) LLMについての考察はこのページが面白いので一読をお勧めする。 ただし、普通のHuggingFaceのお作法とはかなり違うので注意が必要。 まず、このHuggingFaceリポジトリを丸ごとgit cloneする $ git lfs install $ git clone https://huggingface.co/1bitLLM/bitnet_b1_58-3B $ cd bitnet_b1_58-3Bこれをやらずにいつもの凡例みたいにいきなりpipelineに読み込もうとすると謎のエラーが出て悩まされることになる。海外でも悩んでる人が何人もいるみたいだ。まあ個人的には「こんな説明で誰がわかる?」と思

    1BitLLMの実力を見る|shi3z
  • elyza/ELYZA-tasks-100 · Datasets at Hugging Face

    傍若無人にふるまう人もいますが。)\n\n上記の文章を読んで、 に入れるのに最も適したものを以下の選択肢から選び、その理由を答えなさい。\n\n- だから\n- また\n- むしろ\n- もちろん"},"output":{"kind":"string","value":"文章中のに適した選択肢は「もちろん」です。\n\nの周辺では自発的な意志によって社会の秩序が保たれているという筆者の主張に対し、「傍若無人にふるまう人もいる」という反論を予想し予め掲げているため、「もちろん」が適切です。"},"eval_aspect":{"kind":"string","value":"- 選択肢を外している場合: -4点\n- 理由が的外れな場合: -2点\n- 理由の説明として(反論を)予想する旨が記述されていない場合: -1点\n"}}},{"rowIdx":7,"cells":{"input":{

    elyza/ELYZA-tasks-100 · Datasets at Hugging Face
    misshiki
    misshiki 2024/04/18
    “本データセットはinstruction-tuningを行ったモデルの評価用データセットです。”
  • 饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました|Baku

    最近LLMコミュニティから生まれた小型MoEモデル「LightChatAssistant-2x7B」の日語チャット性能がとても良いため、モデル作者さんが用いた手法(Chat Vector+MoEマージ)を後追いで勝手に検証しています。 その過程で複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。 以下はこのモデルの簡単な説明です。 簡易評価日語によるinstruction-tuningを行ったモデルの評価用データセットとして知られる「ELYZA-tasks-100」を用いて、ほかの有力な7Bクラスの日語モデルとスコアを比較しました。 その結果、GPT-4による評価において既存の日語7Bモデルより大幅に高いスコア(3.42)を示すことが確認できました。単純に

    饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました|Baku
    misshiki
    misshiki 2024/04/18
    “複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。”
  • Claude 3最強のOpusがついにAWSのBedrockに来た!! - Qiita

    Claude 3 Opus、ずっと待ってました! AWSの生成AIサービス、Amazon Bedrock。 多数の生成AIモデルがAPIとして利用できますが、テキスト生成で非常に高性能なのがAnthropic社のClaude 3シリーズです。 OpenAI社のGPT-4シリーズと日々、追いつけ追い越せを続けています。 Claude 3登場後、3モデルあるうち最上位の Opus モデルだけはなかなかBedrockにリリースされませんでしたが、ついに先ほどオレゴンリージョンに出現したようです! まだAWS公式リリースはないですが、近日中にWhat's New等でアナウンスされるものと思われます。 ※今回も宇宙最速の発見者はひるたさんでした。いつもありがとうございます🙌 そもそもBedrockって何だっけ? こちらの資料で紹介していますのでご覧ください! なお、凄腕Bedrockerの @he

    Claude 3最強のOpusがついにAWSのBedrockに来た!! - Qiita
  • 統合失調症などの患者に幻覚や妄想を引き起こす脳のネットワークがAIを使った研究で明らかに

    幻覚や妄想といった症状群を指す「psychosis(サイコーシス、精神症)」は、統合失調症などの重篤な精神疾患によくみられるほか、定義された精神疾患とは独立して発生することもあります。脳スキャンとAIによるパターン分析を組み合わせた新たな研究により、サイコーシスを引き起こす脳内のネットワークが明らかになりました。 Robust and replicable functional brain signatures of 22q11.2 deletion syndrome and associated psychosis: a deep neural network-based multi-cohort study | Molecular Psychiatry https://www.nature.com/articles/s41380-024-02495-8 Two key brain sy

    統合失調症などの患者に幻覚や妄想を引き起こす脳のネットワークがAIを使った研究で明らかに
    misshiki
    misshiki 2024/04/18
    “AIアルゴリズムにより、22q11.2欠失症候群のサイコーシス患者や独立したサイコーシス患者に共通する脳活動パターンを特定することができた”
  • 24年4月の量子コンピュータ業界の動向がよくわからんというので書いてみました。 by Yuichiro Minato | blueqat

    昨年から量子コンピュータ業界は大きな転換期に入りました。これまで人類には難しすぎるという量子コンピュータはみんなで四苦八苦しながら開発をしてきたと思います。具体的な沿革としては、 1、2012年に簡易型量子コンピュータみたいな量子アニーリングマシンが出る。 2、量子アニーリングマシンは2016年をピークに2018年ごろに廃れる。(デスクトップパソコンと大差ないことがわかる) 3...

    24年4月の量子コンピュータ業界の動向がよくわからんというので書いてみました。 by Yuichiro Minato | blueqat
    misshiki
    misshiki 2024/04/18
    “これまでのNISQマシンを使ってFTQCを実現するというロードマップが一気に崩れてしまいました。簡単にいうとブレイクスルーが起きた”
  • AIを使った論文の読み方

    近年の AI の進歩により、論文の読み方も大きく変化を遂げました。AI を活用することで以前と比べてはるかに簡単かつ早く論文が読めるようになりました。 以前私の個人ブログにて、論文の読み方やまとめ方を紹介しました。その時には要約ツールは用いていませんでしたが、最近はすっかり要約ツールを多用するようになりました。 稿では、最新の AI を使った論文の読み方を丁寧に紹介します。 基的な流れ 稿でおすすめするのは ChatGPT か Claude で要約を生成して論文の概要をつかみ、Readable で精読するという方法です。ChatGPT や Claude では単に全体の要約を生成するだけでなく、肝となる箇所を特定したり理解するためにも用います。具体的な手順については後の項で解説します。 私が特定のテーマについて調査を行う場合には、テーマに関係する論文を被引用数の多いものを中心に 10

    misshiki
    misshiki 2024/04/18
    “ChatGPT や Claude を使って論文の要約を生成する方法を紹介”
  • InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ

    by Budiey 2024年4月16日、Metaのプラットフォーム上で削除されるコンテンツについて監視を行う第三者組織の監督委員会がFacebookとInstagramで起こったディープフェイクポルノに関する事例2件について調査を開始したことを明らかにし、「Metaのポリシーと施行慣行がディープフェイクポルノに対処するのに効果的かどうかを評価する」と発表しました。 Oversight Board Announces Two New Cases on Explicit AI Images of Female Public Figures | Oversight Board https://www.oversightboard.com/news/361856206851167-oversight-board-announces-two-new-cases-on-explicit-ai-ima

    InstagramとFacebookで有名人が画像を改変されたAIディープフェイクポルノ事件をMetaの監督委員会が調査へ
    misshiki
    misshiki 2024/04/18
    “2024年4月16日、Metaのプラットフォーム上で削除されるコンテンツについて監視を行う第三者組織の監督委員会がFacebookとInstagramで起こったディープフェイクポルノに関する事例2件について調査を開始”
  • Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表

    英Stability AIは4月17日(現地時間)、画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。 Stable Diffusion 3に「Awesome artwork of a wizard on the top of a mountain, he's creating the big text "Stable Diffusion 3 API" with magic, magic text, at dawn, sunrise.」(夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に

    Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
    misshiki
    misshiki 2024/04/18
    “画像生成AIの「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」、AIチャットbot「Stable Assistant」を発表した。Stable Diffusionの新版はまだプレビュー段階だとしているが、開発者プラットフォームからアクセスできる。”
  • OpenAI Japan、採用情報を掲載 営業職とマーケティング担当を募集 勤務形態は週3日出勤

    OpenAIの日法人であるOpenAI Japanは4月16日までに、公式サイトで採用情報の掲載を始めた。16日午後2時時点では「アカウントディレクター」と「リージョナルマーケティング」の2ポジションを募集している。 アカウントディレクターの役割・業務内容は「当社の営業チームは、AIモデルがビジネスやユーザーにもたらす影響を顧客に理解してもらう使命を担っている。この職務は、技術的な理解、ビジョン、パートナーシップ、価値主導の戦略をミックスしたものだ」と説明。活動拠点は東京都で、勤務形態は週3日出勤のハイブリッドワークとしている。 求める経験は「7年以上のPaaS/SaaSの販売経験」「年間100万ドル以上の収益目標を3年以上達成」「ネイティブレベルの日語能力」「経営幹部と直接仕事をする」「急成長・高業績企業の成長をサポート」など。 リージョナルマーケティングも、活動拠点・勤務形態はア

    OpenAI Japan、採用情報を掲載 営業職とマーケティング担当を募集 勤務形態は週3日出勤
    misshiki
    misshiki 2024/04/18
    “OpenAI Japanは4月16日までに、公式サイトで採用情報の掲載を始めた。16日午後2時時点では「アカウントディレクター」と「リージョナルマーケティング」の2ポジションを募集している。”
  • Stable Diffusion 3 API のご紹介 — Stability AI Japan

    misshiki
    misshiki 2024/04/18
    “Stable Diffusion 3 と Stable Diffusion 3 Turbo が Developer Platform API に登場。”
  • 文字を正しく出力できる画像生成AI「Stable Diffusion 3」がAPI経由で利用可能に

    高画質画像生成AI「Stable Diffusion 3」のAPIが2024年4月17日に公開されました。Stable Diffusion 3は既存のAIでは失敗することの多い「文字の出力」を得意としています。 Stable Diffusion 3 API のご紹介 — Stability AI Japan https://ja.stability.ai/blog/stable-diffusion-3-api Stable Diffusion 3はStability AIが開発する画像生成AIで、DALL-E 3やMidjourney v6といった画像生成AIと比べてプロンプトに対する忠実性が高いことが人間による評価で確かめられています。また、Stable Diffusion 3はプロンプトの指示通りに文字を出力できることを大きな特徴としており、狙い通りの文章を好みの見た目で描画することが

    文字を正しく出力できる画像生成AI「Stable Diffusion 3」がAPI経由で利用可能に
    misshiki
    misshiki 2024/04/18
    “「Stable Diffusion 3」のAPIが2024年4月17日に公開されました。Stable Diffusion 3は既存のAIでは失敗することの多い「文字の出力」を得意としています。”
  • アドビ、PDFを要約&対話で質問できる「Acrobat AI Assistant」を一般公開

    米Adobeは4月15日、生成AIPDFなどのドキュメントを要約したり、対話形式で内容に関して質問したりできる「Acrobat AI Assistant」の一般提供を始めた。Acrobat ReaderおよびAcrobatデスクトップ版、Webアプリ版、モバイルアプリ版(β)で利用できる。いずれも月額4.99ドル(6月5日までの早期アクセス価格)のサブスクリプション加入が必要だ。 Acrobat AI Assistantは、PDFおよびその他のドキュメント(Word、PowerPoint、会議の議事録、Webサイトなど)の要約や、質問を通じて内容を把握できるAIアシスタント機能を利用できるもの。2月に先んじてAcrobatデスクトップ版とWebアプリ版でβ版が提供されていた。 対応言語は現時点で英語のみだが、その他の言語も追って利用できるようになるという。 Adobeは「長い契約書や合意

    アドビ、PDFを要約&対話で質問できる「Acrobat AI Assistant」を一般公開
    misshiki
    misshiki 2024/04/18
    “生成AIでPDFなどのドキュメントを要約したり、対話形式で内容に関して質問したりできる「Acrobat AI Assistant」”
  • アドビが「Premiere Pro」に映像生成AIを実装へ ~OpenAIなどの生成モデルを活用/プロンプトからの映像生成に加え、クリップの延長やオブジェクトの削除が可能に

    アドビが「Premiere Pro」に映像生成AIを実装へ ~OpenAIなどの生成モデルを活用/プロンプトからの映像生成に加え、クリップの延長やオブジェクトの削除が可能に
    misshiki
    misshiki 2024/04/18
    “米Adobeは4月15日(現地時間)、「Adobe Premiere Pro」に映像生成AIを実装すると発表した。年内には導入される予定。”