タグ

2022年4月27日のブックマーク (7件)

  • 自作できる小型ロボット「犬」に物体追跡AIを搭載してみよう

    身近な現実問題にAIやデータサイエンスの適用を試してみる新連載。今回は「ミニぷぱ」というラズパイベースの小型ロボット犬を製作し、OAK-D-LITEカメラを搭載することで物体検知して自動的に目で追うようにしてみる。 連載目次 連載の目的 AI機械学習/データサイエンスをある程度学んできて、Kaggleにも挑戦してちょっとずつ実践を試してきたら、もっと身近な現実問題にAIやデータサイエンスの適用を試したくなってきますよね。そこで連載では、AIやデータサイエンス、場合によってはもっと広げてPythonなどの幅広い技術を活用して、業務データの利活用や日常作業の効率化、身の回りの趣味や遊びの高度化などを試していきたいと思っています。 ちなみに、コンペティションでの挑戦をつづる『僕たちのKaggle挑戦記』という連載も現在展開中ですが、連載はその姉妹版であり現実問題版のような立ち位置という想

    自作できる小型ロボット「犬」に物体追跡AIを搭載してみよう
    misshiki
    misshiki 2022/04/27
    “「ミニぷぱ」というラズパイベースの小型ロボット犬を製作し、OAK-D-LITEカメラを搭載することで物体検知して自動的に目で追うようにしてみる。”DepthAI APIでMobileNetモデル使用。
  • BERT2BERTによるニュース記事のタイトル生成 - Qiita

    はじめに huggingfaceを使ったEncoder-Decoderモデルの練習の一貫として、BERT2BERTによる文章生成をやってみました。 BERT2BERTはEncoder-Decoderモデルの一種で、Encoder層もDecoder層もBERTのアーキテクチャーを採用したモデルのことを言います。 ただし、Decoder層のBERTは通常のBERTと以下の2点で異なります。 最初のMutil Head AttentionがMusked Multi Head Attenion(単方向)になってる MMHAとFFNの間にCross Attention層があり、Encoderの特徴量を受け取れるようになってる アーキテクチャーはほぼほぼTransformerと同様の認識ですかね。この辺の構造も含めて、Encoder-DecoderモデルやBERT2BERTの理論的なお話やhuggin

    BERT2BERTによるニュース記事のタイトル生成 - Qiita
    misshiki
    misshiki 2022/04/27
    チュートリアル。日本語使用。
  • 教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog

    こんにちは!nakamura(@naka957)です。今回は、主成分分析(PCA)をご説明します。 主成分分析は教師なし学習の重要手法の1つです。教師なし学習は正解情報なしでデータのパターンを推測する手法です。その中でも、主成分分析は多数の特徴量を少数の特徴量で表現する手法です。言い換えれば、高次元のデータを低次元で表現するため、次元圧縮の手法とも呼ばれます。 記事では、主成分分析の概要と実装例をご紹介します。実装例では、手書き数字の画像データを実際に次元圧縮してみます。手書き数字の画像データでパターンが観測されるか確かめてみましょう。 では、早速始めていきます。 主成分分析 実装例 データセットを準備 標準化でスケールを揃える 主成分分析の実行 結果の可視化 まとめ 参考 主成分分析 主成分分析(Principal Component Analysis: PCA)は、多数の特徴量のデー

    教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog
    misshiki
    misshiki 2022/04/27
    “主成分分析”
  • PFN、キャラ生成PF「Crypko」のウェブサービスを開始--顔や上半身イラストを自動生成

    Preferred Networksは4月26日、顔ならびに上半身のイラストが自動生成・編集できるキャラクター生成プラットフォーム「Crypko」(クリプコ)を、同日からウェブサービスとして提供を開始した。 Crypkoは、深層学習を応用した画像生成モデルの1つである「敵対的生成ネットワーク」(generative adversarial networks、GAN)を使った顔のイラスト生成モデルとして、2018年に開発を開始。6世代目となる今回の生成モデルでは、顔だけでなく人間のイラストレーターが描画したようなキャラクターの上半身のイラストを生成することが可能となっている。 さらに、生成したキャラクターを融合することにより、それらの特徴を継承した新しいキャラクターを生成する。髪や目の色、表情などの属性をユーザーの好みで変更することも可能となっている。ユーザーは、所定のアプリ内ポイント(Cr

    PFN、キャラ生成PF「Crypko」のウェブサービスを開始--顔や上半身イラストを自動生成
    misshiki
    misshiki 2022/04/27
    事例
  • 東大、“世界最高性能”のディープフェイク検出AIを開発 フェイクニュースやポルノなどの悪用根絶に期待

    東京大学大学院情報理工学系研究科の研究チームは4月26日、動画内の人物の顔が物かどうかを判定する、ディープフェイク検出AIを開発した。このAIは、既存研究の性能を大きく上回り、世界最高性能の評価を示したという。より高い精度でディープフェイクの検出が可能になるため、悪用の根絶に期待できるとしている。 ディープフェイクを検出するAI技術の多くは、訓練時に学習した作り方に倣ったフェイク画像などしか検出できず、それ以外のものを検証する際には性能が大きく低下する問題を抱えている。 こうした未知のディープフェイクに対し、Microsoftは2020年に、疑似フェイク画像を作り、それを使った検出AIの学習方法を提案している。しかし、この手法では、非常に検出が容易な疑似フェイク画像を生成する場合があり、それらの画像を学習した検出AIは、高圧縮率による潰れた画像や、高/低露光下のフェイク画像に対して、検出

    東大、“世界最高性能”のディープフェイク検出AIを開発 フェイクニュースやポルノなどの悪用根絶に期待
    misshiki
    misshiki 2022/04/27
    “動画内の人物の顔が本物かどうかを判定する、ディープフェイク検出AIを開発した。このAIは、既存研究の性能を大きく上回り、世界最高性能の評価を示したという。”
  • Python 3.15からデフォルトのエンコーディングがUTF-8になります - methaneのブログ

    Pythonがファイルを開くときなどに使われるエンコーディングはロケール(WindowsではANSIコードページ)依存でした。 Unixの世界ではどんどんUTF-8ロケールが一般的になっている一方、WindowsのANSIコードページはなかなかUTF-8になりません。 そのために、Unixユーザーが open(filepath) のようにエンコーディングを指定しないままUTF-8を仮定するコードを気軽に書いてしまって、Windowsユーザーがエラーで困るといった問題が発生します。 また、Windowsでもメモ帳(Notepad.exe)やVSCodeはすでにUTF-8をデフォルトのエンコーディングで使用しています。ANSIコードページがUTF-8になるのを待っていたらどんどん周りの環境から置いていかれ、レガシー化してしまいます。 Pythonがデフォルトで利用するエンコーディングをWind

    Python 3.15からデフォルトのエンコーディングがUTF-8になります - methaneのブログ
  • GitHub - LukasZahradnik/PyNeuraLogic: PyNeuraLogic lets you use Python to create Differentiable Logic Programs

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - LukasZahradnik/PyNeuraLogic: PyNeuraLogic lets you use Python to create Differentiable Logic Programs
    misshiki
    misshiki 2022/04/27
    “PyNeuraLogicを使用すると、Pythonを使用して微分可能な論理プログラムを作成できます”