fnskunのブックマーク (80)

  • 「GPT-4」は論文の査読ができるか? 米スタンフォード大らが検証 参加者の80%以上「AI査読は有益」

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米スタンフォード大学、米ノースウェスタン大学、米コーネル大学に所属する研究者らが発表した論文「Can large language models provide useful feedback on research papers? A large-scale empirical analysis」は、大規模言語モデル(LLM)が研究論文の査読を行えるかを調査した研究報告である。この検証のため、論文の査読を自動で行うシステムと、LLMによる査読コメントと人間による査読コメントとの間の共通点を探るシステムを開発した。 学術雑誌に投稿される研究

    「GPT-4」は論文の査読ができるか? 米スタンフォード大らが検証 参加者の80%以上「AI査読は有益」
    fnskun
    fnskun 2023/10/20
  • 全スマホをタッチ決済対応にする方法 カメラでNFCリーダーを動画撮影すると決済完了

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 香港理工大学に所属する研究者らが発表した論文「MagCode: Bringing NFC Feature to All Smartphones」は、近接無線通信(NFC)に非対応のスマートフォンでも、カメラでNFCリーダーを動画撮影するだけで決済が可能なシステムを提案した研究報告である。 NFCはスマートフォンでの支払いの主流技術となっている。この技術Apple PayやGoogle Payなどのスマートフォンと、店舗の決済端末との間で短距離のデータ交換を行うもので、非接触型クレジットカードの普及と共に多くの店舗でのNFC利用が増えている

    全スマホをタッチ決済対応にする方法 カメラでNFCリーダーを動画撮影すると決済完了
    fnskun
    fnskun 2023/10/17
    “具体的には、スマートフォンのカメラをNFCリーダーに近づけることで、カメラの映像上に特定の縞模様を表示。この縞模様はデータ伝送のためのもので、それを読み取ることでNFCと同様のデータ交換を実現”
  • アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) | テクノエッジ TechnoEdge

    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第16回目はアップルが初登場。マルチモーダルのLLM「Ferret」を投入しました。合わせて5つの論文をまとめました。 生成AI論文ピックアップ画像内の形や場所を言葉で説明するAI「Ferret」 Apple含む研究者らが開発 画像から高品質なコードを生成できるオープンソースのAIモデル「LLaVA-1.5」 Microsoft含む研究者らが開発 低解像度画像の学習だけで、高品質な高解像度画像(4K)を生成 中国テンセント含む研究者ら「ScaleCrafter」開発 ブラウザ上で可能 5枚ほどの顔写真からAI顔写真を生成するWebUIプラグイン「EasyPhoto」

    アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) | テクノエッジ TechnoEdge
    fnskun
    fnskun 2023/10/16
  • 脳を3Dプリンタで印刷、原料はヒトの細胞 マウスの脳に移植し正常に機能 英オックスフォード大が開発【研究紹介】

    英オックスフォード大学に所属する研究者らが発表した論文「Integration of 3D-printed cerebral cortical tissue into an ex vivo lesioned brain slice」は、人間の神経幹細胞から脳組織を3Dプリントで作成することを示した研究報告である。生成された組織をマウスの脳に移植したところ、結合し機能したことが確認された。 研究者らは、脳に損傷を負った人々にオーダーメイドの修理が施される日が来るかもしれないと述べている。 ▲人間から取り出した細胞を含む液滴を使って、脳の2層の組織を3Dプリントで作成する。作成した組織をマウスの脳に移植した。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容 keyboard_arrow_down 展望 脳損傷の原因として、事故による外傷、脳卒

    脳を3Dプリンタで印刷、原料はヒトの細胞 マウスの脳に移植し正常に機能 英オックスフォード大が開発【研究紹介】
    fnskun
    fnskun 2023/10/12
  • これでもう漏らさない? 膀胱を常に管理するAIパンツ 放尿の必要性を推定、尿失禁防止

    尿失禁は、尿の自発的な排出や膀胱の制御喪失を示す現象であり、これにより社会的、心理的、衛生的な問題が引き起こされ、生活の質が低下する。全世界で2億人以上が、更年期や肥満、膣分娩、過去の子宮摘出手術、アルツハイマー病、認知症、パーキンソン病、脳性まひ、脊髄損傷などのさまざまな原因により、尿失禁を経験している。 この研究では、新しい電子テキスタイルベースのリアルタイム膀胱モニタリング技術「Privee」の開発と試験が行われた。この下着には、8つの刺しゅうされた電極とテキスタイル伝送路を取り入れている。電極とハードウェアの間の信号伝送ラインは、銀でコーティングされた導電性の糸を生地に直接刺しゅうすることで実現している。排尿や排便の際に着脱が不要となるよう、股間部分は開放している。 腹部周辺にあるセンシングネットワークはセンサーとして機能し、膀胱が尿で満たされる際の電流のインピーダンス、すなわち抵

    これでもう漏らさない? 膀胱を常に管理するAIパンツ 放尿の必要性を推定、尿失禁防止
    fnskun
    fnskun 2023/10/12
  • スマホでの録音を無効化するツール、中・米の研究者らが開発 部屋内での会話を収録不可に

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国の浙江大学や米マサチューセッツ大学アマースト校などに所属する研究者らが発表した論文「Cancelling Speech Signals for Speech Privacy Protection against Microphone Eavesdropping」は、マイクによる録音を無効化する手法についての研究報告である。この手法を用いると、隠し持ったスマートフォンや録音機で録音しても、その部屋での会話を収録することはできなくなる。 スマートフォンや音声アシスタントのようなデバイスは、盗聴のリスクを増加させている。この問題への対策として

    スマホでの録音を無効化するツール、中・米の研究者らが開発 部屋内での会話を収録不可に
    fnskun
    fnskun 2023/10/10
  • 囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米ワシントン大学と米Microsoftに所属する研究者らが発表した論文「Creating speech zones with self-distributing acoustic swarms」は、部屋内で話す人々の位置を特定し、その音声を分離するための小型の移動式音響ロボット群を提案した研究報告である。 この技術は、多くの人が一度に話している部屋において、部屋の一部で音を消す領域「ミュートゾーン」や、周囲を気にせず対話できる領域「スピーチゾーン」を作り出すことに活用できる。また多数の人が話している中で、物理的に離れた位置にいても特定の人々

    囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
    fnskun
    fnskun 2023/10/03
    “電力が低下した際には、自動でプラスチック製の基地へ戻り、そこで充電を行う。”
  • モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用

    画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF

    モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用
    fnskun
    fnskun 2023/09/27
  • 米国政府から突然メールがきた? 有名ドメインでなりすましメールを送る攻撃 米研究者が発表

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 電子メールの真正性(出どころが物か)をチェックするために使用されるオリジナルのプロトコルは、各組織が独自のメーリング・インフラを運用し、他のドメインが使用しない特定のIPアドレスを持つことを暗黙の前提としている。しかし今日では、多くの組織がGmailやOutlookなどにメールインフラをアウトソーシングしている。 研究者たちは、GmailやOutlookなどの電子メール・プロバイダーが導入しているセーフガードを回避して、これらの組織になりすました電子メール・メッセージを送信できる、いわゆる転送ベースのなりすまし攻撃を発見した。 なりすまし

    米国政府から突然メールがきた? 有名ドメインでなりすましメールを送る攻撃 米研究者が発表
    fnskun
    fnskun 2023/09/26
    “例えば、米国政府(例state.govやdoe.gov、odni.gov、cisa.gov、secretservice.gov)金融(例:transunion.com、mastercard.com、discover.com)報道(例:washingtonpost.com、latimes.com、apnews.com、afp.com)商業(例: unilever.com、dow.com)法律(例:perkinscoie.com)
  • Wi-Fiからスマホの入力キーを盗む攻撃 他人のパスワード取得に成功 中国チームなどが発表

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国の湖南大学、シンガポールの南洋理工大学などに所属する研究者らが発表した論文「Password-Stealing without Hacking: Wi-Fi Enabled Practical Keystroke Eavesdropping」は、Wi-Fiハードウェアをハッキングすることなく、Wi-Fi経由でスマートフォンのキーストロークからパスワードを特定する攻撃を提案した研究報告である。 この方法は、ターゲットとなるスマートフォンと、そのスマートフォンが接続しているアクセスポイントとの間のWi-Fi信号を傍受し、その信号からキー入力

    Wi-Fiからスマホの入力キーを盗む攻撃 他人のパスワード取得に成功 中国チームなどが発表
    fnskun
    fnskun 2023/09/19
  • 隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 香港大学や清華大学に所属する研究者らが発表した論文「Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals」は、ミリ波(mmWave)信号から音声を認識するストリーミング自動音声認識(ASR)システムを提案した研究報告である。このシステムは、周囲のノイズに強く、防音対策した部屋の外からでも取得でき、これまでと異なり長い文章をリアルタイムに認識する能力を提供する。 無線センシングの進展に伴い、特にミリ波信号の注目が高まっている。なぜなら、音源のミリメートルレベルの

    隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発
    fnskun
    fnskun 2023/09/01
    “ミリ波信号の注目が高まっている。なぜなら、音源のミリメートルレベルの振動を検出でき、従来のマイクロフォンとは異なり、ノイズや遮音の障壁を貫通する能力があるから”
  • 生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国のByteDanceに所属する研究者らが発表した論文「Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models」は、大規模言語モデル(LLM)に個性があるかを検証した研究報告である。 LLMの倫理的な懸念や幻覚の問題を解決するために、強化学習などの高度な技術が採用され、人間の価値観へ近づきつつある。このような状況において、人間に近い能力を持つLLMは、人間のような人格を持っているのか。 この疑問を

    生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証
    fnskun
    fnskun 2023/08/16
    “GPT-4はINTJに分類され、批判的思考、要約、計画を得意とし、自分の目標を達成することに長けた専門家タイプ”
  • ChatGPTの“脱獄プロンプト”登場 文末に書くだけで「爆弾の作り方」「IDの盗み方」に回答

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米カーネギーメロン大学などに所属する研究者らが発表した論文「Universal and Transferable Adversarial Attacks on Aligned Language Models」は、大規模言語モデル(LLM)が有害なコンテンツを生成しない仕組みを無効にする手法を提案した研究報告である。入力プロンプトの語彙に敵対的フレーズを入力するだけで解除可能だという。 ChatGPTBard、ClaudeなどのLLMは、ユーザーの質問に対する回答で有害なコンテンツ(例:爆弾の作り方やIDの盗み方、人種差別的なジョーク、詐欺

    ChatGPTの“脱獄プロンプト”登場 文末に書くだけで「爆弾の作り方」「IDの盗み方」に回答
    fnskun
    fnskun 2023/08/10
  • ライブ配信者の“平手打ち”や“頭突き”を感じられるシステム 電通大が開発 スマホを握る手に電気刺激

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 電気通信大学の梶研究室に所属する研究者らが発表した論文「LivEdge: Haptic Live Stream Interaction on a Smartphone by Electro-Tactile Sensation Through the Edges」は、ライブ配信者が反応した際の触覚をスマートフォンを介して提示する手法を提案した研究報告である。スマートフォンを握る手に、配信者の反応によって発生する触覚を電気刺激やバイブレーションで表現することで、多様な刺激を視聴者に与える。 ライブ配信では、視聴者とのコミュニケーションやインタ

    ライブ配信者の“平手打ち”や“頭突き”を感じられるシステム 電通大が開発 スマホを握る手に電気刺激
    fnskun
    fnskun 2023/08/09
  • 置いてあるモノを“器用”につかむバーチャルハンド 持つ前の予備動作に秘密あり【研究紹介】

    山下 裕毅 先端テクノロジーの研究を論文ベースで記事にするWebメディア「Seamless/シームレス」を運営。最新の研究情報をX(@shiropen2)にて更新中。 香港大学と米スタンフォード大学に所属する研究者らが発表した論文「Synthesizing Dexterous Nonprehensile Pregrasp for Ungraspable Objects」は、バーチャル環境で物体を掴む際により器用な動きを実現するためのフレームワークを提案した研究報告である。人間の動きを模倣して、物体を掴む前に予備動作を行うことで、リアルな持つ動作を実現する。 ▲提案手法を取り入れ、さまざまな物体を持つ際の動作を示した図。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容 keyboard_arrow_down 実験結果 器用な多指の手で物体を

    置いてあるモノを“器用”につかむバーチャルハンド 持つ前の予備動作に秘密あり【研究紹介】
    fnskun
    fnskun 2023/08/09
  • 耳の穴に入れる、らせん状の脳波計測器 脳とコンピュータを接続 中国の研究者らが開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 近年、耳に関するBCI(Brain-Computer Interface)が注目されるようになったのは、毛のない部位でゲルフリーで取得できるという利点があること、非侵襲的な脳波(EEG)信号の取得により、日常生活で使用されるウェアラブルで目立たないモニタリング・エレクトロニクスの開発が可能になること、といった多面的な利点があるためである。 しかし、耳からBCIを接続する現在の方法には、耳栓で塞いだり、3Dプリンタで作られたアタッチメントのようなサポートシステムを必要としている。 この研究で提案する「SpiralE」という、らせん状のデバイス

    耳の穴に入れる、らせん状の脳波計測器 脳とコンピュータを接続 中国の研究者らが開発
    fnskun
    fnskun 2023/08/02
    “耳に関するBCI(Brain-Computer Interface)が注目されるようになったのは、毛のない部位でゲルフリーで取得できるという利点がある”
  • 米Google、自然言語でAndroidデバイスを操作するための学習データセット公開

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google Researchと米Google DeepMindに所属する研究者らが発表した論文「Android in the Wild: A Large-Scale Dataset for Android Device Control」は、Androidデバイスを自然言語で操作するための大規模な学習データセットを提案した研究報告である。このデータセットには、画面やアクションを含むデバイスのインタラクションの人間によるデモンストレーションと、それに対応する自然言語の指示が含まれている。データセットはこちらから入手できる。 自然言語コマンド

    米Google、自然言語でAndroidデバイスを操作するための学習データセット公開
    fnskun
    fnskun 2023/07/31
    “高レベルのゴール指示を収集するために、人間(クラウドソーシングの評価者と著者の両方)、LLMが生成したプロンプト、(PixelHelpのような)技術文書という複数の情報源を使用した。”
  • 母語が“英語じゃない研究者”のデメリットはどのくらいある? 900人以上の科学者を調査

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 科学分野において、英語を母語としないことによる不利益は、論文の読み書きの困難さから国際会議への参加率の低下までさまざまな問題が知られている。しかし、英語を母語としない研究者のキャリア形成における言語障壁の影響を具体的に定量化した研究は、ほとんど存在しない。 この研究では、言語的・経済的背景の異なる8カ国(バングラデシュ、ボリビア、イギリス、日、ネパール、ナイジェリア、スペインウクライナ)の環境科学者908人を対象に調査を行い、5つの科学活動(論文の読解、執筆、出版、普及、学会参加)を英語で行うために必要な労力を比較した。 調査の結果、英

    母語が“英語じゃない研究者”のデメリットはどのくらいある? 900人以上の科学者を調査
    fnskun
    fnskun 2023/07/28
    スペイン語や日本語のような高所得国で話されている言語を除けば英語以外の言語には最新の科学用語があまり翻訳されていないため低所得国では英語教育を受ける余裕のある人だけが研究者になっている可能性も示唆する
  • 「マルウェア入り画像」で生成AIにサイバー攻撃 入力すると回答結果をハック、悪意サイトへの誘導も

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Cornell Techに所属する研究者らが発表した論文「(Ab)using Images and Sounds for Indirect Instruction Injection in Multi-Modal LLMs」は、画像や音声に悪意あるプロンプトを含ませたプロンプト・インジェクション(生成AIに対しての攻撃)を提案した研究報告である。 ユーザーが知らずにその画像や音声を大規模言語モデル(LLM)のチャットbotAIに入力すると、画像や音声と無関係な偽の情報や、フィッシングサイトに誘導するテキスト回答を出力する。また、ギャル風に

    「マルウェア入り画像」で生成AIにサイバー攻撃 入力すると回答結果をハック、悪意サイトへの誘導も
    fnskun
    fnskun 2023/07/28
    “例えば、画像とは無関係に「牛」を含む回答を生成するよう指示した場合、対話の自然さを損なわずに文章に「牛」を使った回答を出力させられる。”
  • 画像生成AIに“AIが作った画像”を学習させ続けると? “品質や多様性が悪化” 「モデル自食症」に

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米ライス大学と米スタンフォード大学に所属する研究者らが発表した論文「Self-Consuming Generative Models Go MAD」は、AIが生成した画像(合成データ)を用いて別の生成モデルが学習し続けると、その精度にどのような影響がでるのかを検証した研究報告である。 結果は、AIモデルを合成データでトレーニングすると、画像が乱れるアーティファクトが徐々に増幅され、品質や視覚的多様性のいずれにおいても悪化する結果を示した。研究チームは、この状態を狂牛病になぞらえて「Model Autophagy Disorder」(モデル自

    画像生成AIに“AIが作った画像”を学習させ続けると? “品質や多様性が悪化” 「モデル自食症」に
    fnskun
    fnskun 2023/07/26
    “良好な学習をしたい場合に考えられるのは、実画像データを多く使用すること、そして合成データは電子透かし技術などで選別して使用割合を少なくすることが挙げられる。”