stealthinuのブックマーク - はてなブックマーク

NVIDIA、AIトレーニング用合成データ生成モデル「Nemotron-4 340B」を商用利用可でリリース

米NVIDIAは6月14日（現地時間）、LLMのトレーニング用オープン合成データ生成モデルシリーズ「Nemotron-4 340B」を発表した。独自のオープンモデルライセンス（PDF）の下、「あらゆる業界の商用アプリケーション向けLLM」のトレーニングに使うデータセットを合成できるとしている。つまり、商用利用も可能だ。 LLMの開発では、高品質で多様なデータセットでのトレーニングが不可欠だが、ネットなどから収集したデータには偏りや不正確なものが含まれる可能性があり、量にも限りがある。そのため、合成データの生成に注目が集まっている。 Nemotron-4 340Bには、合成データ生成のパイプラインを形成するbase、instruct、rewardの3つのモデルが含まれる。baseモデルは、9兆個のトークでトレーニングされたカスタマイズの基盤となるモデル。独自データを組み込むことで、このモデル

stealthinu 2024/06/19

Nemotron4 340Bの性能はGemini-1.5くらいっぽいがそれよりもLLMが出力した結果を学習データセット生成に使って良いってなってるとこが超すごい。H100x8あれば動かせるとのこと。会社なら買える規模。

リンク

なぜGmailだけ届かなかった？　高校出願システム問題、神奈川県に詳しく聞いた

神奈川県の公立高校入試のインターネット出願システムで、「@gmail.com」ドメインのアドレスにシステムからのメールが届かず、受験生による登録や高校出願に支障が出ていた問題が、2月7日までに解消した。問題発生から完全解消まで1カ月かかっている。県は問題の原因について「システム開発を委託した業者の設定に不備があったため、メール送信が集中したタイミングでGmailに迷惑メールと判定されたのでは」と説明しているが、設定のどこが問題だったかは特定できておらず、Googleに問い合わせても回答がないという。ネット上では今回、業者の技術力を疑問視する声も出たが、担当者は「県が仕様書を出して技術確認を行い、仕様に対応できるとのことで入札で決めた。問題ないと考えている」と述べている。「@gmail.comだけ」突然の障害、メールシステムを変えるなど対応出願システムは1月4日に公開。メール配信サー

stealthinu 2024/02/09

『設定「不備」は認めたものの「gmail以外のメールサービスには届いていた。設定の“誤り”とは断定できないのでは。誤りというよりセキュリティの厳しいGoogle向けの設定が不十分だった」との見解』ええっ！？

mail
spam

リンク

「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか？　NTT社会情報研究所が調査

現代の音声合成技術は特定の人物の声を基にして、その人と非常に似た合成音声を生成する能力を持つ。このような実在の人物の声の合成は、なりすましや詐欺などの不適切な使用が問題視されていることに加え、声の再現や公開がその人物の人格的利益や名誉感情に影響を与える可能性もある。また声優や歌手のように、自らの声を職業活動に利用する人々にとっては、無許可での声の再現や使用によって経済的損失を被る恐れがある。この研究の焦点は、特定の人物の音声データから学習させたモデルを用いて、任意のテキストをその人物の声で読み上げる合成音声技術にある。日本ではこの問題に関する具体的な法的争訟例はまだ存在しないとされるが、研究では架空の事例を設定し、この技術が引き起こしうる問題点を探究する。以下がその事例になる。（音声合成 AIの利用場面における法的課題―「声」に権利はあるのか―より引用）。声優Xは、所属するタレント事務所

stealthinu 2023/11/22

現時点では「声」に対しての法的なしばりがゆるくまた他のすでに利用されている技術と当たるため制限は難しい。が今後整備されていきそう？という感じ。

リンク

xAI、“全人類に利益をもたらすAIツール”を目指す「Grok」正式発表

イーロン・マスク氏が7月に立ち上げたAI企業xAIは、同社初のAIモデル「Grok」を発表した。まだ初期β段階だが、ベンチマークでは「ChatGPT-3.5」や「Inflection-1」を上回るとしている。イーロン・マスク氏率いる米AI企業xAIは11月4日（現地時間）、同社初のAIモデル「Grok」を発表した。マスク氏はそれに先立ち、GrokをXのハイエンドサブスクプランユーザーに提供する計画だとポスト済みだ。 xAIは企業サイトのトップページで「Grokは、『銀河ヒッチハイク・ガイド』をモデルにしたAIで、ほぼすべてのことに答えることを目的としており、質問すべきことを提案することさえできる」「ウィットに富んだ質問に答えるよう設計されており、反抗的な性格でもあるので、ユーモアが嫌いであれば使わないように」と説明している。 xAIは、全人類に利益をもたらすAIツールを構築するためにフィ

stealthinu 2023/11/06

Grokが短い学習時間で先行のLlama2とかに匹敵する以上の性能出せてる（と言ってる）のはこの一年の研究で学習コスト低減や性能出すためのの研究が大幅に進んだからだな。

リンク

無料で商用可、ChatGPT（3.5）に匹敵する生成AI「Llama 2」　Metaが発表、Microsoftと優先連携

米Metaは7月18日（現地時間）、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT（の3月1日版）と互角」（同社）という。ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習（ファインチューニング）したモデルを用意する。いずれも4096トークン（おおよそ単語数の意）まで文脈を読める。性能は、Llama-2-70b-chat（700億のチャット

stealthinu 2023/07/19

まさかこんなすぐに3.5並のモデルが商用化モデルでオープンになるとは… 予想以上に進化速度が速すぎるわ。

リンク

「Google Domains」提供終了へ　Squarespace社に事業売却

米Googleは6月15日（米国時間）、ドメイン登録サービス「Google Domains」の提供を終了すると発表した。事業を米Squarespaceに売却する。同社は約1000万個のドメインを含む関連の資産をGoogleから引き継ぐ。事業の譲渡により、Google Domainsのユーザーが直ちに対応を行う必要はないという。現地の規制当局から事業売却が承認され次第、ドメインや顧客の管理をSquarespace社に移転する。規制当局の承認は2023年後半に完了する見込み。 Google Domainsのヘルプサイトによれば、当面はGoogle Domains経由で引き続きドメインを管理できるが、移行期間を経てSquarespaceアカウントでの管理に移行することになる。Googleは「可能な限りシームレスに行えるようにする」としている。ドメインの更新価格について、Squarespace

stealthinu 2023/06/16

うーむ…　ほんとGoogleはこういうことやるよね。MSはそういう点はとても信頼できる。

リンク

「Apple Vision Pro」を先行体験！　かぶって分かった上質のデジタル体験

「Apple Vision Pro」を先行体験！　かぶって分かった上質のデジタル体験（1/3 ページ） Appleが「初の空間コンピュータ」として発表した「Vision Pro」。これをかぶって本体を右手でつかみ、人差し指がくる位置にあるデジタルクラウン（リュウズ）を押し込むと、目の前にiPhoneのホーム画面にあるようなアプリのアイコンが突然、現れる。どんなアイコンがあるのだろうと視線を動かすと、視線の先にあるアイコンが立体的に動いて反応する。起動したいアプリアイコンに視線を合わせた状態で、右手の親指と人差し指をくっつけると、アプリが起動する。話題のVision Proを一足早く、日本のメディア関係者としては1人だけ先行して体験する機会を得た。筆者がこれまでAR／VRのヘッドマウントディスプレイ（HMD）に対して懐疑的で「Appleには出してもらいたくない」と否定的なことばかりを書い

stealthinu 2023/06/07

よりARがメインなのだとわかるレビュー。蝶が指の先に止まるというデモがすごそう。VRは視線操作とジェスチャーへインターフェイスが代わっていくのだろうか。

VR
apple

リンク

OpenAI、テキストが人間によるものかどうか判定するツールを無料公開

「ChatGPT」などを手掛ける米AI研究企業OpenAIは1月31日（現地時間）、テキストが人間が書いたものかAIが書いたものかを判定するツールを無料公開した。英語で書かれたテキストでのテストでは、人が書いたテキストを誤ってAI生成テキストと判定したのは全体の9％だったという。同社は2019年にも同様の判定ツールを公開しているが、新ツールの信頼性は大幅に向上したとしている。不完全ながらもこのツールを公開したのは、フィードバックを得るため。フィードバックも反映させつつ、AI生成テキスト検出ツールの改善を続けていく。ツールはまだ不完全で制限事項も多く、OpenAIはこのツールを「主要な意思決定ツールとしてではなく、（AI生成かどうかを判定する）他の方法を補完するものとして」使うよう求めている。 1000文字以上ないと判定できない。また、英語以外の言語では精度が大幅に下がる。コード（プロ

stealthinu 2023/02/02

まあそうやって対策するよね。Googleは2023以降に新しく作られたコンテンツは自動生成かを判定するポイントも含めてランク付けするんだろう。

リンク

「フレッツ・ADSL」、あした原則終了　22年の歴史に幕

NTT東日本と西日本が2000年から提供してきたADSLサービス「フレッツ・ADSL」の提供を1月31日に終了する。当初は通信速度が下り1.5Mbps／上り512Kbpsと当時としては高速で常時接続できる画期的なサービスだった。 21年1月31日までにフレッツ光の提供を始めていたエリアでサービス終了とする。22年2月1日から23年1月31日までにフレッツ光の提供を始めたエリアでは25年1月31日まで提供を続ける。NTT地域会社は、契約終了時にISP（インターネットサービスプロバイダー）の解約手続きもしないと料金を請求され続ける可能性があるとして注意を呼びかけている。サービス終了は17年11月に告知済み。終了理由は、対応機器の部品の製造終了とユーザー減少としていた。関連記事「フレッツ・ADSL」申し込み受け付け終了「フレッツ・ADSL」の新規申し込み受け付けが来年6月末に終了。関連部

stealthinu 2023/01/31

フレッツADSLサービス開始からもう22年経ってたのか。地方ISPの仕事関わったのがちょうどその時期から。

リンク

人口1075人の村でも黒字を実現　セコマ会長が「過疎地への出店は福祉ではない」と語る理由

北海道には「奇跡のコンビニ」として知られる「セイコーマート初山別店」（北海道初山別村）がある。初山別村は人口1075人という小さな村だ。村の万屋（よろずや）的存在であった商店が閉店してから日々の買い物が困難になり、村長が自らセコマに直談判。「赤字覚悟」でなんとか開業に至った。そんなセイコーマート初山別店は、開業から8年を迎えた今、なんと黒字経営を続けているという。セコマの丸谷会長に、開業してから見えてきた店の面白い使われ方と、黒字化できた要因について聞いた。【お詫びと訂正：2022年12月28日午後1時00分　初出時「村唯一の商店」としていましたが、正しくは「村の中心部にあった唯一の商店」でした。お詫びして訂正いたします。】＜関連記事：「戦略がないのが戦略」　セコマ会長が語る、買い物難民を救った「初山別店」開業の背景＞

stealthinu 2022/12/27

『『戦略的に過疎地に出店して、どうやっていくつもり？』などとよく聞かれますが、どうしてこの人は分からないのだろう』

リンク

絵心がない線画を“いい感じの作品”に変える画像生成AI「Sketch-to-Image」　Googleなどが開発

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Google ResearchとイスラエルのTel Aviv Universityに所属する研究者らが発表した論文「Sketch-Guided Text-to-Image Diffusion Models」は、落書きのようにざっと描いた絵を入力テキストに従って詳細な画像を生成する深層学習モデルを提案した研究報告だ。手描きのスケッチを任意のテキストプロンプトによるスタイル制御で、自然な高精細画像に変換する。大規模なテキストから画像への拡散モデルは、与えられたテキストプロンプトに従った前例のない品質の多様な画像の合成を可能にし、コンテンツの作成と編集のための刺激的なツールとなってきた。しか

stealthinu 2022/12/02

今のプロンプトのみでやるものよりだいたいの構図を書いてプロンプトで指定する方法のほうが使いやすいシステムになりそうな気がする。

リンク

EvernoteをイタリアIT企業が買収　「製品は存続」

イタリアのミラノに拠点を置くIT企業Bending Spoonsは11月16日（現地時間）、“脳の拡張”を目指すオンラインメモサービス「Evernote」を手掛ける米Evernoteを買収することで合意したと発表した。買収総額などの詳細は公表されていない。取引は2023年初頭に完了する見込み。 Evernoteは公式ブログで、買収完了後も「ユーザーのデータを安全に保護するというわれわれの取り組みは揺るぎなく、Evernoteは今後も繁栄し続ける」としている。 Bending Spoonsは動画や画像の編集ツールを提供する企業で、約1億人のユーザーを擁する。同社のルカ・フェラーリCEOは発表文で、自社の独自技術をEvernoteに適用することで有用性を高め、リーチを強化すると語った。 Evernoteは2000年にステパン・パチコフ氏が立ち上げた。2007年にCEOに迎えられたフィル・リービ

stealthinu 2022/11/17

なんと！Evernote今後どうなるんだろう…　こういう買収でよくなったのってあんまり聞かないから。YouTubeとかInstaとかは良かったサービスだと思うけども。

webサービス

リンク

声を“匿名化”するシステム「V-CLOAK」　人間っぽさを残した声に変換、声紋の個人情報漏えいを防ぐ

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。中国のZhejiang UniversityとWuhan Universityの研究チームが発表した論文「V-CLOAK: Intelligibility-, Naturalness- & Timbre-Preserving Real-Time Voice Anonymization」は、音声の明瞭性と自然性、音色を保持したまま、リアルタイムに音声を匿名化するシステムを提案した研究報告だ。機械的な声ではなく人間っぽさを残した声に変換し、声紋から個人が特定されることを防ぐ。声紋は、個人を一意に特定できる重要なバイオメトリクスだ。一方でオンラインサービスによって膨大な音声データを収集・処理で

stealthinu 2022/11/04

VCを「匿名化」として使うわけか。その応用は思ってなかった。

リンク

画像生成AIが独自の“AI語”を生み出した？　「DALL-E 2」を巡って、米テキサス大学が論文発表

AIが人間の言葉ではない独自の言語を生成した──米テキサス大学オースティン校の研究チームは6月1日、そのような研究結果を示す論文を発表した。文章から画像を生成するAIが生み出す文字列は、意味不明なものであると思われていたが、それらの言葉は鳥や野菜などの意味を持つ“AI語”であったという。論文で取り上げられたのは、米AI研究企業OpenAIが開発した「DALL-E 2」。文章から画像を生成するAIとして開発され、22年4月に発表された。その生成した画像のクオリティーの高さに「最新のAIやばすぎる」「個展開ける」など、驚きの声が上がっていた。（関連記事：最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題　文章から画像を生成する「DALL・E 2」、米OpenAIが発表）一方「野菜と書かれた本がある」や「10カ国語で書かれた野菜という言葉」など、画像中に文言を入れるリクエストは苦手であると

stealthinu 2022/10/24

DALLE2が吐く意味不明っぽい文字列にはちゃんと与えたワードのベクトルが含まれててDALLE2内言語的なものになっているという研究の内容。

リンク

GTA新作リークに使われた“多要素認証疲れ”攻撃とは　1時間以上通知攻め、従業員の根負け狙う

GTA新作リークに使われた“多要素認証疲れ”攻撃とは　1時間以上通知攻め、従業員の根負け狙う：この頃、セキュリティ界隈で人気ゲーム「グランド・セフト・オート」（GTA）などを手掛けるゲームメーカーの米Rockstar Gamesや米Uber Techno logiesのネットワークが不正侵入を受け、情報が流出する事件が相次いだ。同じような被害は過去にMicrosoftやCisco、Twitterなどの大手でも発生している。各社とも、そうした侵入を防ぐために多要素認証を設定して従業員のアカウントを保護していたが、攻撃者は「MFA Fatigue（多要素認証疲れ）」攻撃と呼ばれる手口を使ってMFA（多要素認証）を突破していた。多要素認証で守られたアカウントは、ユーザー名とパスワードを入力してログインしようとすると、登録された端末に電話をかけたりプッシュ通知を送信したりする方法で、そのログイン

stealthinu 2022/09/28

大量に多要素認証を送らせるだけじゃなくてその後に社内IT担当者を装って認証承認させるように促してるのね。

security

リンク

デジタル庁が運用するメール中継サーバに不正アクセス　迷惑メール1万3000件送信

デジタル庁は9月26日、同庁が運用する事業者向け共通認証サービス「GビズID」のメール中継サーバーが不正アクセスを受け、「gbiz-id.go.jp」ドメインから迷惑メールが1万3000件送信される問題が発生したと発表した。 GビズIDヘルプデスクのメール中継サーバーが、海外からとみられる不正アクセスを受け、24日午後4時半から5時までに迷惑メールが送られたという。同庁は異常を検知してすぐ問題の通信を遮断し、被害の拡大を防いだとしている。個人情報の流出は確認していない。 GビズIDは、法人・個人事業主向け共通認証システム。IT導入補助金やe-Gov、ISMAPポータルサイトといった行政システムに、1つのID・パスワードでログインできる。関連記事 2日連続のe-Gov障害、原因は別だった　KILLNETの関与は“言及しない” 河野太郎デジタル大臣はe-Govで6日と7日に発生した接続障害

stealthinu 2022/09/27

オープンリレーになってたことを疑うコメントが多いが今どきオープンリレーになるとかある？？メールサーバ特殊なの使ってるのかなあ…　謎すぎる

リンク

「AI安倍晋三」ネットで物議　合成音声のYouTube動画、“東京大学AI研究会”が公開

Twitterアカウント（＠AIAbeShinzo）も開設しており、最初に投稿したツイートは26日正午時点で1万件以上リツイートされるなど関心を集めている。ユーザーからは「素晴らしい」や「ありがとう」など絶賛する声の他、「死者への冒涜ではないか」や「AIで美空ひばりの新曲作ったのと同じ感じがして複雑」など疑問を呈する声も見られる。「東京大学AI研究会」とは何者か？発起人である東京大学AI研究会のWebサイトによると、同研究会は東京大学教養学部・工学部有志と学生有志が2021年5月10日に設立。5月時点では「東大13名、京大10名、大阪大学6名、早稲田大学9名、慶応義塾大学1名、筑波大学1名、立命館大学3名」（原文ママ）の43人が在籍し、代表者は東京大学・教養学部・理科一類に所属しているという。目的は「飛躍的・未到達領域のAI開発」としており、最新の活動記録として4月に「SOTA（特定

stealthinu 2022/09/26

音声機械学習界隈で話題になってたのこれか…　これは確かに飛び火してきそうな話だ。なりすましと学習データに使うことは別の話だがそれでも叩かれそうだな。

リンク

5つの文字から1万4000文字を自動生成　筑波大発AIベンチャーがフォント生成システム　特許出願

筑波大学発AIスタートアップのAIdeaLab（東京都千代田区）は8月17日、5つの文字から1万4000以上の文字をAIで自動生成するフォント生成システムの特許を出願したと発表した。システムは、敵対生成ネットワーク（GAN）をベースに、大量のフォントを学習させた上で、手作業でデザインした数個の文字から、太さやセリフ（装飾）の形状を抽出し、生成する。パラメーターの値を調整することで、新しいフォントとして出力することも可能。ピクセル画像ではなく、ベクター画像として生成する独自技術により、フォントファイルとしての出力を可能にしたという。特許は、フォント生成モデルだけでなく、アプリケーションUIも含む。パラメーター調整でフォントを生成するUI、少ない文字数でのアップロードでフォントを生成するUIなど、さまざまなパターンのサービス展開を織り込んでおり、特許出願技術をベースに、フォント制作会社向け

stealthinu 2022/08/18

たった5文字から生成できるとは。ディープラーニングの応用、色々な分野で、分野を限ることで人間と同等に近い性能を出せるようになってきてる。

リンク

AIに思い通りの絵を描かせられるのは誰だ！　「Midjourney」指示力選手権

「Midjourney」というAIが今アツい。英文でお題を与えると、それに沿った画像を出力するAIだ。Twitterではさまざまなイラストが投稿され「触ってみたら本当にすごかった」「少し加筆するだけですごい絵ができる」といった反応がみられる。筆者もいろいろ試してみて感じたのだが、AIに思い通りのイラストを描いてもらうのは結構難しい。他のユーザーの作品を見ていると、上手な人は高画質で破綻を感じさせないハイクオリティーな画像を生成しているが、筆者は思い通りの図を出すのにも苦労している。 Midjourneyは、言葉（英語）で絵の内容を指定する。重要なのは“指示力”だ。適切な指示を出せば思い通りの画像が得られる。そこで、こんな企画を考えた。 AIに思い通りの絵を描かせられるのは誰だ！　「Midjourney」指示力選手権ルール説明選手権のルールは以下の通り。（1）AIに指示できるのは1人

stealthinu 2022/08/04

絵を描く技術は不要でも書いてもらうには美術や各種知識が求められるのだな。というか人間に発注する場合もそうなのだろう。

リンク

“まだ作成していないユーザーアカウント”を先回りして乗っ取る攻撃　米Microsoftなどが指摘

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。セキュリティ研究者Avinash Sudhodananさんと米Microsoft Security Response Centerの研究者が発表した「Pre-hijacked accounts: An Empirical Study of Security Failures in User Account Creation on the Web」は、まだ作成していないWebサービスのアカウントを乗っ取る攻撃をテストし脆弱性を示した論文だ。具体的に5種類の攻撃を提案し75のWebサイトで試したところ、35のサイトで乗っ取りに成功したという。その中には、ZoomやInstagram、Drop

stealthinu 2022/07/07

なるほど。最近は独自アカウントだけじゃなくGoogleアカウントとかのSSOも使えることが大半だから2つアカウントがあることを利用して片方を乗っ取ることが可能になるのね。

security

リンク

はてなブックマーク

タグ

ブックマーク / www.itmedia.co.jp (545)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス