並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 91件

新着順 人気順

テキストの検索結果1 - 40 件 / 91件

  • 【図解解説】これ1本でGitをマスターできるチュートリアル!【完全版】 - Qiita

    はじめに こんにちは、Watanabe Jin(@Sicut_study)です。 今回は記事1本で初心者が必要な知識を全て学べるGitチュートリアルを紹介していきます。 世の中にはたくさんのGitに関する教材があります。しかし、真に良いと思える教材はありません。 もちろん私も4年前はGitという言葉を知らない状態から、書籍などで学習をしました。 しかし、書籍で知識を得たとしても実際にコマンドを使って実践的に学んだわけではなかったのでほとんど身になりませんでした。 私が思う世の中にあるGitの教材のイケてない点は2つです。 結局ほとんどの人が、教材ではなく実際に使ってみて使えるようになっているはずです。 書籍でやったことを全部ちゃんとできるようになった人はいないと考えています。 実際に利用するコマンドは限られている、たまに使うコマンドを紹介しとしても「この記事1本」で説明することができると思

      【図解解説】これ1本でGitをマスターできるチュートリアル!【完全版】 - Qiita
    • 美しいQRコードを作成できる「qrframe」

      QRコードと言えば、黒と白のドットが無機質に並んだものというのが一般的なイメージとしてあります。このQRコードに色づけしたり形を変えたりして装飾できる「qrframe」というページが公開されていたので使ってみました。 qrframe.kylezhe.ng/ https://qrframe.kylezhe.ng/ 上記のURLにアクセスすると以下のような画面が現れます。 テキストボックスに何らかの文字列を入れるとすぐに対応するQRコードが生成されます。 下部にはQRコードの表示パターンのプリセットがいくつか用意されていて、選択するといろいろなデザインのQRコードを表示させることが可能。 デザインによってはQRコードには見えないものもありますが、ちゃんとQRコードとして認識することができます。 ページをスクロールするとカラーや表示パターンを自分で変更可能。 背景色を変更する「Backgroun

        美しいQRコードを作成できる「qrframe」
      • ボタンをaタグで作るな高校校歌 - 弁護士ドットコム株式会社 Creators’ blog

        まずはこちらをお聞きください。 技術的解説: ボタンを a 要素で作るな a 要素は URL などへのリンクをつくるためのもので、button 要素はなんらかの処理を起動するボタンをつくるためのものです。 配置されるものがリンクなら a 要素で実装し、ボタンなら button 要素で実装すべきです。 これに違反すると、意図しない動作や、アクセシビリティ上の問題が発生します。 これは MDN でも詳しく説明されています。 onclick イベント -- \<a>: アンカー要素 - HTML: ハイパーテキストマークアップ言語 | MDN よく見られる誤った使い方として、擬似的なボタンを作成するためにアンカー要素を使用し、href を # または javascript:void(0) に設定してページの再読み込みを防ぎ、click を待ち受けするようにするというものがあります。 これらの偽の

          ボタンをaタグで作るな高校校歌 - 弁護士ドットコム株式会社 Creators’ blog
        • Windowsのショートカットキー「Win+H」でタイピングを不要にする【今日のワークハック】 | ライフハッカー・ジャパン

          メール、企画書、プレゼン原稿、議事録など、ビジネスパーソンには、書く(入力する)仕事がたくさんありますね。 誰もが、「これをスピード・アップできたら」と思いながら、キーボード・マウスを買い替えたり、タイピングを練習したり、たくさん単語登録をしたりと努力しています。 そこで入力作業の速度を上げるために、何よりも決定打となる方法をお伝えします。 今日のワークハック:音声入力機能「Win+H」で文書作成を高速化するそれは音声入力。Windows OSのデフォルト機能ですぐに使える「Windowsキー+Hキー」です。 かつての音声認識精度の低さや、なんとなくの心理的抵抗感から、存在は知っていても利用していないスルーされがちな、音声入力「Win+H」のメリットを解説していきましょう。 「音声入力」は進化し実用できるレベルになったたしかに数年前までの音声入力の精度は、実用とは程遠くフラストレーションが

            Windowsのショートカットキー「Win+H」でタイピングを不要にする【今日のワークハック】 | ライフハッカー・ジャパン
          • Llama 3.2 の使い方|npaka

            以下の記事が面白かったので、簡単にまとめました。 ・Llama can now see and run on your device - welcome Llama 3.2 1. Llama 3.2 Vision 11B・90B1-1. Llama 3.2 Vision 11B・90B「Llama 3.2 Vision 11B・90B」は、Metaがリリースした最も強力なオープンマルチモーダルモデルです。画像+テキストのプロンプトでは英語のみ、テキストのみのプロンプトでは英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語をサポートしています。 コンテキスト長は128kトークンで、画像を含む可能性のある複数ターンの会話が可能です。ただし、モデルは単一の画像に注目する場合に最適に機能するため、transformers実装では入力で提供された最後の画像のみに注

              Llama 3.2 の使い方|npaka
            • トランスフォーマーは RNN である - ジョイジョイジョイ

              拙著『深層ニューラルネットワークの高速化』が重版して第 2 刷となりました。皆さまありがとうございます! 深層ニューラルネットワークの高速化 (ML Systems) 作者:佐藤 竜馬技術評論社Amazon もはや恒例、重版に感謝して書き下ろし専門記事をお届けします。 本稿では、SNS などでもたびたび話題になるトランスフォーマーは RNN であるという話をします。本稿では単に形式的に包含性を指摘するだけでなく、トランスフォーマーと RNN はどの程度似ているのかや、そこから導かれる応用上の意味についても詳しくご紹介します。 本稿は『深層ニューラルネットワークの高速化』の第 6.3 節と第 7.2 節に基づいています。 過去回 拡散モデルと最適輸送(最適輸送第 5 刷) GNN の最新動向(グラフニューラルネットワーク第 3 刷) 深層学習で部分空間を扱うときは射影行列を考えるとよい(グラ

                トランスフォーマーは RNN である - ジョイジョイジョイ
              • 「誰もいなくなった東京」を舞台に行方不明の親友を探すゲーム『Tokyo Stories』は、なぜ注目を集めるのか。「現代ピクセルアート」「ローファイヒップホップ」を紐解いて見える、コロナ禍以降の普遍性【TGS2024】

                「欠落した情報」が高める喪失への関心。「失われたもの」に想いを馳せるアドベンチャーゲーム本作の最大の特徴は、なんといっても情緒溢れるアートワークだろう。 技法としては3DCGのモデルをシェーダの処理によりピクセルアート風に描画する形式となっており、ピクセルアートならではの少しザラついた質感と、3DCGの立体的な陰影が融合したタッチが印象的だ。 舞台となる世界は紛れもなく東京であるのだが、具体的な特定のロケーションを参照していないが故に、見覚えがあるのにどこか現実感が無い。 また、低解像度であるが故に抽象度が増幅し、作中では徹底して「思い出の中の景色」に似た朧げで儚い光景が提示される。 つまり、本作のアートワークは、緻密に施された情報の欠落によって鑑賞者へ「失われた情報を想像する」ことを喚起させる。 ここにある感覚はノスタルジーに近いものの、ただ低解像度であるが故に立ち上がる「レトロ感」では

                  「誰もいなくなった東京」を舞台に行方不明の親友を探すゲーム『Tokyo Stories』は、なぜ注目を集めるのか。「現代ピクセルアート」「ローファイヒップホップ」を紐解いて見える、コロナ禍以降の普遍性【TGS2024】
                • OpenAI の Realtime API の使い方|npaka

                  以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延のマルチモーダル会話エクスペリエンスを構築できるAPIです。現在、入力と出力の両方でテキストと音声がサポートされており、「Function Calling」もサポートされています。 特徴は次のとおりです。 ・ネイティブ音声合成 テキストの仲介がないため、低遅延で、ニュアンスに富んだ出力が得られる ・自然で操作可能な音声 モデルは自然な抑揚を持ち、笑ったり、ささやいたり、トーンの方向に従うことができる ・同時マルチモーダル出力 テキストはモデレーションに役立ち、リアルタイムよりも高速なオーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、サーバー上で実行するように設計された WebSocket インタフェー

                    OpenAI の Realtime API の使い方|npaka
                  • Google Docsでイベント配布用冊子の組版データを作成する技術 - KAKEHASHI Tech Blog

                    技術広報の941です。カケハシはPyCon JP 2024にスポンサーをし、ブースにて「カケハシ式、チャートでわかるふりかえりの技法」という冊子を作成し配布しました。普段はデータばかりを取り扱っているので、本というリアル媒体に関わることが少ないためなかなか苦労しました。 実際に配布した冊子 この記事では、イベントで配布するための冊子を印刷するためのデータ(組版といいます)を、Google Docsで作成する際に気をつけるべきポイントについて共有したいと思います。 この記事は秋の技術特集 2024の19記事目です。 組版とは Google Docsで作成するメリット Google Docsで作った組版データでハマりやすいポイント 入稿時に気をつけたいポイント 組版とは 文字や画像や表などの要素を配置して、読みやすく視覚的に効果的なデザインに仕上げる技術やプロセスのことを組版といいます。主に印

                      Google Docsでイベント配布用冊子の組版データを作成する技術 - KAKEHASHI Tech Blog
                    • Googleの自分専用AI作成サービス「NotebookLM」で学習データにYouTubeの動画を指定可能に

                      GoogleのカスタムAI作成サービス「NotebookLM」に、YouTubeのURLや音声ファイルを追加できる機能が搭載されました。これにより、YouTubeや音声ファイルの情報に基づいて質問に答えたり要約したりできるAIを作成できるようになります。 NotebookLM adds audio and YouTube support, plus easier sharing of Audio Overviews https://blog.google/technology/ai/notebooklm-audio-video-sources/ NotebookLMは自分専用のAIアシスタントを作成できるサービスで、参考情報としてテキストファイルやPDFファイルなどをアップロードすると、アップデートしたファイルの内容を把握して要約したり質問に答えたりしてくれます。 無料で自分専用のAIを日

                        Googleの自分専用AI作成サービス「NotebookLM」で学習データにYouTubeの動画を指定可能に
                      • 生成AIを活用したシステム開発の現状と展望

                        Copyright (c) The Japan Research Institute, Limited 生成AIを活用したシステム開発 の現状と展望 - 生成AI時代を見据えたシステム開発に向けて - 株式会社日本総合研究所 先端技術ラボ 2024年09月30日 <本資料に関するお問い合わせ> 伊藤蓮(ito.ren@jri.co.jp) 近藤浩史(kondo.hirofumi@jri.co.jp) 本資料は、作成日時点で弊社が一般に信頼できると思われる資料に基づいて作成されたものですが、情報の正確性・完全性を弊社で保証するもので はありません。また、本資料の情報の内容は、経済情勢等の変化により変更されることがありますので、ご了承ください。本資料の情報に起因して閲覧者 及び第三者に損害が発生した場合でも、執筆者、執筆取材先及び弊社は一切責任を負わないものとします。本資料の著作権は株式会社日

                        • ミーティングで意見を言えない時のTips - Konifar's ZATSU

                          ミーティング中にうまく意見を言えないという相談を受けた。めちゃくちゃわかる。自分は開発関連のミーティングではそういう悩みは少なくなったけれど、経営関連のミーティングでは今でも歯がゆく悔しい思いをすることが多い。 相談された時にはうまく答えられなかったので、雑に自分がやっていることを書き出してみる。必要な役割としてミーティングに入っているというのを前提として、そもそものミーティングの必要性や参加者の要否についてはここでは対象外とする。 1. 事前に予習する 意見を言えないのは、その場で理解できなかったり考えがまとまらなかったりするから 事前にアジェンダが用意されていたら読み、関連ドキュメントがあればそれも目を通しておくなどできるかぎり事前準備をしておく わからないところや聞いておきたいことがあればコメントしたり頭出ししたりしておくとよい 2. 話を振ってもらう 意見を言えないのは、発言するタ

                            ミーティングで意見を言えない時のTips - Konifar's ZATSU
                          • 「推し」で心は満たされるのか。心理学の専門家と探る、推し活の“本質” #ソレドコ - ソレドコ

                            アイドルや二次元キャラクターなどを応援する「推し活」。その最中、私たちは強い幸福感や充実感を覚えます。一方で、推しがいるからこそ悩んだり不安になったりすることもあります。推しという存在は、私たちの心にどのような影響を与えるものなのでしょうか。 そこで今回は、心理学の領域で推し活を研究されている、人間環境大学の二宮有輝さんに、推しと心の関係についてお伺いしました! お話を聞いた人:二宮有輝さん 臨床心理士・公認心理師。名古屋大学博士(心理学)。学生相談や児童精神科、公立中学校の常勤スクールカウンセラーでの勤務を経て現職。児童青年期のwell-beingを中心に、心理的援助に幅広く関心を持っている。 HP:人間環境大学 二宮研究室 Webサイト 推し活は「心の問題」に向き合う糸口になることもある ――今日はよろしくお願いいたします。まず二宮先生の研究分野について、簡単に教えていただけますか?

                              「推し」で心は満たされるのか。心理学の専門家と探る、推し活の“本質” #ソレドコ - ソレドコ
                            • React useで非同期処理を簡単に扱う | stin's Blog

                              先日 続・URLシェアを支える技術 CompressionStream という記事をZennに投稿しました。 この記事のためにlz-stringとCompressionStreamの圧縮率を比較できるサイト(以下比較サイト)をVite+Reactで作りました。 このサイトでは、入力してもらったテキストをURLに反映して、入力状態をそのままシェアできる機能を実装しています。TypeScript PlaygroundやReact Compiler Playgroundのような感じです。 例えば次のようなURLをシェアすることができます。 https://stinbox.github.io/lz-string-vs-compression-stream?source=eJx73Nj0uHHV48b5jxvXKxSXZObpJuXkpys8blz3uHnV4-bNj5vWP26a9GJH_-Omy

                                React useで非同期処理を簡単に扱う | stin's Blog
                              • 売れるECサイトのデザインとは?5つのポイントと参考事例 | ヤマト運輸

                                ECサイトを制作するとき、レイアウトやデザインに迷うことがありませんか?売れるECサイトのデザイン方法を取り入れて、他社にデザインで差をつけましょう。購入者の目線でECサイトをデザインするコツや、人気サイトが実践しているポイントもわかりやすくご紹介します。 「売れるデザイン」の本質 世の中には、デザインは普通に見えるのによく売れるECサイトがある一方で、デザインがとても綺麗なのに全く売れないECサイトが存在します。つまり、ECサイトの見た目の印象と売上は、必ずしも比例しません。その理由は、どこにあるのでしょうか? 結論から言うと、売れるECサイトが実践している「売れるデザイン」には、サイトの美しさやかっこよさといった「印象をつくるデザイン」だけではなく、「良い購入体験をつくるデザイン」が含まれています。後者のデザインは、サイトを訪れたユーザの行動(見る・クリック・購入など)を促すことができ

                                  売れるECサイトのデザインとは?5つのポイントと参考事例 | ヤマト運輸
                                • Notebook LMを活用して音声配信をもっと楽しむ方法

                                  NotebookLM NotebookLMはGoogleが提供している生成AIを活用したサービスです。なんと(2024年10月現在は)無料で使えます。 NotebookLMは、Googleの生成AI Geminiのロングコンテキスト(多くの量のプロンプトを扱うことができるという意味)の特徴を活かした、文章の要約やQA対応が得意です。文章は、直接プロンプトに入れている(と思われる)ので、単なるRAGとは違う(と思われ)ます。 RAGとロングコンテキストのどっちが良いのかというのは、色々議論があるようです。例えばLost in the Middle: How Language Models Use Long Contextsという論文では「ロングコンテキストの真ん中の情報は失われるよ」みたいなことが書いてありますがRetrieval Augmented Generation or Long-C

                                    Notebook LMを活用して音声配信をもっと楽しむ方法
                                  • Office 2024の買い切り版がついに日本でも登場、2021以来久々の更新

                                    Microsoftがオフィススイート「Office 2024」の永続版を2024年10月1日(火)にWindowsとmacOS向けにリリースし、日本版も2024年10月2日から提供されました。一度購入すれば永年で使用可能なライセンスで、月額有料のサブスクリプションに登録する必要はありません。 10 月 1 日にコンシューマ向け Office 2024 提供開始 - Windows Blog for Japan https://blogs.windows.com/japan/2024/10/01/office-2024-for-consumers-available-october-1/ これまでMicrosoftのOffice製品ラインを利用するには、一般向けの場合はMicrosoft 365に、法人向けの場合はMicrosoft 365 BusinessやMicrosoft 365 En

                                      Office 2024の買い切り版がついに日本でも登場、2021以来久々の更新
                                    • 文章から資料や図、フローチャートを自動生成する「Napkin AI」 日本語にも対応、開発の背景とは?

                                      文章から資料や図、フローチャートを自動生成する「Napkin AI」 日本語にも対応、開発の背景とは?:β期間中は「Professional」プランも無料で利用できる 米国スタートアップ企業のNapkin AIは、テキストを分かりやすいビジュアルに変換するAIツール「Napkin AI」について、日本語など複数言語に対応したと発表した。

                                        文章から資料や図、フローチャートを自動生成する「Napkin AI」 日本語にも対応、開発の背景とは?
                                      • OpenAIのGPT-4oに「画像でファインチューニングする機能」が追加される、わずか100枚の画像でタスクの性能が向上

                                        OpenAIが2024年5月にリリースしたAIモデル「GPT-4o」に、2024年10月1日から「画像でファインチューニングする機能」が追加されました。すでにテキストでGPT-4oをファインチューニングする機能は提供されていましたが、画像でのファインチューニングが可能になったことで、視覚検索やオブジェクト検出などの機能を向上させることができます。 🖼 We’re adding support for vision fine-tuning. You can now fine-tune GPT-4o with images, in addition to text. Free training till October 31, up to 1M tokens a day. https://t.co/Nqi7DYYiNC pic.twitter.com/g8N68EIOTi— OpenAI D

                                          OpenAIのGPT-4oに「画像でファインチューニングする機能」が追加される、わずか100枚の画像でタスクの性能が向上
                                        • 今から始める「Dead Cells」。「ローグヴァニア」というジャンルを切り拓き,ついに完成形を見た名作の初心者向けガイド

                                          今から始める「Dead Cells」。「ローグヴァニア」というジャンルを切り拓き,ついに完成形を見た名作の初心者向けガイド ライター:箭本進一 2017年にリリースされた「Dead Cells」(PC / PS4 / Xbox One / Nintendo Switch / iOS / Android)は,手ざわりのよいアクションや,さまざまな仕掛けが施されたメトロイドヴァニア風のマップ,プレイする度に展開が変わるローグライク要素が組み合わされた「ローグヴァニア」として高い評価を得た。 以降も大ボリュームのアップデートやDLCが次々と配信され,プレイヤーを楽しませてきたが,その歴史も先日の最終アップデート「The End is Near」で最後となった。言い方を変えれば,完成形を見たといっていいだろう。 関連記事 「Dead Cells」,最終アップデートとなる「The End is Ne

                                            今から始める「Dead Cells」。「ローグヴァニア」というジャンルを切り拓き,ついに完成形を見た名作の初心者向けガイド
                                          • Dialog と Popover #3 | blog.jxck.io

                                            Intro 前回までは <dialog> が標準化されるまでの経緯と、 API の概要や関連仕様を解説した。 今回は <dialog> の API としての使い方について、具体的に解説していく。 各要素の使用 open 属性 <dialog> は、デフォルトでは不可視(display: none)な要素となっている。 open 属性が付くと表示される。 <dialog open> <div> <h1>Hello Dialog</h1> </div> </dialog> show()/showModal() しかし、基本的に <dialog> は動的に出てくるため、JS で開くことになるだろう。しかし、 open 属性を動的に付けるのではなく、 show()/showModal() を用いるのが基本だ。 document.querySelector("button.show").addEve

                                              Dialog と Popover #3 | blog.jxck.io
                                            • React Compilerについて理解する | POSTD

                                              Reactのコアアーキテクチャは、与えられた関数(すなわちコンポーネント)を繰り返し呼び出します。この仕組みはReactのメンタルモデルを単純化し、その人気に一役を買いましたが、同時にパフォーマンスの問題が生じる原因にもなりました。関数のパフォーマンスコストが高いと、アプリの動作は総じて遅くなります。 開発者はReactにどの関数をいつ再実行するか手動で指示しなくてはならなかったため、パフォーマンスチューニングが悩みの種になっていました。Reactチームが最近リリースしたReact Compilerというツールは、コードを書き直すことにより、開発者が手動で行っていたパフォーマンスチューニングの作業を自動化します。 React Compilerはコードに何をするのでしょうか?裏ではどのような処理が行われるのでしょうか?使った方がいいのでしょうか?こうした疑問について詳しく見ていきたいと思いま

                                                React Compilerについて理解する | POSTD
                                              • LLMの日本語化はベクトル表現にも有効か?LLM2Vecにおける日本語ドメイン適応の効果 - Uzabase for Engineers

                                                はじめに こんにちは! 株式会社ユーザベース スピーダ事業部の飯田です。 この記事では、テキストをベクトルに変換(エンコード)にLLMを用いる際に有効なLLM2Vecという手法を紹介します。 合わせて、LLM2Vecにおける日本語ドメイン適応として、LLM2Vecの処理を日本語で行った場合とLLMの継続事前学習を日本語で行った場合について実験を行ったため、これを紹介します。 LLM2Vecとは LLM2Vecは、"LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders"で提案された手法です。 Llamaなどで有名なLLMでは、テキストをベクトルにエンコードする際は、入力したテキストの末尾のベクトルを用いることが多いです。 これは、LLMがテキストの次の単語を予測することで事前学習を行っていることに関連があります。

                                                  LLMの日本語化はベクトル表現にも有効か?LLM2Vecにおける日本語ドメイン適応の効果 - Uzabase for Engineers
                                                • Microsoft、「Copilot+ PC」と「Windows 11」のAI機能を大量に発表

                                                  米Microsoftは10月1日(現地時間)、「Copilot+ PC」と「Windows 11」に搭載する新たなAI機能を複数発表した。Copilot関連とWindows 11に分けて紹介する。 Copilotの新機能 Copilotは、「すべてのユーザーのためのAIコンパニオン」。Microsoftは、「ユーザーの許可があれば、ユーザーの代わりに人生の複雑さを軽減し、ユーザーが重要なことに集中するための時間を増やすことを支援する」としている。 OpenAIの「高度な音声モード」のような「Copilot Voice」 「Copilot Voice」は、米OpenAIのChatGPT向け「Advanced Voice Mode」(高度な音声モード)と似た音声機能。モバイルアプリとして、音声で会話しながらブレインストーミングや日常会話を行える。4種類の音声から選択可能。会話を繰り返すことで、

                                                    Microsoft、「Copilot+ PC」と「Windows 11」のAI機能を大量に発表
                                                  • 生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる - 渋谷駅前で働くデータサイエンティストのブログ

                                                    先日こんなことを放言したら、思いの外結構伸びてしまったのでした。 「生成AIが博士号レベルの高度な課題解決や推論が出来る」ようになったら、その出力が正しいかどうかを判定できるのは同レベルの専門人材だけなので、そういう人材の需要が逆に高まる気がしている。それはプロの研究者が論文中で捏造や改竄をしても、プロの研究者でないと見破りづらいのと同じかと— TJO (@TJO_datasci) 2024年9月19日 ということで、今回も相変わらずネタ切れでブログに書くことがないので完全に与太記事ですが「生成AI(というかLLM)の推論がどんどん高度になることで逆にユーザーの側に高度なスキルが必要になる」とはどういうことかを、簡単なケーススタディと共に何となく書き綴ってみようと思います。 正解を知った上で生成AIに推論させるケース 正解がいまいち分からない中で生成AIに推論させるケース 生成AIの推論が

                                                      生成AIの推論が高度になればなるほど、使う人間の側にも高度な知識が求められる - 渋谷駅前で働くデータサイエンティストのブログ
                                                    • ローカルで動作するスマホ向けAI「Gemini Nano」を開発者が自分のアプリに組み込めるように

                                                      GoogleのAI「Gemini」ファミリーのスマートフォン向けモデル「Gemini Nano」について、開発者がアプリに組み込むことが可能になったと発表されました。これにより、各アプリでユーザーデータを外部に送信することなくローカルでAIを利用できるようになります。 Android Developers Blog: Gemini Nano is now available on Android via experimental access https://android-developers.googleblog.com/2024/10/gemini-nano-experimental-access-available-on-android.html Android Developers Blog: An introduction to privacy and safety for G

                                                        ローカルで動作するスマホ向けAI「Gemini Nano」を開発者が自分のアプリに組み込めるように
                                                      • 菊地成孔 × 福尾匠「音楽と哲学の憂鬱と官能」対談 音楽と哲学それぞれの“引用”について

                                                        哲学研究者・福尾匠氏と音楽家・菊地成孔氏の対談イベント「音楽と哲学の憂鬱と官能」が8月9日にジュンク堂書店池袋本店で開催された。 福尾氏が博士論文を元に刊行した新刊『非美学 ジル・ドゥルーズの言葉と物』は、哲学と芸術の関係を論じたドゥルーズ論=批評論。一方、対談本『たのしむ知識 菊地成孔と大谷能生の雑な教養』(毎日新聞出版刊)を刊行した菊地氏は、これまでに映画、文芸、精神分析など幅広い領域をジャンル横断的に論じてきた。音楽活動においては、レヴィ=ストロース、スーザン・ソンタグ、浅田彰などの思想家の言葉を引用したタイトルの作品を発表している。 二人は今回が初めての対面とのこと。体調を崩してしまったという菊地氏は遅れて登場したため、壇上で初めて言葉を交わすことに。福尾氏の新刊の話題を起点に、哲学者と芸術家の関係性について語り合った。(篠原諄也) 左、菊地成孔。右、福尾匠。 菊地:このたびはあり

                                                          菊地成孔 × 福尾匠「音楽と哲学の憂鬱と官能」対談 音楽と哲学それぞれの“引用”について
                                                        • Llama3.2 をローカルで動かしてみる - Qiita

                                                          やりたいこと Meta 社から Llama3.2 が発表されました。軽量なモデルである Llama 3.2 1B および 3B とマルチモーダルモデルである Llama 3.2 11B および 90B です。 先日、OSS なモデルをローカルで動かす方法 (以下の記事) を試したので、今回の Llama3.2 も試してみようと思います。 どんなモデル? 以下の記事によると、1B・3B はエッジやモバイルデバイス向けテキストモデル、11B・90B は小中規模のビジョンモデルだそう。 1B・3B 128K トークンのコンテキスト長をサポート 多言語テキスト生成とツール呼び出し機能に非常に優れている (らしい) 11B・90B マルチモーダルモデル Claude 3 Haiku などと比較して画像理解タスクで優れている (らしい) 動かす

                                                            Llama3.2 をローカルで動かしてみる - Qiita
                                                          • OpenAIが「ChatGPTのリアルタイム会話機能をアプリに組み込めるAPI」をリリース

                                                            OpenAIが2024年10月1日に、すべての開発者がアプリ内で低遅延のマルチモーダルエクスペリエンスを構築できるようにする「Realtime API」のパブリックベータ版の提供を開始しました。これにより、さまざまなアプリでAIとのリアルタイムな会話が可能になります。 Introducing the Realtime API | OpenAI https://openai.com/index/introducing-the-realtime-api/ ????️ Introducing the Realtime API—build speech-to-speech experiences into your applications. Like ChatGPT’s Advanced Voice, but for your own app. Rolling out in beta for d

                                                              OpenAIが「ChatGPTのリアルタイム会話機能をアプリに組み込めるAPI」をリリース
                                                            • 人気ゲーム開発者が、新作開発でやらかした“痛恨のしくじり”を詳しく打ち明ける。計画に反し「約6年・開発費約3000万円」もかかったのはなぜか - AUTOMATON

                                                              人気ゲーム『Tangledeep』を手がけた開発者が、新作発売までの6年間を振り返って“しくじり”をつまびらかに語っている。予想外の開発費・開発期間肥大化を招いたのは、「グラフィックスタイルの選択ミス」「ジャンル設定のミス」など複数の理由だったとのこと。 今回ゲーム開発中のあやまちについて語ったのは、インディースタジオ・Impact Gameworksの設立者であるAndrew Aversa(通称Zircon)氏だ。同氏が手がけた『Tangledeep』は、Steamにて約半年間の早期アクセス期間を経て正式リリース。PS4/Nintendo Switch向けにも展開され、日本国内プレイヤー含め人気を博した(関連記事)。同作は全プラットフォーム累計で25万本以上を売り上げるヒットとなったそうだ。 『Tangledeep』 そしてImpact Gameworksは、今年9月26日には新作『Fl

                                                                人気ゲーム開発者が、新作開発でやらかした“痛恨のしくじり”を詳しく打ち明ける。計画に反し「約6年・開発費約3000万円」もかかったのはなぜか - AUTOMATON
                                                              • SaaSの急増で危惧される、転職先への情報漏えい--ジョーシス

                                                                印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます ジョーシスは、SaaS管理リスクの実態をテーマとしたプレス向け説明会を開催した。 シニアエコノミストの川端隆史氏は、2018年ごろに話題になった「2025年の崖」を振り返り、そこから6年が経過した現在も「一部企業を除き、効果的な対処はできていない」と指摘した。同氏は「DX」と言いながら実際には「デジタイゼーション」(アナログデータをデジタルデータに変換するプロセス)や「デジタライゼーション」(デジタル技術を活用したビジネスプロセスの改善・効率化)といった段階にとどまっている例が多く、その先にある「本来のDX」(企業の在り方を根本的に改革するコーポレートトランスフォーメーション)にまで至っていないことが多いと指摘した。 最近大きく報道され

                                                                  SaaSの急増で危惧される、転職先への情報漏えい--ジョーシス
                                                                • 昭和最後のインディーゲーム編集者:アナクロ雄弁家斉藤大地がみせる“Legitimacyの極致" 中山淳雄の「推しもオタクもグローバル」第104回 | gamebiz

                                                                  昭和最後のインディーゲーム編集者:アナクロ雄弁家斉藤大地がみせる“Legitimacyの極致" 中山淳雄の「推しもオタクもグローバル」第104回 本当にここは令和だろうか。昭和62年生まれの斉藤大地氏と話していると、いまも昭和99年は終わっていないと思えてくるほど、戦後日本の教養主義を背負い、その高い知性と誇りある社会意識のままに令和におりたったかのよう。そんなエリートが「ガチでゲームをつくってみた」とでもいうかのように教養とサブカルの結節点へ挑戦し、実際に世界で170万本を超える大ヒットゲームを作ってしまった。彼の人生を見るに、生きるとはそのままアートであり、誰かと出会い、対話の末に作品を残すことは、ジャンルを問わず「編集」なのだろう。元来編集者とはこういうものだったのではないか、という気持ちにさせられた。何十億とかけた巨大なゲームにも世界的にヒットするIPにも興味なく、目の前に天才か狂

                                                                    昭和最後のインディーゲーム編集者:アナクロ雄弁家斉藤大地がみせる“Legitimacyの極致" 中山淳雄の「推しもオタクもグローバル」第104回 | gamebiz
                                                                  • 生成AIを導入しても“社員が使わない” 「生成AIプロンプト道場」の奮闘

                                                                    生成AIを活用する企業が増えている。デロイトトーマツグループの調査によれば、プライム企業の9割弱が生成AIを導入済みだという。だが導入したはいいものの、実際に「活用」できているかを見ていくと、話は変わってくる。DX推進企業のテックタッチの調べによれば、生成AIを活用している1000人以上の大企業のうち、職場で生成AIを活用できているのは約1割という結果に。 大企業を中心にこうした課題を抱える企業が少なくない中、独自の社内プロモーションによって生成AIの利用者を伸ばしたのが、資産運用会社のアセットマネジメントOneだ。同社では、2割台で横ばいが続いていた社内生成AI利用率が、8月末に41%に上昇したという。 どのような取り組みによって利用率を伸ばせたのか。生成AIをいかにして社内活用しているのか。同社DX推進グループマネージャーの立花慶寛さんが、ソフトバンク主催の「生成AIユーザーコミュニテ

                                                                      生成AIを導入しても“社員が使わない” 「生成AIプロンプト道場」の奮闘
                                                                    • Microsoftが「Copilotと音声会話する機能」「画像を8倍にアップスケールする機能」「PCで操作中の内容を自動認識して次の操作を提案する機能」などのAI機能を大量に発表

                                                                      2024年10月1日(火)にMicrosoftが「Copilot+ PC」「Copilot」「Bing」向けのAI機能を大量に発表しました。発表された機能には「画像を8倍にアップスケールする機能」「Copilotと音声会話する機能」などが含まれています。 An AI companion for everyone - The Official Microsoft Blog https://blogs.microsoft.com/blog/2024/10/01/an-ai-companion-for-everyone/ New experiences coming to Copilot+ PCs and Windows 11 | Windows Experience Blog https://blogs.windows.com/windowsexperience/2024/10/01/new-

                                                                        Microsoftが「Copilotと音声会話する機能」「画像を8倍にアップスケールする機能」「PCで操作中の内容を自動認識して次の操作を提案する機能」などのAI機能を大量に発表
                                                                      • 電話自動応答システムのQAのための自動応答システムを作った話

                                                                        はじめに こんにちは。電話AI SaaS IVRyのAIエンジニアの町田です。 IVRyは従来のプッシュ型の自動応答システムに留まらず、LLMを積極的に活用したAI音声対話システムを開発しています。2023年初頭にAI対話システムの開発を開始してから1年半、多くの企業に実際に導入され、ほぼ毎週新機能や改善のリリースを行うまでに成長しました。 しかし、実際の音声対話をベースとしたAI電話アプリケーションの開発は、従来のWebアプリケーション開発とは異なる独自の課題を抱えています。毎週の新機能や改修を安定的にリリースすることは、決して容易なタスクではありません。 本記事では、高速かつ安全なリリースを実現するためのQAの工夫についてご紹介します。 QAの重要性 プロダクト開発において、品質保証(QA)プロセスは極めて重要な役割を果たします。特に、高速なリリースサイクルを目指すソフトウェア開発にお

                                                                          電話自動応答システムのQAのための自動応答システムを作った話
                                                                        • いよいよ帰ります!5年ぶりの日本への帰国を前にチェンマイで帰国準備中! - happykanapyのCebuライフ

                                                                          サワディかなぴー(^O^) 昨日の記事のブックマーク、スターありがとうございます。 家系金融の企画立案者さん、かなぴーは15㎝くらいですね~たまに友達が登場します。 さて、いよいよ今日の深夜バンコク発のAir Japanで日本に帰国します。 約5年ぶりの帰国になりますΣ(・ω・ノ)ノ! 今回は約1カ月程度の滞在予定です。 今取得しているビザの有効期限前にチェンマイに戻り、ビザの延長手続きをしなければならないため長くは滞在できません。 昨日から帰国の準備を始めています。 と言っても、今回は本帰国をするわけではないのでそんなに準備をすることはないんですけどね。 チェンマイにいるけど既に日本 チェンマイの渋谷Think Parkを通って学校に行きます。 来月からレベル5のオンラインレッスンが始まる予定なので、テキストを受け取りに行きました。 おニューのテキスト(∩´∀`)∩ 2から始めて5まで来

                                                                            いよいよ帰ります!5年ぶりの日本への帰国を前にチェンマイで帰国準備中! - happykanapyのCebuライフ
                                                                          • OSSのアノテーションツールLabel Studioにコントリビュートした話 - ANDPAD Tech Blog

                                                                            はじめに こんにちは。データ部ML Product Devチームに所属している谷澤です。 ML Product Devチームは「機械学習を活用した競合優位性のあるプロダクト開発」をミッションとし、プロダクト開発チームと協力して日々開発を行っています。 現在参加しているプロジェクトではOCR技術を使用しており、アノテーションにはOSSのLabel Studioを利用しています。中でも機械学習モデルの推論結果を用いてアノテーションを支援する機能が非常に便利で重宝していましたが、特定の画像群で支援機能が働かないという不具合が発生しました。この不具合によってアノテーションの効率が落ちていたため、原因の調査と修正を行うことにしました。 今回のブログでは、どのようにしてこの不具合を修正し、Label Studioのリポジトリにコントリビュートしたかを共有します。 Label Studioのアノテーショ

                                                                              OSSのアノテーションツールLabel Studioにコントリビュートした話 - ANDPAD Tech Blog
                                                                            • MITからスピンオフした「Liquid AI」が非トランスフォーマーAIモデル「LFM 1B・3B・40B MoE」をリリース

                                                                              OpenAIのChatGPTの正式名称「Chat Generative Pre-trained Transformer」にTransformer(トランスフォーマー)という言葉が使われているとおり、記事作成時点でメジャーなAIモデルの多くはGoogleが発表した深層学習モデルであるトランスフォーマーを使用したものです。トランスフォーマーを使わずにGPTを超える基礎モデルを構築することを目標に掲げるAI企業のLiquid AIが、メモリー・フットプリントを最小限に抑えつつ優れたパフォーマンスを示すLiquid Foundation Models(LFM)の最初のシリーズを発表しました。 Liquid Foundation Models: Our First Series of Generative AI Models https://www.liquid.ai/liquid-foundati

                                                                                MITからスピンオフした「Liquid AI」が非トランスフォーマーAIモデル「LFM 1B・3B・40B MoE」をリリース
                                                                              • Googleの「NotebookLM」、YouTube動画の概要生成も可能に

                                                                                米Googleは9月26日(現地時間)、「Gemini 1.5 Pro」搭載のメモアプリ「NotebookLM」のソース(情報源)として、YouTubeのURLとオーディオファイル(MP3、WAVなど)を追加できるようにしたと発表した。 NotebookLMは、ユーザーが選択したソースだけに基づいて、事実の要約、複雑なアイデアの説明、新しいつながりのブレインストーミングを行うことができる「仮想リサーチアシスタント」。日本でも日本語で利用できる。 これまで、ソースとしてGoogleドライブ、PDF、テキストファイル、コピーされたテキスト、Webサイト(URL)を追加できた。 ソースを選択する画面にYouTubeのリンクとAudio(e.g. mp3)が表示されるようになった。 YouTube動画からインポートされるのは、文字起こしのみ。音声のない動画は対象外だ。文字起こしが50万語未満であれ

                                                                                  Googleの「NotebookLM」、YouTube動画の概要生成も可能に
                                                                                • リリース延期になったWindowsのPC操作履歴検索AI「Recall」に施されたセキュリティ対策の詳細が明らかに

                                                                                  Microsoftは2024年5月にCopilot+ PCの目玉機能として操作履歴検索AI「Recall」を発表しましたが、セキュリティやプライバシーに関する懸念の声が大量に寄せられたことを受けてリリース時期の延期が決定しました。そんなRecallに施されたセキュリティ対策やプライバシー対策についてMicrosoftのエンタープライズおよびOSセキュリティ担当ヴァイスプレジデントを務めるデビッド・ウェストン氏が解説しています。 Update on Recall security and privacy architecture | Windows Experience Blog https://blogs.windows.com/windowsexperience/2024/09/27/update-on-recall-security-and-privacy-architecture/

                                                                                    リリース延期になったWindowsのPC操作履歴検索AI「Recall」に施されたセキュリティ対策の詳細が明らかに