【読売新聞】 かつて、国会や地方議会で欠かせない技術だった速記を廃止する動きが広がる中、鹿児島県議会は速記を維持し続け、県内では後継者の育成に取り組む。音声をAI(人工知能)で文字にする「音声認識システム」の導入を始める自治体も出て
![AIが誤変換する鹿児島弁、速記が頼り…鹿児島県議会事務局「AIにはまだ難しい」](https://cdn-ak-scissors.b.st-hatena.com/image/square/9b268209a8311005e2847d6d066b0e82c4812d2d/height=288;version=1;width=512/https%3A%2F%2Fwww.yomiuri.co.jp%2Fmedia%2F2024%2F07%2F20240717-OYT1I50104-1.jpg%3Ftype%3Dogp)
「当然の時代の流れだった」と思っているという話。 最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。 あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。 それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストで食っていた。 ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。 ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGやVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。 (そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う) 絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ
日本で生成AIと言えば、OpenAIのChatGPTがその代名詞。この傾向は日本でのオフィス開設も加わって、さらに高まっているが、そのOpenAIやGeminiをはじめとする多様なAIサービスを提供するグーグルと並んで存在感を示している企業がある。 このジャンルに注目している方ならばご存知だろうが、AnthropicというAI専業ベンチャーである。AnthropicはOpenAIの運営方針に異を唱えるメンバーがスピンアウトした2021年創業の生成AIスタートアップで、アマゾンとグーグルが巨額を出資していることでも知られる。 滑らかな文章を生成するClaude 同社の大規模言語モデル“Claude(クロード)”はその性能の良さから注目されていたが、特に注目を集めるようになったのは、今年3月4日に発表されたClaude 3からだろう。特徴的な性能や機能もさることながら、印象的だったのは生成する
OpenAIは5月30日、同社のチャット型AI「ChatGPT」無料版ユーザーに向け、制限付きながら最新の大規模言語モデル「GPT-4o」および、これまで有料版ユーザーしか利用できなかった多くの機能を公開した(発表時のニュース記事)。 情報がとても多いので、今回の変更で無料版ユーザーは「なにができるようになったか」、そして「なにができないのか」を使い方中心にまとめた。 1. GPT-4oは回数制限あり チャット型AIアプリの心臓とも言える大規模言語モデル(LLM)、これまで無料版ユーザーは「GPT-3.5」という旧世代モデルしか利用できなかったが、今回の変更で回数制限(具体的な回数は明記されていない)はあるものの、最新モデルのGPT-4oが使えるようになった。 GPT-4oの利用に特に設定などは必要なく、無料アカウントにログインして普通に質問すればOK(使い方はちょっとわかりにくいのでこち
中国のSNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number A few generations from their site: 1. pic.twitter.com/NEmWiqKHiO — Rowan Cheung (@rowancheung) June 6, 20
スーパーのチラシを読ませたChatGPTに料理の献立を考えてもらうというライフハックが、X(旧Twitter)で「すごい賢い使い方」などと注目を集めています。 電子チラシとAIを活用 ライフハックを紹介しているのは、Xユーザーのイモンヌ(@immonnu)さん。「chatgpt4oに近所のスーパーの電子チラシを読ませて1番安く仕上がる献立を作らせてみた」と、無課金ユーザーも使える最新モデル「GPT-4o(GPT-4 Omni)」に献立を考えてもらった結果を共有しています。 イモンヌさんはスーパーの電子チラシ2枚分をGPT-4oをアップし、「チラシを見て、3日分の夕食の献立作ってほしい」と指示。「可能な限り安く済ませて欲しい」「男性1人、女性1人、幼児1人分作って欲しい」「可能な限り統一感(和食、中華といった)が欲しい」「レシピの試算金額を出して欲しい」「主食は家に在庫あり」など具体的な条件
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。
ChatGPT登場後に仕事急増も単価はダウン? 買いたたかれる「ビデオ編集」スキルの今後:小寺信良のIT大作戦(1/3 ページ) ChatGPTをはじめとするAIの登場で、メディアではなくなる仕事・なくならない仕事といった特集が組まれた。だが昨今はこうした記事を見かけないのは、まだ具体的にAIの影響が観測できないからだろう。 そんなAIの爆心地ともいえる米国で、フリーランス500万人に対して、生成AIの登場がフリーランスの労働市場にどのような影響を与えたかといった調査が発表された。リサーチしたのは、労働市場動向などの分析を得意とするBloomberryで、元データは世界最大級のアウトソーシングサイトUpworkが公開した求人データである。 ChatGPTのリリース1カ月前の2022年11月と、普及した2024年2月を比較した調査となっている。詳細はオリジナルサイトを見ていただきたいが、パッ
発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。 話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新 清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。 生成AIは「アナログからデジタル」の変化と同じ ── 最初にそれぞれの会社について教えてください。 ジェームズ キム・ドンジュン 2022年下半期ごろから、生成AIに関心をもって、
出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷
画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。 画像1枚で“似た顔” Midjourneyの新機能「Creative Reference」 使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ(cref)をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字
Microsoftの「Copilot」とOpenAIの「ChatGPT」にはどちらも無料版と有料版があり、月額20ドルの「Copilot Pro」や「ChatGPT Plus」に加入すれば、無料版にはない高度なAIの機能を利用できる(訳注:日本でのCopilot Proの利用料金は月額3200円)。 どちらの有料サービスでも、「GPT-4」や「GPT-4 Turbo」を使ってリアルタイムに情報を入手したり、「DALL-E 3」で画像を生成したり、特定の種類の文書やファイルを分析したりすることができる。しかしそれ以外に関しては、Copilot ProとChatGPT Plusでは提供しているサービスが異なる。この記事では、自分がどちらを選ぶべきかを判断する方法を紹介したい。 ChatGPT Plusに加入すれば、次のようなメリットを享受できる。 ピーク時でもChatGPTに快適にアクセスでき
claude3を使ってみたら、ライティングの仕事が無くなるかもしれない瞬間を目の当たりして、衝撃を受けた件 ひと言で結論を言うと、昨日はclaude3に衝撃を受けて、興奮して眠れませんでした…。 四の五の言わずにアウトプットを見せちゃいたいんですが、 ●打合せをZoom録画 ↓ ●録音データをCLOVA noteに放り込んでテキスト化 ↓ ●出てきたテキストファイルをノールックでclaude3に添付して、たった4行のプロンプトで指示 CLOVA noteに放り込むところから、トータルの所要時間、長めに見積もっても10分。それで出てきたのがこれです ↓ 【タイトル】 SFプロトタイピングが拓く、KOBIRAの未来 ~物語を通じて、全社で創る10年後のビジョン~ 【本文】 先日、「SFプロトタイピング」という新しい手法について、詳しくレクチャーを受ける機会がありました。講師を務めてくださったの
ヨーロッパの消費者団体が行っている自動車安全評価システム「Euro NCAP」が自動車産業に向けて、操作を行う部分にタッチパネルを使うのをやめて、物理的なボタンやスイッチに戻すべきであるとの提言を行いました。 Car industry told to dial back use of touchscreens https://www.thetimes.co.uk/article/stop-making-dangerous-touchscreens-car-firms-told-xv3gmpdc6 European crash tester says carmakers must bring back physical controls | Ars Technica https://arstechnica.com/cars/2024/03/carmakers-must-bring-back-
by Hillel Steinberg ハイテク企業やベンチャー企業のトップが、「これからの若者はプログラミングを身につけるべき」とアドバイスするのを見聞きしたことがある人は多いはず。こうした潮流とは裏腹に、NVIDIAのジェンスン・フアンCEOが「プログラミングはもはや不可欠なスキルではない」と提唱しました。 NVIDIA CEO: Every Country Needs Sovereign AI | NVIDIA Blog https://blogs.nvidia.com/blog/world-governments-summit/ Jensen Huang says kids shouldn't learn to code — they should leave it up to AI | Tom's Hardware https://www.tomshardware.com/tec
これは全社会人が読んで得をする書籍ですが、特に「パソコンが得意ではない社会人の方」が読むと一番効用が大きいように思いました。 また、私自身IT業界で働いていて世間一般的には「パソコンが得意な人」だと思いますが、それでも知らなかった使い方もたくさんあり学びが多かったです。 この書籍の推しポイントやりたいことベースで書いてある 日常のあらゆる面倒なことに手が届く パソコン触りたての人がつまづきそうなポイントへのフォローが丁寧 (例:ChatGPTはShift Enterで改行できる、など) 試行錯誤のうえのプロンプト(=AIに対しての指示)が載っているので出力が安定している (※ ChatGPTをはじめとしたLLMは同じ入力でも毎回出力変わります。また、ちょっと言葉が足りなかったりするだけで意図しない出力が返ってきますがそのあたりへの気配りが非常に丁寧です) 著書の専門性が高い(Kaggle
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く