並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 1295件

新着順 人気順

*日本語の検索結果201 - 240 件 / 1295件

  • 外国語を学ぶと色の解釈が変化する!「青」と「緑」が日本語で曖昧な理由 - ナゾロジー

    「緑の青葉」という表現が気になっていた人には興味深い発見です。 米国のMIT(マサチューセッツ工科大学)で行われた研究によって、外国語を学ぶと色の解釈に変化が現れることが示されました。 欧米をはじめとした先進各国が使う言語では基本的な色(赤・青・緑など)を表現する単語が主に12個ほど存在しますが、孤立した地域の言語では、基本的な色用語が少ない場合があります。 たとえば南米のアマゾンに住むチネマ族では色を示す言葉は基本的に「黒・白・赤」だけであり、黄色・緑色・青色については限定的に使用されるのに留まっています。 そこで今回MITの研究者たちはこれらチネマ族の人々が多くの色表現を持つスペイン語を習得した場合に、色についてどのような概念のシフトを起こすかを調査しました。 今回はまず最初のページで言語が「青」や「緑」を獲得する過程を紹介し、次のページでは研究内容を解説したいと思います。 前半部分は

      外国語を学ぶと色の解釈が変化する!「青」と「緑」が日本語で曖昧な理由 - ナゾロジー
    • 「非公式Modがすべてダメだと考えるのは極端な一般化です」ADV『Kentucky Route Zero』ashi_yuri氏インタビュー【有志日本語化の現場から】 | Game*Spark - 国内・海外ゲーム情報サイト

        「非公式Modがすべてダメだと考えるのは極端な一般化です」ADV『Kentucky Route Zero』ashi_yuri氏インタビュー【有志日本語化の現場から】 | Game*Spark - 国内・海外ゲーム情報サイト
      • ハマスに半裸で連行された音楽フェス参加女性…結局遺体で帰ってきた(中央日報日本語版) - Yahoo!ニュース

        イスラエル音楽祭会場現場がハマスからの攻撃を受け、行事場所から脱出する参加者たち。[写真 X(旧ツイッター) キャプチャー] イスラエル国防軍はガザ地区での作戦中に人質の遺体1体を追加で発見して計4体を収拾したと18日(現地時間)、明らかにした。前日収拾した遺体3体はスーパーノバ音楽フェスティバルの現場でハマス武装隊員に殺害された人質であることが把握された。 【写真】イスラエル国防軍が作戦中に収拾した人質遺体の生前の姿 イスラエル国防軍の首席報道官であるダニエル・ハガリ少将はこの日記者会見を通じて男性人質の遺体をガザ地区で発見した後、収拾したと明らかにした。確認の結果、昨年10月にハマスに拉致されたロン・ベンヤミンさん(53)であることが明らかになったと述べた。 イスラエル国防軍はベンヤミンさんが当時ハマス武装隊員に殺害されて遺体のままガザ地区に移送されたとみている。 イスラエル国防軍は1

          ハマスに半裸で連行された音楽フェス参加女性…結局遺体で帰ってきた(中央日報日本語版) - Yahoo!ニュース
        • お年寄りが『か』と『くゎ』を使い分けてて古語の名残りっぽい→日本語の発音が変わっていった経緯へ「同音異義語が多いのってこれ?」

          はちあ🍃言葉系VTuber @hachia_go 言葉系VTuberのはちあと申します!主に言葉に関する面白い情報を発信してます!アイヌ語が好きです!人工言語作りもやってます!(トントン語)🍃ママ&パパ:昼月ぼぶ様(@bobchugetsu) fan name→ファンチア 🖼fan art→ #はちマージュ youtube.com/channel/UC6s4X…

            お年寄りが『か』と『くゎ』を使い分けてて古語の名残りっぽい→日本語の発音が変わっていった経緯へ「同音異義語が多いのってこれ?」
          • 中国に行ったパンダのシャンシャン、日本語が聞こえると耳をそばだてて反応(中央日報日本語版) - Yahoo!ニュース

            昨年、日本から中国に返還された雌のジャイアントパンダ「シャンシャン」の近況が公開された。 【【動画】日本語が聞こえると耳をそばだてるパンダのシャンシャン ​6日、韓国SBSの『TV動物農場』のユーチューブにはパンダのシャンシャンの近況が公開された。該当動画には中国パンダ研究基地を訪れたある日本人観光客がシャンシャンに「頑張ったな、シャンシャン」と声をかける姿が映っていた。​ 聞き慣れた日本語が聞こえると、シャンシャンは耳をそばだててしばらく戸惑った表情で氷のように固まっていた。その後、観覧客の近くまで移動して降りてきた。普段、観覧客と遠くで竹を食べるのに夢中になっていた姿とは全く違った。 ​日本語を聞いて近くに近づいてきたシャンシャンの姿を見て、日本人観光客もすすり泣いた。観光客の目の前に迫ってきたシャンシャンは、目を合わせながら挨拶をする感じだった。 ​シャンシャンは日本現地で自然交配で

              中国に行ったパンダのシャンシャン、日本語が聞こえると耳をそばだてて反応(中央日報日本語版) - Yahoo!ニュース
            • 日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発 | リコーグループ 企業・IR | リコー

              株式会社リコー(社長執行役員:大山 晃)は、日本企業の業務での活用を目的に、企業ごとのカスタマイズを容易に行える130億パラメータの大規模言語モデル*1(LLM)を開発しました。日本語と英語での学習において、その学習データの比率を工夫することで、日本語としての文法や回答が正確で日本語精度の高い、日本企業が持つ情報資産の活用に適したモデルを実現しました。ベンチマークツールを用いた性能検証*2の結果、日本語で利用できる130億パラメータを持つ日本語LLMにおいて、2024年1月4日現在で最も優れた結果を確認しました。 労働人口減少や高齢化を背景に、AIを活用した生産性向上や付加価値の高い働き方が企業成長の課題となっており、その課題解決の手段として、多くの企業がAIの業務活用に注目しています。しかし、AIを実際の業務に適用するためには、企業固有の用語や言い回しなどを含む大量のテキストデータをLL

                日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発 | リコーグループ 企業・IR | リコー
              • 日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita

                TL;DR 量子化しても成績が下がりにくいモデルと、大きく下がるモデルがある 一部のモデルは量子化すると回答が極端に短くなる 量子化によって回答が短くなる度合いは、量子化前モデルの回答の長さと相関がある可能性がある はじめに 皆さんは量子化したLLMを使っていますか? 深層学習における量子化(quantization) とは、モデルのパラメータを少ないビット数で表現することです。 通常のモデルは float32 などの高精度なデータ型を使ってパラメータを表現しますが、この精度を float16 や int8 に下げることを量子化といいます。 量子化による最大のメリットは、モデルのメモリ使用量を削減できることです。メモリの大きなモデルを動かすためには、大容量のメモリを搭載したGPUが必要ですが、量子化によってモデルのメモリ使用量を削減することで、より多くのGPUでモデルを動かすことができます

                  日本語LLM 9種を量子化して回答内容を比較調査してみた - Qiita
                • 700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました|ELYZA, Inc.

                  700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました はじめにこの度 ELYZA は、新たに開発した700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」のデモを公開しました。「ELYZA-japanese-Llama-2-70b」は、前回までに引き続き、英語の言語能力に優れた Meta 社の「Llama 2」シリーズに日本語能力を拡張するプロジェクトの一環で得られた成果物です。 ELYZA が公開している日本語ベンチマーク ELYZA Tasks 100 を用いたブラインド性能評価では、公開されている日本語の大規模言語モデル (以下、LLM) を大きく上回っていることに加え、OpenAI 社の「GPT-3.5 Turboシリーズ」や Anthoropic 社の「Cla

                    700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、デモを公開しました|ELYZA, Inc.
                  • 【はっぴいえんどを松本隆と鈴木茂が語る】第1回 日本語でロックをやるための教科書も参考書もなかった | Mikiki by TOWER RECORDS

                    はっぴいえんど。メンバーは細野晴臣、大滝詠一、松本隆、鈴木茂の4人。説明するまでもなく、日本語ロックの礎を築いた本邦ポップミュージック史における最重要バンドだ。 そのはっぴいえんどが残した『はっぴいえんど』(70年、通称『ゆでめん』)、『風街ろまん』(71年)、『HAPPY END』(73年)というオリジナルアルバム3作が最新技術によって丹念にリマスターされ、CDでリイシューされた(レコードの日にはアナログ盤もリリースされた)。これを記念して2023年11月4日にタワーレコード渋谷店B1FのCUTUP STUDIOで開催されたのが、松本と鈴木、司会の安田謙一(ロック漫筆)によるトークイベントである。Mikikiは、この特別な催しで語られたことを全4回に分けてお届けする。 なお、好評につき早々に売り切れてしまった『はっぴいえんど』『風街ろまん』のアナログ盤だが、2024年1月下旬から再プレス

                      【はっぴいえんどを松本隆と鈴木茂が語る】第1回 日本語でロックをやるための教科書も参考書もなかった | Mikiki by TOWER RECORDS
                    • 高評価新作RPG『バルダーズ・ゲート3』PS5日本語版が今年発売へ。この夏爆発的人気を見せた重厚RPGが、日本語で遊べるように - AUTOMATON

                      『バルダーズ・ゲート3』はファンタジー・テーブルトークRPG『ダンジョンズ&ドラゴンズ』を原作としたRPG『Baldur’s Gate』シリーズのナンバリング最新作。開発は『Divinity』シリーズ開発元のLarian Studiosが手がけている。本作は『ダンジョンズ&ドラゴンズ』の第5版ルールをベースとし、TRPGのメカニクスをゲームに落とし込み。広大なファンタジー世界を自由度高く、仲間と共に冒険するRPGだ。 『バルダーズ・ゲート3』は、約20年ぶりのナンバリング新作として、2020年よりPC(Steam/GOG.com)向けに早期アクセス配信を開始。約3年を経た今年8月4日に正式リリースに至った。その直後に本作はSteamにてピーク時85万人を超える同時接続者数を記録(SteamDB)。評価も高く、本稿執筆時点において、全期間で17万5000件を超えるSteamユーザーレビューを

                        高評価新作RPG『バルダーズ・ゲート3』PS5日本語版が今年発売へ。この夏爆発的人気を見せた重厚RPGが、日本語で遊べるように - AUTOMATON
                      • NISTサイバーセキュリティフレームワークバージョン2移行のポイントと日本語訳

                        はじめに NIST(National Institute of Standards and Technology、米国立標準技術研究所)のサイバーセキュリティフレームワーク(以下、CSF)は、組織がサイバーセキュリティリスクを適切に管理するための手引きとなるベストプラクティスを提供しています。 2024年2月に発表されたCSF バージョン2(以下、CSF 2.0)では、バージョン1.1(以下、CSF 1.1)から重要な改定が行われました。これまで「国家や経済の重要なインフラに対するサイバーセキュリティ」を目的としていたものから、「全ての規模・全てのセクターの組織で利用される目的」にその対象を拡大しました。 今回、PwCコンサルティング合同会社はNISTから翻訳の許可を取得し、日本語訳を公開することになりました。以下よりダウンロードいただけます。 グローバルにビジネスを展開する組織は、最新の

                          NISTサイバーセキュリティフレームワークバージョン2移行のポイントと日本語訳
                        • 日本語形態素解析 Web API のユーザ辞書機能で解析結果をカスタマイズ

                          こんにちは。LINEヤフー株式会社で自然言語処理の開発を担当している牧野です。 今回は、Yahoo!デベロッパーネットワークから公開しているテキスト解析 Web API の「日本語形態素解析」で使えるようになった追加機能のユーザ辞書を紹介します。このユーザ辞書を使うと、自分だけのオリジナルの辞書で独自の解析が可能です。 また今回は、ユーザ辞書機能を工夫して使った簡易感情判定についても紹介します。 日本語形態素解析 Web API でできること 最初に、日本語形態素解析 Web API について簡単に紹介します。 日本語形態素解析 Web API 日本語形態素解析 Web API は、日本語文を形態素に分割し、品詞の推定や活用処理、読みを付与することができます。形態素とは、日本語として意味を持つ最小単位のことです。「辞書に載っている単語」程度のイメージで捉えていただけると良いでしょう。 たと

                            日本語形態素解析 Web API のユーザ辞書機能で解析結果をカスタマイズ
                          • 「知らない国の日常知るの楽しい」たった1人の呼び掛けからインプレゾンビが正気を取り戻し、次々と日本語で自国の料理や日常を投稿し始めた

                            𐬨𐬀𐬕𐬀𐬳𐬀𐬯𐬀𐬥 @masayasan201911 (聴こえますか、アラブやパキスタン、イラン等にいるインプレゾンビのみなさん、、、カタコトでもいいので日本語でしゃべりながら地元の料理や音楽をカメラで撮ったもの、自分の日本語学習進捗をXにアップロードしインプレを稼ぐのです、、、そちらのほうがハラールです) 2024-05-13 09:56:31

                              「知らない国の日常知るの楽しい」たった1人の呼び掛けからインプレゾンビが正気を取り戻し、次々と日本語で自国の料理や日常を投稿し始めた
                            • 『サイバーパンク2077: 仮初めの自由』ローカライズの立役者にロングインタビュー。CDPR本国の担当ディレクター&日本語ローカライズマネージャー西尾さんに濃厚な話を訊いた | Game*Spark - 国内・海外ゲーム情報サイト

                                『サイバーパンク2077: 仮初めの自由』ローカライズの立役者にロングインタビュー。CDPR本国の担当ディレクター&日本語ローカライズマネージャー西尾さんに濃厚な話を訊いた | Game*Spark - 国内・海外ゲーム情報サイト
                              • 山口仲美『日本語が消滅する』を読んで気になったところ(後半) - 誰がログ

                                後半の「はじめに」 前半への反応について 後半の内容に関する注意 トピックごとのメモ 語順 語彙 絶対敬語と相対敬語 音声言語と文字言語 表語文字(表意文字) 和製漢語 レアな日本語 そのほか おわりに 前半と後半は問題点の指摘については内容として独立していますので、こちらから読んでも構いません。ただ本書全体の評価などは前半に書いてありますので、もし良ければ読んでみてください。 山口仲美『日本語が消滅する』を読んで気になったところ(前半) - 誰がログ 後半の「はじめに」 前半への反応について 前半への感想をいろいろいただきました。ありがとうございます。どなたのというわけではありませんが、複数見かけた反応について少し書いておきます。 まず私は危機言語や方言が研究上の専門というわけではありません。問題点の指摘には社会言語学の入門書くらいに書いてあるような水準のことを使っているというのが私の感

                                  山口仲美『日本語が消滅する』を読んで気になったところ(後半) - 誰がログ
                                • 日本語/英語両方で世界トップクラス性能の大規模言語モデル。商用利用可

                                    日本語/英語両方で世界トップクラス性能の大規模言語モデル。商用利用可
                                  • 韓国アイドルの日本語や兵役と、日本の植民地支配の歴史。学生たちが「政治と文化は別もの」に抱く違和感

                                    好きなアイドルが「日本語で歌ってくれて嬉しい」「兵役に行って心配」…その背景にある、日本の加害の歴史を知っているだろうか。

                                      韓国アイドルの日本語や兵役と、日本の植民地支配の歴史。学生たちが「政治と文化は別もの」に抱く違和感
                                    • 不用意に font-feature-settings を使うと日本語表示がおかしくなる - 果樹園

                                      CSSでOpenTypeフォントの機能を制御できるようになった結果、欧文ページで font-feature-settings: "dlig"; が指定してあると、日本語に機械翻訳して読もうとした時に合字になって欲しくないところまで合字になってしまう。 「〜になります。」が「〜になり〼。」になる。— りんご🍏夜明けのリモートワーカー (@mstssk) April 17, 2024 本日は晴天なり <div style="font-feature-settings: 'nalt';"> 本日は晴天なり </div> 環境にインストールされているフォント次第だと思うので、手元のスクショも。 ※mac上のChrome。 記事を書いたきっかけのツイート https://twitter.com/yodare_inu_/status/1780431031218343978 参考 font-featu

                                        不用意に font-feature-settings を使うと日本語表示がおかしくなる - 果樹園
                                      • 独自の日本語LLM(大規模言語モデル)のバージョン3を一般公開 ―225億パラメータの商用利用可能なモデルを提供―

                                        株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、225億パラメータの日本語LLM(Large Language Model、大規模言語モデル)「CyberAgentLM3」を公開したことをお知らせいたします。 当社はかねてより日本語LLMの開発に取り組んでおり、2023年5月に独自の日本語LLMである「CyberAgentLM」を一般公開しました。その後も、2023年11月にバージョン2となる「CyberAgentLM2」を、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開しています。これらの技術は当社が提供する「極予測AI」をはじめとするサービスにおいて広く活用されています。

                                          独自の日本語LLM(大規模言語モデル)のバージョン3を一般公開 ―225億パラメータの商用利用可能なモデルを提供―
                                        • GPT-4 Turboより3倍速い「日本語特化のGPT-4」が提供開始、トークンも削減/

                                            GPT-4 Turboより3倍速い「日本語特化のGPT-4」が提供開始、トークンも削減/
                                          • 「パパ、どうしてiPhoneを買うお金がないの?」 道端で10代の娘に土下座して謝る父親の動画が中国ネットで話題に(朝鮮日報日本語版) - Yahoo!ニュース

                                              「パパ、どうしてiPhoneを買うお金がないの?」 道端で10代の娘に土下座して謝る父親の動画が中国ネットで話題に(朝鮮日報日本語版) - Yahoo!ニュース
                                            • 【Ubuntu日和】 【第33回】フォントと日本語入力の、ホントの話(Wayland編)

                                                【Ubuntu日和】 【第33回】フォントと日本語入力の、ホントの話(Wayland編)
                                              • Anthropic、AIチャット「Claude 3」を3サイズで 日本語力も向上

                                                無料のclaude.aiは本稿執筆現在、既に「Claude 3 Sonnet」になっている。月額20ドルの「Claude Pro」にアップグレードすれば「Opus」を利用できるようになる。 コンテキストウィンドウは、最大20万トークン(約15万ワード、または500ページ以上のドキュメント)を受け入れる。Anthropicによると、Opusは「AIシステムの一般的なベンチマークのほとんどで、米OpenAIのGPT-4や米GoogleのGeminiなどの競合するシステムを上回る性能を発揮した」という。また、「複雑なタスクでは人間に近い理解力の流暢さを示し、一般知能の最前線をリードする」としている。 昨年7月にリリースした「Claude 2」と比較して、分析と予測、微妙なコンテンツ作成、コード生成、スペイン語、日本語、フランス語などの非英語での会話能力が向上した。2023年8月までのデータでトレ

                                                  Anthropic、AIチャット「Claude 3」を3サイズで 日本語力も向上
                                                • 匿名ハッカーとして邪悪な組織の計画を暴き出すゲーム『アノニマス・ハッカー・シミュレーター』の体験版が公開。簡素ながらリアルなハッキングを体感でき、日本語にも対応している

                                                  2020年に設立されたG-DEVS.comは10月9日(月)、新作ゲーム『Anonymous Hacker Simulator(アノニマス・ハッカー・シミュレーター)』の無料体験版をPC(Steam)向けに配信した。本作は日本語字幕に対応しており、正式版についても2023第4四半期の発売を予定している。 『アノニマス・ハッカー・シミュレーター』のなかでプレイヤーは匿名のハッカーとなり、「Vladimir Pootin」や「Elan Mask」などどこかで聞いたことのある名前を持った公人たちをハッキングして、その秘密を暴露する。 本作の特徴として、ネットワークをスキャンする「Nmap」や情報収集に用いられる「Harvester」など実在するソフトウェアも登場するリアリティの高いハッキング描写があげられる。作中でプレイヤーはキーボードなどを用いて実際にコマンドを入力しながら、目的の情報を手に入

                                                    匿名ハッカーとして邪悪な組織の計画を暴き出すゲーム『アノニマス・ハッカー・シミュレーター』の体験版が公開。簡素ながらリアルなハッキングを体感でき、日本語にも対応している
                                                  • 『Hades II』日本語対応で突如早期アクセス配信開始!人気ローグライトACT続編、個性強めな神々とのふれあい再び | Game*Spark - 国内・海外ゲーム情報サイト

                                                      『Hades II』日本語対応で突如早期アクセス配信開始!人気ローグライトACT続編、個性強めな神々とのふれあい再び | Game*Spark - 国内・海外ゲーム情報サイト
                                                    • 高評価・新作RPG『バルダーズ・ゲート3』PS5日本語版12月21日に発売へ。「圧倒的に好評」な広大世界の冒険を日本語で遊べる - AUTOMATON

                                                      スパイク・チュンソフトは10月3日、『バルダーズ・ゲート3(Baldur’s Gate 3)』日本語版を12月21日に発売すると発表した。対応プラットフォームはPS5で、パッケージ版・ダウンロード版ともに税込8580円となっている。なお、本作グローバル版はPC向けにはSteam(Windows/Mac)およびGOG.com向けに発売中。Xboxコンソール向けにも展開を予定している。 『バルダーズ・ゲート3』はファンタジー・テーブルトークRPG『ダンジョンズ&ドラゴンズ』を原作としたRPG『Baldur’s Gate』シリーズのナンバリング最新作。開発は『Divinity』シリーズ開発元のLarian Studiosが手がけている。本作は『ダンジョンズ&ドラゴンズ』の第5版ルールをベースとし、TRPGのメカニクスをゲームに落とし込み。広大なファンタジー世界を自由度高く、仲間と共に冒険するRP

                                                        高評価・新作RPG『バルダーズ・ゲート3』PS5日本語版12月21日に発売へ。「圧倒的に好評」な広大世界の冒険を日本語で遊べる - AUTOMATON
                                                      • iPhoneで日本語のリアルタイム文字起こしができる「WhisperAX」

                                                        AI関連企業のArgmaxは4月5日現在、OpenAIの音声認識AI「Whisper」を利用した文字起こしアプリ「WhisperAX」のベータ版を公開している。対応機種はiPhone、Apple Silicon搭載Macと、Apple Watch Series 9/Ultra 2。アップルのテスト環境提供アプリ「TestFlight」から試用可能だ。

                                                          iPhoneで日本語のリアルタイム文字起こしができる「WhisperAX」
                                                        • 覚えやすく強いパスワード作成の極意、日本語フレーズを語呂合わせで変換する

                                                          ここでは強いパスワードの作り方を具体的に見ていく。図1のように桁数や文字種を増やし、単純な文字列を使わないのが鉄則だ。問題は覚えやすさ。ブラウザーに記憶させるなら、複雑で覚えづらくても問題はない。だが、そうしない場合、手帳やパスワード管理アプリに記録するにしても、ログインのたびにそれらを参照するのはちょっと面倒だ。パスワードは覚えやすいに越したことはない。 図1 強いパスワードの条件は当然ながら、ある程度の桁数があってさまざまな文字種を含むことだ。一般的な単語を単独で使わないのは大前提。誕生日や電話番号などわかりやすい個人情報もNGだ。自分のSNSで公開している記念日や記録の数値なども避けたほうがよい 理想のパスワードは自分では覚えやすく、他人からは見破られない文字列。そこで提案したいのが、日本語のフレーズを基にした“語呂合わせ”だ。特に海外の攻撃者に対しては日本語のローマ字表記が効果的。

                                                            覚えやすく強いパスワード作成の極意、日本語フレーズを語呂合わせで変換する
                                                          • 日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫

                                                            産業技術総合研究所と東京工業大学の研究チームは12月19日、日本語に強い大規模言語モデル(LLM)「Swallow」を公開した。米Metaが開発したLLM「Llama 2シリーズ」をベースに日本語能力を改善させたもの。ライセンスは「LLAMA 2 Community License」で、研究や商業目的で利用できる。 今回公開したのは、パラメータ数が70億(7B)、130億(13B)、700億(70B)のモデル3種類。Llama 2シリーズが持つ高い言語処理能力を維持しながら日本語能力を強化することを目指した。 このため、AIモデルに日本語の文字や単語などの語彙を追加し、新たに開発した日本語データで継続事前学習(学習済みのLLMに対して追加で事前学習を行う手法で、異なる言語などで言語モデルを活用するときに使われる)を行った。結果、日本語に関するベンチマークデータで、全モデルがベースモデルより

                                                              日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫
                                                            • Google検索の生成AI機能「SGE」、日本語版提供開始

                                                              SGEはまだ試験運用の段階だ。Googleは「生成AIとLLM(大規模言語モデル)には既知の制限があり、検索が常に正しく機能するとは限ら」ず、SGEについても「検索の高い品質基準を維持できるようトレーニング」していると説明する。SGEの回答の上には必ず「生成AIは試験運用中のため、品質にむらがある可能性があります。」と表示される。 検索での生成AI採用は、米Microsoftが先行し、2月に日本語でも使える「新しいBing」を限定プレビューで提供開始した。 関連記事 Googleの生成AI搭載検索エンジン「SGE」にページ内容まとめなどの3つの新機能 Googleは、5月に米国で提供を開始した検索の生成AI機能「Search Generative Experience」(SGE)の3つの新機能を発表した。コーディングのオーバービューも見やすくなる。 Googleの生成AI搭載検索エンジン「

                                                                Google検索の生成AI機能「SGE」、日本語版提供開始
                                                              • パスポートを更新しようと10年ぶりにパスポートセンターに行ったが、案内板もアナウンスも全て日本語である事に違和感を覚えた→当然なのでは?

                                                                Rootport🍽 @rootport 作家・マンガ原作者。/好きな言葉は「群盲撫象」/TIME誌「世界で最も影響力のあるAI業界の100人」選出/Blog→rootport.hateblo.jp /マシュマロ→marshmallow-qa.com/rootport youtube.com/channel/UCp6RK… Rootport🧬 @rootport 「パスポートを更新しようと10年ぶりにパスポートセンターに行ったのだけど」 「うん」 「案内板もアナウンスもすべて日本語であることに違和感を覚えた。この20年ほどで、公共施設は多言語対応が当たり前になったのに…」 「パスポートセンターには(ほぼ)日本人しか来ないからいいんだよ」 2023-08-24 11:40:45

                                                                  パスポートを更新しようと10年ぶりにパスポートセンターに行ったが、案内板もアナウンスも全て日本語である事に違和感を覚えた→当然なのでは?
                                                                • “GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」

                                                                  東大発のAIスタートアップ企業であるELYZA(東京都文京区)は6月26日、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。 Llama-3-ELYZA-JP-70Bは、米MetaのLLM「Llama-3-70B」をベースに日本語の追加事前学習や指示学習を行って開発したモデル。元のLLMから、日本語性能が大きく向上しているのが特徴。2つのベンチマークで日本語性能を評価したところ、米OpenAIのLLM「GPT-4」の性能を上回り、米AnthropicのLLM「Claude 3 Sonet」や米GoogleのLLM「Gemini 1.5 Flash」とも同等かそれ以上の性能を達成したという。

                                                                    “GPT-4超え性能”の日本語特化型LLM AIスタートアップ・ELYZAが開発 国外プレイヤーとの競争も「諦めない」
                                                                  • 『マックがやっと売れました!』発売! 日本語無理・ソフトは2本だけのMacをどう販売?/Apple製品の代理店でマーケティングを任された平社員の奮闘記【Book Watch/ニュース】

                                                                      『マックがやっと売れました!』発売! 日本語無理・ソフトは2本だけのMacをどう販売?/Apple製品の代理店でマーケティングを任された平社員の奮闘記【Book Watch/ニュース】
                                                                    • 会話に隠れる淫語を撃ち抜け!美しい日本語を守る知的なADV『ウーマンコミュニケーション』10月26日配信決定 | Game*Spark - 国内・海外ゲーム情報サイト

                                                                        会話に隠れる淫語を撃ち抜け!美しい日本語を守る知的なADV『ウーマンコミュニケーション』10月26日配信決定 | Game*Spark - 国内・海外ゲーム情報サイト
                                                                      • すっかり浸透してしまった、しっくりこない日本語

                                                                        中抜き (ほとんどが「ピンハネ」の誤用)ギガ (「通信量」「通信容量」)電子タバコ (アイコスなどは「加熱式タバコ」)

                                                                          すっかり浸透してしまった、しっくりこない日本語
                                                                        • 日本語が読めない外国人がうまい棒のパッケージデザインを見て何味なのかを予想しました「なんとか食い物に寄せンかいw」「着眼点天才すぎる」

                                                                          Ra刹@ヵㇲキャ @RsetU_PLAMO8CC これそもそも ◯◯味って描いてあるところを隠されたら 日本人でも解らないようなのが 多いような気が…。() 2024-05-07 22:53:43

                                                                            日本語が読めない外国人がうまい棒のパッケージデザインを見て何味なのかを予想しました「なんとか食い物に寄せンかいw」「着眼点天才すぎる」
                                                                          • 日本語LLMにおけるトークナイザーの重要性 | データアナリティクスラボ

                                                                            ELYZA-Japanese-Llama-2-7b ELYZA-Japanese-Llama-2-7bは、ELYZAが公開した日本語に特化したLLMです。 公開されたのは以下のモデルです。 ELYZA-japanese-Llama-2-7bELYZA-japanese-Llama-2-7b-fastELYZA-japanese-Llama-2-7b-instructELYZA-japanese-Llama-2-7b-fast-instruct instruct:instruction tuningによって追加学習されたモデル。 fast:日本語の語彙の追加によって処理を高速化したモデル。 モデルの概要 ELYZA-japanese-Llama-2-7bはLlama2をベースとして日本語処理の性能を向上させるために追加学習したモデルです。英語で学習済みのLLMの言語能力を引き継ぐことで、少な

                                                                              日本語LLMにおけるトークナイザーの重要性 | データアナリティクスラボ
                                                                            • タイの地下アイドルのMV、背景に登場した日本語がゴツすぎて内容もアイドルも頭に入ってこない「すげえ組み合わせだ」

                                                                              Projext52 @projext52 "เน้นเข้าร่วมไม่เน้นเข้ารอบ Not win (?) | BB & Beawwie [ OFFICIAL MV ] out now on YT Channel: Projext52 #projext52 #เน้นเข้าร่วมไม่เน้นเข้ารอบ #BB #Beawwie #whizmusic #pridemonth pic.twitter.com/EvKjPjnqSt 2024-06-22 19:59:05 タイの地下アイドル最新情報室 @thaiidoljp BB & Beawwie "เน้นเข้าร่วมไม่เน้นเข้ารอบ Not win (?)"のMVが公開!! 現在のタイのドラマのトレンドにもなっているガールズ・ラヴな内容のMVになってます。 #タイのアイドルの新曲 #タイのアイドル y

                                                                                タイの地下アイドルのMV、背景に登場した日本語がゴツすぎて内容もアイドルも頭に入ってこない「すげえ組み合わせだ」
                                                                              • Swallow: LLaMA-2 日本語継続事前学習モデル

                                                                                はじめに 東京工業大学 横田研究室の藤井です。 本日(2023/12/19)Llama 2から日本語継続事前学習を行ったSwallow-7B, Swallow-13B, Swallow-70Bをリリースさせて頂きました。 本モデルの開発は、産総研、東京工業大学 岡崎研究室、横田研究室の合同プロジェクトにて行われました。公式プロジェクトページはこちらです。 Swallow-70Bはオープンな日本語モデルにおいて最高の日本語性能を記録しました。 (後述のモデル評価セクションを参照のこと) リリースモデル 日本語継続事前学習済みモデル Swallow-7B Swallow-13B Swallow-70B 上記モデルに指示チューニングを施したモデル Swallow-7B-instruct Swallow-13B-instruct Swallow-70B-instruct 本記事では、Swallow

                                                                                  Swallow: LLaMA-2 日本語継続事前学習モデル
                                                                                • 夢小説で日本語を学んだ海外ネキ、ガチで日本語うますぎて笑う「俗語バリバリに喋れるの普通に語学研究の才能あると思う」

                                                                                  國知 @kuni11_tomo28 最後がおしいけども、「謎の」の用法が完璧。 ネットで日本語学んだんだなってのがよく伝わる。 日本語学校とかで身に付く用法ではないよね?多分。 x.com/ororor51/statu…

                                                                                    夢小説で日本語を学んだ海外ネキ、ガチで日本語うますぎて笑う「俗語バリバリに喋れるの普通に語学研究の才能あると思う」