松田洋子 @matuda そういや知らない言葉を無いもの扱いされたの思い出した。 「“甘噛み”なんて日本語は無いですよ」て編集に言われて「いやあるから」て言っても「僕の持ってる辞書にも無いですし!」て自信たっぷりで、ナポレオンかお前はって思った。言わんけど。 あれはまだGoogleも無い時代のことじゃった。 2024-03-25 18:06:08
デイリーポータルZのライター、関係者が愛読している本を語ります。 今回はライターの唐沢さん。レコメンドは「日本語大博物館: 悪魔の文字と闘った人々」(ジャストシステム) 聞き手は安藤、佐伯、石川です。 では唐沢さん、お願いします。 なんでローマ字打たなあかんねん 唐沢:パソコンのキーボードで文字を打つ時って、まずローマ字を入力して、それをひらがなにして、さらに漢字に直すじゃないですか。ある日、「なんでローマ字打たなあかんねん」ってめっちゃ腹立ったんですよ。 安藤:はいはい(笑) 唐沢:小さいころにタイピングゲームでかな入力を練習したんです。そしたら親から、「ローマ字入力しか使わへんで」って言われて、あとでローマ字入力を覚え直して。 みんなやってるから覚えましたけど、よくよく考えたら「最初っからかな入力して、漢字に変換するほうが早くない?」と思って。 石川:たしかに。 唐沢:それに腹が立って
各種Prompt Engineeringの日本語実例集(Zero-CoT、mock、ReAct、ToT、Metacog、Step Back、IEPなど)Python機械学習入門ChatGPTLLM CoT、Zero-CoT、ToT、mock、ReAct、Step Back、Metacog、IEPなど、各種Prompt Engineering手法の概説と、日本語での実際のプロンプト例をまとめた記事です。 各種Prompt Engineering手法を日本語で実装したい方向けの記事となります。 本記事で取り扱う手法は以下の通りです。 項目数が多いため、記事右下の目次リンクもご活用ください。 本記事の内容 01: 通常のPrompt 02: Few-shot Learning 03: CoT(Chain of Thought) 04: 出力形式の指定方法 05: Zero-shot CoT(≒
ライブラリのアプリ化 現代のニュースをくずし字で読んでみませんか?内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュース その他の事例については、活用事例を参照してください。 構成 古活字とくずし字 そあん(soan)で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字(草書体)も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。 そあん(soan)は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ
当サイトでは、毎月新しく公開されたフリーフォント素材をまとめて紹介しています。 この記事では、2023年にリリースされた、商用利用できる完全無料の英語・日本語フリーフォントを集めました。 2023年は、特に数多くの日本語フリーフォントが公開されました。 おしゃれな英語フォントから高級感のあるセリフ書体、人気定番の筆記体、手書き、ブラシフォント、ビンテージ、ディスプレイなど。 幅広いカテゴリよりフリーフォント素材120個を厳選しているので、自分の「推しフォント」を見つけてみませんか。 「日本語フォントをまとめてダウンロードしたい」 「できるだけ安く、仕事でも安心して、フォントを使いたい」 そんなときは、20,000以上の英語フォント、日本語フォントも500以上を使い放題の、Adobe Fonts(アドビフォント)がオススメです。 その理由はずばり、Adobe CCユーザーなら、すべて無料で、
今年、青竜の年である「甲辰年」を迎えて中国で伝説の中の動物「竜」の公式英語表記を「dragon(ドラゴン)」から「loong(ルン)」に変えるべきだという声が高まっている。 8日、現地メディアによると、官営中国中央テレビ(CCTV)放送の英語チャネルCGTNは先月9日、ある行事について伝えながら竜の年を「Loong Year」、竜踊は「Loong Dance」と翻訳した。 現在多くの中国の学校教科書では竜を「dragon」と翻訳しているが、竜の年を控えて官営メディアで「loong」と翻訳する事例が頻繁に登場していると地元メディア「揚子晩報」は7日、報じた。 WeChat(微信)の「上海文聯」がオンラインアンケート調査を実施したところ、中国ネットユーザー10人中9人が「loong」を選択した。 西洋の「dragon」と中国の「loong」は全く違うものだというのが中国人の考えだ。竜は福を意味
Stability AIは日本語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP Alpha「Japanese InstructBLIP Alpha」は、先日公開された日本語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日本語データセットで高性能なモデルを構築するために、モデルの一部を大規模な
東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。 同成果は、東工大 情報理工学院 情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日本語能力の改善を担当したとしている。 産総研のAI橋渡しクラウド「ABCI」(出所:東工
Comment by fatalotaku 何で日本語タイトルの使用を好む人が多いのか こんなことを尋ねると腹を立てる人もいるだろうけど純粋に疑問。 日本語タイトルをあまり追えない自分としてはなんでみんなが英題よりも日本語タイトルの使用を好むのかが不思議。 最近見かけた例だと「Ascendance of a Bookworm」の動画のソースを尋ねてる人に対するレスの大半が「Honzuki no Gekokujou: Shisho ni Naru Tame ni wa Shudan wo Erandeiraremasen」というものだった。 確かにそれなら正確な回答だろうけど一々打つのは大変だろうし、興味を持った人もそれじゃ後で検索しようと思った時に思い出すのが難しいかもしれない。 要するに僕は日本語タイトルを使用すべきではないと言ってるわけではなくて、ただアニメの議論をする時に英題ではなく
自民党派閥の政治資金パーティー裏金事件に関し、自民が派閥から所属議員に渡されたお金を「還付金」だと言い張っている。国税通則法などに登場する用語で、本来は国民が誤って所得税を納めすぎた場合などに返還される正当な金銭を指す。自民は記者会見などで多用しているが、政府与党から使い方をただす声は上がっていない。 自民が15日に公表した所属議員への聞き取り調査の報告書では、ノルマを超えてパーティー券を売った議員に渡されたお金を「還付金」、議員が派閥側に渡さずに保管したパーティー券収入を「留保金」と名付け、正当性を印象づけた。裏金事件の主な舞台となった安倍派幹部らも還付金という言葉をたびたび使い、党内でも定着している。
CSSのこの機能を待っていた人も多いと思います! CSSで、句読点括弧のカーニングが自動でできたり、フレーズの途中で改行されないようにしたり、日本語と英語が混在したテキストでスペーシングが自動調整されたり、10px以下でも指定サイズ通りに表示されたりなど、日本語が読みやすくなる最近サポートされた・近日サポートされるCSSの機能を紹介します。 Introducing four new international features in CSS by Jack J 下記は各ポイントを意訳したものです。 ※元サイト様のライセンスに基づいて翻訳しています。基づいてというのは、貢献部分に関して同ライセンスも含みます。 はじめに word-break: auto-phrase;によるフレーズで自動改行 text-autospaceによる文字間のスペーシング text-spacing-trimによる句読
物事を当初予定していた時期よりも後にすることを「後ろ倒し」と表現することが割と一般的になっている。 もともと「後ろ倒し」という日本語は無く、「前倒し」からの派生として新しく出来た言葉らしく、それ故たまにネットで「後ろ倒し」に対する嫌悪感も目にする。 でも、ニュートラルに「遅らせる」ことを表する言葉として「後ろ倒し」の使い勝手が良すぎるんだよな。それでいて体言止めなど、見出し的な使い方にナンでも合うという極めて高い汎用性を持つ。 ニュートラルな後ずらしを表現するにはなんて言ったらいいんだろう。 ・延期→何月何日みたいにカッチリと期日が決まっていた事象にしか使えない感じ。 ・先延ばし→本来は早急にしなければならないことをやらない感じで、ネガティブなことにしか使えない。 ・先送り→同上 ・遅延→物事に間に合わないという意味なので、使える場面が限られる。 ・繰り下げ→あらかじめ決まっている枠組みの
みなさんは日本語の文字の並べ方に「ベタ組」「ツメ組」という言葉があることをご存じでしょうか? 実は日本語の文章は、読み手を意識して読みやすい間隔で文字が並べられています。 今回はそんな日本語の文字の並べ方をご紹介します。 ベタ組とツメ組「ベタ」という言葉の意味は「隙間なく物が並んでいること」だそうです。そういえば印刷用の絵や漫画の黒一色で隙間なく塗った部分を「ベタ」とも言っていますね。他にも「ベタ」は建築業界の⽤語にもあるようです。 まずは日本語組版にもある「ベタ」を説明する前に、文字の設計についてお話しします。 日本語で使われる漢字やひらがな、カタカナは一般的に正方形に収まるように設計されており、この正方形に相当するところを「仮想ボディ」と呼んでいます。そして「仮想ボディ」の中に実際の文字部分である「字面」が収まっています。 仮想ボディと字面。pt? 級? 号? 文字に関する単位の話より
綾塚 祐二 @ayatsuka_yuji 念のため補足。「デザインの敗北」だと「『デザイン』は悪くない/良いのに、他の要素に負けた」と解釈する/される余地がありますが、これは「ここに(男性用)トイレがあることを示す」という本来果たすべき機能が弱く他の施策が必要になっているので、「デザイン(設計)がよくない」というべきなのです。 2023-09-27 00:03:11 綾塚 祐二 @ayatsuka_yuji さらに補足。例えば設計(デザイン)した蓋が(加工のミスなどでなく)きちんと締まらないものだったらそれは「設計ミス」と言われます。この(元の)トイレのサインも「機能として不十分」という点でそれに類するものです。それゆえ(婉曲的な表現でなく明確に)「デザインがよくない」と評価されるべきです 2023-09-27 10:46:45
国立天文台は3月6日、ファンタジーTRPG『サンドキャッスルTRPG』の日本語版を公開した。ゲームを遊ぶためのルールブックのほか、ペーパーコマやサイコロといったプレイ用アイテムも無料でダウンロードすることができる。 『サンドキャッスルTRPG』は初心者からベテランまでが楽しめる、シンプルで手軽なシステムのTRPGだ。2023年2月に英語版が発表されており、日本語版の制作が進められていた(関連記事)。 舞台は「ドメイン」と呼ばれる中世風の剣と魔法のファンタジー世界。魔術師や怪物、エルフやドワーフが登場する、オーソドックスなファンタジー世界観である。しかし、科学技術は中世とは思えないほどに発達しており、プレイヤーキャラクターは「物理科学」や「工学」といった科学技術的な技能を身につけることが可能だ。純粋なファンタジーとは一味違った、科学的な冒険を楽しめるTRPGシステムなのだ。 国立天文台は日本
2023年も残り2週間ちょいですね、今年リリース・アップデートされたひらがな・カタカナ・漢字が使える日本語の新作フリーフォントを紹介します。 ゴシック、明朝、デザインフォント、手書きフォントなど、盛りだくさんです! これまでの日本語フリーフォント総まとめは、下記をご覧ください。 日本語のフリーフォント総まとめ -商用サイトだけでなく紙や同人誌などの利用も明記 後日、上記に追加します。 まずは、今年個人的に一番気に入ったフォントから。 無料版で使ってみたらいい感じだったので、有料版を購入しました。 かもめ明朝 個人・商用サイトで無料利用可。同人誌や各種印刷物なども可。 築地二号系で昭和初期に作られたであろう金属活字にインスパイアされて作成されたフォント。ひらがな・カタカナ・約物、漢字は4文字だけ収録されています。 フリーフォントのダウンロードは、サイドバーの「無料ダウンロード」から。 202
https://store.steampowered.com/app/1622910/Still_Wakes_the_Deep/ このゲーム 翻訳がどうヤバいのか、一部のセリフを引用する 「下におっときにクルーリフトのヒューズばちゃちゃっと直してくるっね?」 「黙れっつっとるやろうが!わいらのごた 連中がおいの経営にいちいち文句ば言うとのせからしゅうてたまらんのじゃ」 「リグ全体ば見ろ ガラクタん山さ 掘り始めたばっかとに崩るっと カダルんクズにレニックんクズは手抜きばっかさ」 「おんシェフとはお友達でもなここば経営しとっとはアレじゃなくておいぞ」 「いったい何のあったとや?!」 「石油っぽか何かば浴びてから分からん…」 「避難する段じゃなかやろ?北海の底におるままやったらあいつから持ち場に戻さるっだけぞ」 なんかすごい訛ってる スコットランドが舞台でやや訛りのある英語なのでそこを日本語で
UnityのUI開発ガイド『Unityにおけるユーザーインターフェースのデザインと実装』が無料で提供 『User interface design and implementation in Unity』の日本語版 UI Toolkitの使いこなしについて重点的に解説されている ユニティ・テクノロジーズ・ジャパンは、日本語の電子書籍『Unityにおけるユーザーインターフェースのデザインと実装』を無料で提供。専用ページから申し込めばダウンロードできるようになりました。 昨日の #CEDEC での講演「Unity最新情報まとめ!2023年夏版!」の中で紹介した無料の電子書籍『Unity におけるユーザーインターフェースのデザインと実装』はこちらよりダウンロードできます。 #CEDEC2023 https://t.co/1hndoveDwk pic.twitter.com/iNi3KtJRth
WAKEMI Akira @awakemi 京都にある大谷大学の教員。手持ちの時間と能力とを無視した好奇心に振り回されて、しばしば義務の履行を忘れる。基本的に独り言で、色んな性質のものがゴッチャです。あまり他人様にお見せできるようなものではないかも知れません。真宗大谷派恵日山長光寺の住職でもあります。 https://t.co/uc5p6MEwVA WAKEMI Akira @awakemi 今回のノーベル文学賞発表の報道で印象的だったのは、受賞者発表されても日本には書店に並べる日本語訳がないという状況だった。 ノーベル文学賞を受賞するほどの人は既にいくつもの賞を受賞していたりノミネートされていたりする。そういう人の作品が日本語に訳されていないというのだ。 2023-10-06 07:30:36 WAKEMI Akira @awakemi 文学は、外国語が日本語に最も翻訳されやすいジャンル
システムから言語モデルがどのように使えるか、その時どういうことに気をつける必要があるかを考える「『ChatGPTなどの言語モデルはどのようにシステムで使えるか』きしだなおき氏」。ここで、LINE Fukuoka株式会社のきしだなおき氏が登壇。続いて、システムがChatGPTをどのように使うかと、日本語特化のLLMについて話します。 システムはChatGPTをどのように使うか きしだなおき氏:今、人間がどう使うかという話を中心に話しました。(次に)じゃあシステムからどう使うかとなると、APIを使った利用になりますね。 今日(2023年6月14日時点)朝起きたら「関数定義が可能になったよ」みたいなものが出ていて。今回の(セッションで話した)概要(の内容)とか…。(この概要は)昨日になってやっと(運営に)送ることができたんですけど、「どういう話をしようか」と思って朝起きたら、毎日状況が変わってい
■PC画面フリーズ「ウイルスにかかっています」とメッセージ 大阪府熊取町教育委員会は、町立の小学校教師がパソコンに保存していたおよそ200人分の児童の個人情報が漏洩したと発表しました。 熊取町教委によると先月29日、熊取町立中央小学校で30代の女性教師が資料作成中にネットで検索したフリーのイラストを資料に挿入しようとしたところ、パソコンの画面が突然フリーズし「ウイルスにかかっています」と書かれたメッセージが表示されました。 ■メッセージに従い電話 指示通り操作「遠隔操作」開始 さらにウイルス感染からパソコンをサポートする旨のメッセージが届き、「505」から始まる10桁の電話番号が表示されたことから、教師はメッセージに従い電話をかけ、通話相手の指示通りパソコンの操作を行ないました。 そして、教師が通話相手の「初めにescapeキーを10秒押す」「その次にWindowsキーとRキーを同時に押す
Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. 超高評価ワイヤーアクション『SANABI(サンナビ)』、ファンの協力により日本語ローカライズ改善へ。「翻訳以外完璧」と言われた目下最注目インディーゲーム11月9日の発売後からすぐさま口コミで話題になり、多くのプレイヤーがその優れたシナリオ・演出を絶賛しているゲーム『SANABI』。唯一良くないと言われている日本語翻訳の改善予定について、作者に取材しました。
Google マップでアフリカ大陸の一部地域に対して、日本語による荒らし行為が多数確認され、SNS上で「これはダメでしょ」「想像以上にひどい」など波紋が広がっています。 画像出典:Google マップ 主に標的になっているのは、アフリカ大陸のビクトリア湖にある「ミギンゴ島」。島にはトタン屋根の民家が建ち並び、2018年のAFPBB Newsの報道によると、ほかにはバーや小さな港などがあるだけだといいます。 Google マップのミギンゴ島には記事執筆時点で、「ビッグモーター」「ダイハツ」「宝塚歌劇団」といった、日本国内で昨今物議を醸した企業名や団体名などが記載されたスポットが多数点在しています。また、それぞれのスポットには評価が付けられ、荒らしコメントも多数見られました。 画像出典:Google マップ 画像出典:Google マップ Google マップの改ざんはこれまでにも繰り返されて
Rudy Rucker @rudytheelder Rudy Rucker is a cyberpunk writer with a checkered past. Ware Tetralogy, Complete Stories, and Juicy Ghosts. Paintings page is https://t.co/2lQEigEYyP rudyrucker.com/blog Rudy Rucker @rudytheelder While we're at it, here's some Japanese covers, for Soft, Wet, and Freeware, also for Hollow Earth. Please remind me again of this wonderful artist's name. Also I'll throw in a
米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表 OpenAIは、11月に発表した「GPT-4 Turbo」のプレビュー版をリリースすると発表した。「GPT-4」が怠け者になってきたという苦情を受け、怠けにくくしたという。公式版は数カ月中にリリースする計画だ。 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenA
人間の幹細胞を基に作られた脳オルガノイド(ミニ脳)を電子チップに接続した「ブレイノウェア」と呼ばれるセットアップを構築して、簡単な計算タスクを実行することに成功したことが、インディアナ大学ブルーミントン校のエンジニアであるフェン・グオ氏らの研究チームによって報告されました。 Brain organoid reservoir computing for artificial intelligence | Nature Electronics https://www.nature.com/articles/s41928-023-01069-w Scientists Built a Functional Computer With Human Brain Tissue : ScienceAlert https://www.sciencealert.com/scientists-built-a-f
Metaの「Llama 2」をベースとした商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を公開しました 本記事のサマリーELYZAが「Llama 2」ベースの商用利用可能な日本語LLM「ELYZA-japanese-Llama-2-7b」を一般公開 性能は「GPT-3.5 (text-davinci-003)」に匹敵、日本語の公開モデルのなかでは最高水準 Chat形式のデモや評価用データセットも合わせて公開 既に社内では、130億、700億パラメータのモデルの開発も進行中 はじめにこんにちは。ELYZAの研究開発チームの佐々木、中村、平川、堀江です。 この度ELYZAは、Metaの「Llama 2」をベースに、日本語による追加事前学習を行なった日本語言語モデル「ELYZA-japanese-Llama-2-7b」と、そこにELYZA独自の事後学習を施した「
今日はわりとシンプルかつ、日本のゲーマーのみなさんが気になる話をしようと思います。 ズバリ、Steamで遊びたいゲームに日本語対応してもらう方法とは!? 自分の遊びたいゲームが日本語に対応していなくて、悔しい気持ちになったことはありませんか? そんなみなさまに朗報、以下の3つを心掛ければ日本語に対応してくれる可能性は上がります。 遊びたいゲームがあったらウィッシュリスト登録をする Steamのゲームのページを友達にシェアする 発売済のゲームなら購入する これだけです。この積み重ねがスタジオや開発者の日本語への意識を変えます。私自身、マーケターとして多くのゲームに関わっていて実際に開発現場にもいますが、現場の感覚としてこれは間違いありません。 発売済みゲームの購入はハードルが高いかもしれませんが、ウィッシュリスト登録だけでも効果があります。 なぜなら、Steamに登録しているスタジオは、ダッ
ポイント Japanese Stable LM 2 1.6B(JSLM2 1.6B)は16億パラメータで学習した日本語の小型言語モデルです。 JSLM2 1.6Bのモデルサイズを16億パラメータという少量にすることによって、利用するために必要なハードウェアを小規模に抑えることが可能であり、より多くの開発者が生成AIのエコシステムに参加できるようにします。 ベースモデルとしてJapanese Stable LM 2 Base 1.6Bと、指示応答学習(Instruction tuning)済みのJapanese Stable LM 2 Instruct 1.6Bを提供します。両モデルともStability AI メンバーシップで商用利用が可能です。また、どちらのモデルもHugging Faceからダウンロードすることができます。 Japanese Stable LM 2 Base 1.6B
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く