ブックマーク / takeda25.hatenablog.jp (41)

  • まともな簡体字・繁体字変換 - アスペ日記

    まともな簡体字・繁体字変換(以下、簡繁変換)を作りました。*1 https://jfconv.netlify.app/ なぜ、 まともと言うのか? それは、簡繁変換というのは一対多変換であって、それを正しくできていない(しようともしていない)変換というのはまともではないからです。 まともでない簡繁変換 例えば、日語にもある単語で例を挙げると、「乾燥」「幹部」「干涉」というものがあります。 簡体字では「乾」「幹」は「干」になるので、これらは「干燥」「干部」「干涉」と書かれます。 これらを繁体字に変換すると、「乾燥」「幹部」「干涉」に戻ってほしいところです。 それが、「簡体字 繁体字 変換」と検索して上位に出てくるサイトでこれらを変換しても、だいたいうまくいきません。 あるサイトでは、「幹燥」「幹部」「幹涉」となります。「干→幹」という単純な置き換えしかしていないということです。 また、別の

    まともな簡体字・繁体字変換 - アスペ日記
  • DeepL翻訳を修正するということ - アスペ日記

    ポール・グレアム "What I Worked On" の翻訳の補足記事です。 ポール・グレアムの長編エッセイ「私が取り組んだこと」を翻訳するにあたって、DeepLの翻訳結果をベースに編集しました。 この記事では、DeepLの誤訳箇所とその修正について書いてみます。 DeepLの翻訳と私の最終版の差分は、GitHubのdiff("Load diff"を押す必要があります)で見ることができます。 こうして見ると、かなり差分が少ないことがわかります。多くの修正は些細な変更ですし、手を加えなかった段落もあります。機械翻訳がここまで来ているというのはすごいことです。 それでも、元の翻訳では、いくつかの誤訳が重要なところを台無しにしてしまっています。ここでは、それらのポイントを見ていきます。 It seemed only a matter of time before we'd have Mike,

    DeepL翻訳を修正するということ - アスペ日記
  • 誰でもいい「からこそ」弱い相手を狙うという話 - アスペ日記

    「『誰でもよかった』という犯罪者は実際には弱い相手を選んでいる」みたいなやつあるじゃないですか。 あれ、誰でもいい「からこそ」弱い相手を選ぶんですよ、という話です。 ちょっと想像してみましょう。 ある日、宇宙から電波が届いて、あなたに「何でもいいから生き物を殺したい」という強い衝動が生まれたとします。 もう、めっちゃ殺したくて、いても立ってもいられない。 さて、次の二つのうちで選ぶなら、あなたはどうしますか? 1. アリを探して踏み潰す 2. 動物園を探してライオンを殺す そりゃ、1ですよね。 生き物なら何でもいいので、簡単なほうを殺すに決まっています。 次に、「何でもいいから哺乳類を殺したい」という強い衝動が降ってきたとします。 もう指が震えるぐらい。 さて、次の二つでは、あなたはどちらを選びますか? 1. 震える指で「 たまり場」と検索して、野良を何とか捕まえて殺して、人目を忍んで

    誰でもいい「からこそ」弱い相手を狙うという話 - アスペ日記
  • 宇崎ちゃん問題についての派閥分け - アスペ日記

    この話題、いろんな論点が混乱していてひどいことになってますよね。 ちょっと整理してみようと思います。 以下の6点について。 法律について 環境型セクハラ 献血が増えたらいいのか 宇崎ちゃんについて 献血の場でのライン 国ごとの性表現規制 法律について まず、現状として、「わいせつ物頒布等の罪」というのがあり、性表現は完全に自由ではありません。 この点について考えていきます。 性表現は自由だよ派 表現規制に一切反対という人もいるでしょう。 現状の法律(+判例)による規制も間違っている、ゾーニングも一切不要、という立場です。 一例として、「渋谷の大型ディスプレイで無修正AVを流す」というのもありということになります。 この派閥は、「渋谷の大型ディスプレイで無修正AV流してもいいよ派」と分類します。 (こんな感じで、派閥について端的な言葉で言い換えたり言い換えなかったりしていきます) この派閥の

    宇崎ちゃん問題についての派閥分け - アスペ日記
  • 青春→鯖鰆みたいなやつ - アスペ日記

    今日、こんなツイートを見かけました。 娘1のクラスの寄せ書き、「楽しかったよ」「また会おうね」が多い中、キラリとひかる名文発見。「青春って魚編をつけると鯖鰆(サバサワラ)って読めるよね。似たような熟語を見つけたら教えて」By 町田高史(仮名) 彼が無事に社会に適応できますように。— 藤川オレンジーナ (@Forangina) 2017年3月21日 ぼくもこういうのは大好きです。 (社会に適応できているかどうかは微妙なところです) それで、こういうのを探してみることにしました。 漢字の構造については、漢字構造情報データベース(CHISE)というものがあります。 (かなりの労力がかかっていると思われるデータベースです。作られた方に感謝します。) 今回は、これを使わせていただきます。 % git clone http://git.chise.org/git/chise/ids.git この中の

    青春→鯖鰆みたいなやつ - アスペ日記
  • ちょまど氏をめぐる異常事態 - アスペ日記

    最近、Xamarinという製品についての勉強会で炎上騒動がありました。 初期の記事としては、以下のものがあります。 xamarinコミュニティの炎上について思うこと その後、主催者側や批判側からいろいろな記事が出て、泥沼の様相を呈していました。 以下はその例です。 JXUG 名古屋ハンズオンでの事実について 続ちょまど問題 これらの記事を見てもわかるように、ちょまど氏をめぐっては、アンチとファンが非常にはっきりと分かれています。 (アンチ・ファンというのは語弊がありますが、あえてこう書きます) どちらにも著名な人・技術的に優れた人がいるので、お互いに「あの人は技術的には尊敬できるのに、なんでこの問題ではあんななんだろう」と思うようなことも多いんじゃないでしょうか。 これは、はっきり言って異常事態だと思います。 一人の人間をめぐって、アンチとファンの間で分断が起こるということ自体、異常事態で

    ちょまど氏をめぐる異常事態 - アスペ日記
  • 機械翻訳は自動織機ではなくチェーンソーであるという話と、その帰結 - アスペ日記

    先日、機械翻訳と意味という記事を書きましたが、それ以降も新Google翻訳の精度向上はあちこちで話題になっています*1。 新Google翻訳を使って3700ワードの技術文書を1時間で翻訳した Google翻訳の強化でもっとも得するのは翻訳家という妙 共通して述べられているのは、「新Google翻訳の精度が下訳に使えるレベルになった」「新Google翻訳は、翻訳家にとって大きな助けになる」ということです。 さて、この記事を読む人であれば、ラッダイト運動というものについて聞いたことがある人も多いかと思います。 この運動は、機械によって雇用を奪われた手工業者が起こした機械破壊運動なのですが、このときに対象となった機械は、自動織機のような、人手を置き換えるタイプの機械でした。 それに対して、機械翻訳は、人間の能力を拡張(エンハンス)するタイプのものです。 人間の翻訳家を置き換えるものではなく、翻訳

    機械翻訳は自動織機ではなくチェーンソーであるという話と、その帰結 - アスペ日記
  • 機械翻訳と意味 - アスペ日記

    ここ最近、Google翻訳がリニューアルされ、性能が向上したという話が流れてきたので、さっそく試してみた。 ぼくが真っ先に試したのは、「母は、父が誕生日を忘れたので、怒っている。」だ。 なぜこの文が気にかかっていたかは後述する。 結果は次の通り。 "My mother is angry because my father forgot her birthday." すばらしい。 では、「母は、父が鞄を忘れたので、怒っている。」はどうだろうか。 "My mother is angry because my father forgot his bag." 完璧だ! 「誕生日を忘れた」の場合は「母の誕生日」と解釈し、「鞄を忘れた」の場合は「父の鞄」と解釈する。 これこそ、利用者が翻訳に求めるものじゃないだろうか。 しかし、ここまでだった。 次にぼくは、「父」と「母」を入れ替え、「父は、母が誕生日

    機械翻訳と意味 - アスペ日記
  • 翻訳の退場勧告 - アスペ日記

    SICPを訳し直したと、一年前の記事の善意のひどい訳についてに関して、はてな匿名ダイアリーのほうで言及していただきました。 翻訳は/誰がやっても/間違える (前編) 翻訳は/誰がやっても/間違える (後編) 誤訳の指摘ありがとうございます。 差し支えなければ追って反映したいと思いますが(反映について明示的に許可をいただければと思います)、まずはお礼を兼ねてお返事から。 また、タイトル575ありがとうございます。 77でお返しするのが礼儀かと思ったのですが、どうも思い浮かばず… 申し訳ありません。 ところで、匿名の方でお呼びしにくいので、増田*1という意味でMさんとお呼びしますね。 前もって申し上げますが、元記事にはごちゃごちゃした人間的な感情の絡む雑音的な部分も多いので、お返事できそうなところを自分でピックアップして回答しています。 「いや、ここも答えられるだろ」というところがあればご提示

    翻訳の退場勧告 - アスペ日記
  • 非公式PDF版SICP・新訳 - アスペ日記

    計算機プログラムの構造と解釈、通称SICPを一から翻訳し直しました。 ファイル: SICP非公式日語版 翻訳改訂版 リポジトリ: https://github.com/hiroshi-manabe/sicp-pdf また、今回の翻訳をするにあたって考えたことを別記事にまとめました。 腐った翻訳に対する態度について SICPはMITの有名なプログラミングの教科書です。詳しくはminghai氏の記事をご参照ください。 この翻訳改訂版は、minghai氏の非公式日語版(以降、minghai氏版)のあまりにも惨憺たる翻訳を見かねて、原著から翻訳をし直したものです。この翻訳を進めるにあたっては、minghai氏版の訳を置き換えていくというやり方で進めていきました。しかし、差分を取ればわかっていただけると思いますが、minghai氏版のテキストは痕跡をとどめていないはずです。この方式を採ったのは、

    非公式PDF版SICP・新訳 - アスペ日記
  • 「許す」と「赦す」の件(みんな間違っている) - アスペ日記

    「シャルリー・エブド」誌の翻訳の問題がホットなようです。 銃撃の政治紙「すべては許される」と預言者風刺 「許す」と「赦す」 ―― 「シャルリー・エブド」誌が示す文化翻訳の問題 「許す」と「赦す」は同じ意味ですよ 私から見ると、みんな三者三様に間違っています。 (最初に書いておきますが、ここでは主に日語表記について述べ、シャルリー・エブド誌の表紙という題にはあまり触れません) 関口涼子氏の間違い まず、関口涼子氏の間違いから。 Tout est pardonnéを、「すべては許される」とすることで、この読みの多様性が全て消えてしまう。 もうすでにあちこちで指摘されていますが、「許す」は「赦す」を含んでいます。 現代日語で「許す」と「赦す」が排他的に使い分けられているなんていうことはありません。 で、こういうときには必ず、常用漢字(当用漢字)云々という人が出てきますが、それも誤解です。

    「許す」と「赦す」の件(みんな間違っている) - アスペ日記
  • 「C言語でプログラミングする際の覚書」の誤訳箇所 - アスペ日記

    ここでは、C言語でプログラミングする際の覚書の誤訳を列挙します。 参考として、私の翻訳はC言語プログラミングの覚え書き(改訳)にあります。 What follows is ... ×従うべきは ○これから述べるのは "What follows" で「続くもの」という意味です。ここでの「続く」というのは、現在の文章に続く、つまり「以下に述べること」です。 But they've been accumulating in my head, if not on paper until now, for a long time, ... ×しかし、私の意見は頭のなかにしばらくあったものをまとめたものであり、長らく文章として公開してきませんでした。 ○しかし、これらのことは、文書として書いたことはありませんでしたが、私の頭の中に長い時間をかけて蓄積してきたもので、… "if not on paper

    「C言語でプログラミングする際の覚書」の誤訳箇所 - アスペ日記
  • なぜ誤訳指摘をしたか - アスペ日記

    善意のひどい訳についてについての補足を書く。 まず、「なぜ指摘を公開でやったのか」ということから。 「アスペ日記」というタイトルで日記を書いてはいるけれど、「こんなふうに誤訳指摘したら気ぃ悪い(感じ悪い)*1よなぁ」ぐらいの感覚はぼくにもあった。 じゃあ、なぜそうしたか。 その理由を箇条書きしてみる。 この記事を書くことで、id:ymotongpoo さんの傷口に塩を塗るようなことになるかもしれないけれど、許してもらえればと思う。 1. 翻訳記事の読み方について考えるきっかけになると思った。 元記事は、ぼくが最初に見たときは100ブクマも行っていなかったと思うけれど、みるみるうちに伸びて、300ブクマを超えた。 あれだけ誤訳の多い記事が、ただ漫然と消費される様子に疑問を持った。 日語だけ読んでもおかしなところがある(指摘箇所を見てもらえばわかると思う)翻訳なのに、みんな適当に目を滑らせて

    なぜ誤訳指摘をしたか - アスペ日記
  • C言語プログラミングの覚え書き(改訳) - アスペ日記

    原文: Notes on Programming in C Rob Pike 1989年2月21日 Copyright (C) 2003, Lucent Technologies Inc. and others. All Rights Reserved. Lucent Public License Version 1.02 前書き KernighanとPlaugerによる“The Elements of Programming Style” (「プログラム書法」木村泉訳)は重要で影響力のあるです。このにはそれだけの価値があります。しかし、その中の簡潔なルールが、来意図されたような哲学の簡潔な表現としてではなく、よいスタイルのレシピとして受け取られているように私は時々感じます。このが変数名は意味を持つようにつけられるべきだと言うなら、名前が使い方を説明するちょっとしたエッセイのような

    C言語プログラミングの覚え書き(改訳) - アスペ日記
  • 善意のひどい訳について - アスペ日記

    2014/10/14 追記: 補足記事を書きました。なぜ誤訳指摘をしたか ぼくは、ずっと昔から「ひどい翻訳」というものに憤りを感じてきた。 以前、別の記事に書いたこともある。 統計学を拓いた異才たちのようなひどい翻訳を見るたびに、どうして世の中からはこの手の悲劇がなくならないのかとため息が出る。 この前、またひどい翻訳を目にする機会があった。 C言語でプログラミングする際の覚書 ちょっと原文と比較すると致命的な誤訳がいくつも見つかる、最低クラスの翻訳だ。 やれやれと思いながら、翻訳のひどさを嘆くコメントをはてブに残して、ツイッターに流した。 pretty printers を優秀なプリンターと訳しているのを見て、これはちょっと手のつけようのない何かだと悟った / “C言語でプログラミングする際の覚書(Notes on Programming in C) - YAMAG…” URL 2014

    善意のひどい訳について - アスペ日記
  • 「履く」と「穿く」が面倒なことになったいきさつ - アスペ日記

    ズボンやを「はく」というのは、どう書くか。*1 ご存じの方は多いと思いますが、これはけっこうやっかいな問題なんですよね。 もっとも、「あ、これ正解知ってる」という人もいるでしょう。 ズボン・スカートは「穿く」で、は「履く」でしょ、と。 ここで、「じゃあ、下は?」となると、問題が急に面倒になります。 というのは、下を「はく」をどう書くかについては、辞書によって主張が分かれているからです。 国語辞典 調べてみたところ、下を「履く」派と「穿く」派の辞書は、以下のようになっていました。 「履く」派: 広辞苑、大辞泉、大辞林、新明解*2 「穿く」派: 三省堂国語辞典、明鏡、旺文社国語辞典、角川国語辞典、集英社国語辞典 かなり拮抗していますね。 でも、この問題が複雑になったのはどうしてなんだろうというのが、私にとっては前から疑問でした。 というのは、漢字の意味、つまり中国語での意味を考えると

  • プログラマの生産性と報酬 - アスペ日記

    追記: 続編を書きました。マッチョとの戦い 最近、プログラマの生産性が話題です。 いろんな意見があるものの、個人的には 10〜100倍の生産性の違いはあると思います。 いや、それは違う、生産性の高いエンジニアは生産性の低いエンジニアに作れないものが作れるのだからそういう話ではない、という意見もあります。 しかし、実際には生産性の低いエンジニアができもしないことをしようとして結局できないで終わるということがあったりしつつも、何らかの貢献をするというのが普通だと思いますので*1、最終的には 10〜100倍の違いといった形に落とし込めると思います。 で、この生産性の違いはどこから来るのか。 個人的には才能だと思っています。 ぼく自身は、自分のことを中間レベルのエンジニアだと認識しています。 平均の 3〜10 倍できて、トップより 3〜10 倍できないくらい。 でも、自分が平均から抜け出るために何

    プログラマの生産性と報酬 - アスペ日記
  • 「了解」は失礼か? - アスペ日記

    最近、「了解」は失礼だという説が出てきているようです。 どこの誰が言い出したのか知りませんが、ごく最近であることは確かです。 少し前のマナーには、そんなことは書いてありません。 たとえば、2003年のこれだけは知っておきたい! 改訂版 ビジネス・マナーハンドブックには、次のようにあります。 しかしそうしたルールができていない社外の人からのメールを受信したときには、「メール、受けとりました」「その件、了解しました」など、簡単でよいからすぐに返信し、… また、2005年の「こんなことも知らないの? 大人のマナー常識513」というマナーには、次のような記述があります。 内容に疑問のあるときにはその点を記して送信しますが、そうでなければ「メール拝見しました。○○の件は了解しました」などと簡単な返信でかまいません。 しかし、2008年の「信頼される社会人へのパスポート敬語検定」*1には、次のよう

    「了解」は失礼か? - アスペ日記
  • Googleのヒット件数は当てにならない - アスペ日記

    (2013/11/08: 補足を書きました。Googleのヒット件数について(続き)) 「Googleの検索件数は当てにならない」と言うと、多くの人は「何をいまさら」という反応かもしれません。 当てにならないことぐらいわかってるよ、と。 でも、「当てにならない」でイメージするものがどの程度かは人によって違うと思います。 結果が2倍ぐらい違ったりする、程度に思っている人もいるかもしれません。 しかし、実際はそんなレベルでの話ではありません。 「当は50件なのに500,000件と返ってくる」ようなことも珍しくありません。 たとえば、ツイッターで見たネタなのですが、"無い内定式" というキーワードで検索してみます。 267,000件。 多いですね。 ここで、10ページ目をクリックすると、次のようになります。 「59 件中 6 ページ目」*1 一気に4桁も減ってしまいました。 どちらが当の数字

    Googleのヒット件数は当てにならない - アスペ日記
  • 英語学習には「オーディオブック」がお勧め - アスペ日記

    受験英語の不幸で書いたようなことを踏まえたうえで、ぼくの個人的なお勧めの勉強方法は「児童書のオーディオブック」。 児童書のオーディオブックには、そこで挙げたようなポイントを押さえて勉強するのにいいところが揃っている。 まず、子供向けのにはネイティブから見て難しい単語が少ない。 低いレベルから始めるのにはちょうどいい。 (中には「ネイティブから見ると基的な単語だけど、外国語学習者としてはいまいち使いどころがない」という単語もあるけれど) 次に、オーディオブックは「聞く」力を重点的につけられる。 もちろん「話す」も重要だけど、これだけは相手がいないとどうにもならない。 独学でやるには、まずは「聞く」ことから始めるのがいいと思う。 さらに、オーディオブックは密度が高い。 映画やドラマを見るという方法もあるし、そちらのほうが向いているという人も多いだろうけど、映像作品は「間」が多く、会話のパー

    英語学習には「オーディオブック」がお勧め - アスペ日記