タグ

ブックマーク / takeda25.hatenablog.jp (37)

  • まともな簡体字・繁体字変換 - アスペ日記

    まともな簡体字・繁体字変換(以下、簡繁変換)を作りました。*1 https://jfconv.netlify.app/ なぜ、 まともと言うのか? それは、簡繁変換というのは一対多変換であって、それを正しくできていない(しようともしていない)変換というのはまともではないからです。 まともでない簡繁変換 例えば、日語にもある単語で例を挙げると、「乾燥」「幹部」「干涉」というものがあります。 簡体字では「乾」「幹」は「干」になるので、これらは「干燥」「干部」「干涉」と書かれます。 これらを繁体字に変換すると、「乾燥」「幹部」「干涉」に戻ってほしいところです。 それが、「簡体字 繁体字 変換」と検索して上位に出てくるサイトでこれらを変換しても、だいたいうまくいきません。 あるサイトでは、「幹燥」「幹部」「幹涉」となります。「干→幹」という単純な置き換えしかしていないということです。 また、別の

    まともな簡体字・繁体字変換 - アスペ日記
    peketamin
    peketamin 2021/07/09
    “簡体字では「乾」「幹」は「干」になるので、これらは「干燥」「干部」「干涉」と書かれます。”
  • 志村けんのパラドックス - アスペ日記

    みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。— 森岡正博 (@Sukuitohananika) 2020年3月25日 このツイートと、 森岡正博 on Twitter: "みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。" ブコメがひどい。水曜日のダウンタウンとやらによれば志村けんは日の知名度ランキング15位。そんな人が感染してるなら、実際

    志村けんのパラドックス - アスペ日記
    peketamin
    peketamin 2020/03/28
  • はてなーはお願いだから自閉症についての理解を深めてくれ - アスペ日記

    この記事を読んだ。 【追記あり】僕は異常だ とにかくブコメがひどい。 「中二病だろ」の声一色*1だ。 例の記事を読んで、ぼくとしては「あー」という感じだった。 人間エミュレーションじゃん、と。 ぼくの人間関係には自閉傾向の人が多い。 ASDの診断を受けた人もいるし、自閉グレーだと言われた人、PDD(広汎性発達障害)と言われた人もいる。 そういう人間関係の中でよく使われる概念が「人間エミュレーション」だ。 ぼくは人を「自閉傾向のある人」と「それ以外」に分けていて、脳内やツイッターではそれらを「我々」「人間」と呼んでいる(これも、読む人によっては中二病だろう)。 そして、「我々」はそのままでは多数派の「人間」とうまくやっていけないので、エミュレータを動かしてそれで「人間」のふりをしている… というのが、「我々」の多く*2の世界観だ。 さて、元記事の人にかける言葉としては、「ASDについて調べて

    はてなーはお願いだから自閉症についての理解を深めてくれ - アスペ日記
    peketamin
    peketamin 2019/08/13
  • ぼくはこうやって(8年前)Googleに入った - アスペ日記

    入って1年ちょっとで辞めたぼくだが、流れに乗って書いてみる。 正直なところ、ぼくが書く意味はないと思った。 「どうやって」という話になると「入社試験を受けたら入れた」ということになるし、それはもう他の人が書いているからだ。 しかし、他の人の記事を見ているうちに、これならぼくが書けば違った視点からの記事が書けるんじゃないかと思った。 テーマは「光と影」。 ぼくの生い立ちを少し語る。 両親は京大卒。 父親は大学教授(最終的に)。 母親はぼくが2歳のときに統合失調症を発症、17歳のときに自殺。 子供は姉(2歳年上)とぼくの二人。 母親が統合失調症で病院に出たり入ったりしていたため、ぼくは家で姉と二人になることが多く、壮絶にいじめられた。 自閉的傾向が強かったぼくは、姉からしたら気持ち悪い存在だったんだろう。 その当時(ぼくは1974年生まれ)は自閉症なんて知られていなかった。 ぼくはどこからどう

    ぼくはこうやって(8年前)Googleに入った - アスペ日記
    peketamin
    peketamin 2019/04/02
  • ネイティブにとって重要な発音の違いを区別する - アスペ日記

    最近、"volatile" の発音についてのネタを Twitter で見ました。 「ヴォラタイル」はイギリス英語だとか、そういう話です。 確かにアメリカ英語では「ヴォラトゥル」のような発音が多いのですが、「ヴォラタイル」と読んでも「イギリス人か!」ということにはなりません。 アメリカ英語でも、どちらの発音もあります。 Wordreference.com の議論の中で、アメリカの人がこう言っています。 I would say that I more often hear the schwa for the last syllable of volatile -- but the long "i" is also common. まあ、仮に純然たるイギリス英語だったとしても、それの何が悪いんだという話ですが。 で、この話を見て感じたのは、「そんなネイティブにとってどうでもいいところを気にするよ

    ネイティブにとって重要な発音の違いを区別する - アスペ日記
    peketamin
    peketamin 2018/01/24
  • iOSの謎の単語と、それにまつわるデマ - アスペ日記

    (2018/01/15 追記) いつの間にか削除されていたようです。iOS 11.2.2で候補から消えていることを確認しました。 iOSで「レイプ」と入力しようとすると、変な候補が出てきます。 レイプアールサァン? いったいこれは何でしょうか。 「レイプアールサァン」でGoogle検索をすると、知恵袋が見つかり、その中で次のような回答がされています。 一つの可能性としては、変換辞書の盗用防止があります。 … もし「レイプアールサァン」が変換できたら、それはiOSの辞書の盗用だということになります。 なるほど、それっぽいですね…。 それが完全なデマだということを除けばね! では、この「レイプアールサァン」とは何なのか? キーとなる人物は、ツイッターの「たいぷあーる」(@HONDA_TYPER)氏です。 今でもバリバリ活動している人なので、こうやって取り上げるのは気が進まないのですが、デマがと

    iOSの謎の単語と、それにまつわるデマ - アスペ日記
    peketamin
    peketamin 2017/10/23
  • ちょまど氏をめぐる異常事態 - アスペ日記

    最近、Xamarinという製品についての勉強会で炎上騒動がありました。 初期の記事としては、以下のものがあります。 xamarinコミュニティの炎上について思うこと その後、主催者側や批判側からいろいろな記事が出て、泥沼の様相を呈していました。 以下はその例です。 JXUG 名古屋ハンズオンでの事実について 続ちょまど問題 これらの記事を見てもわかるように、ちょまど氏をめぐっては、アンチとファンが非常にはっきりと分かれています。 (アンチ・ファンというのは語弊がありますが、あえてこう書きます) どちらにも著名な人・技術的に優れた人がいるので、お互いに「あの人は技術的には尊敬できるのに、なんでこの問題ではあんななんだろう」と思うようなことも多いんじゃないでしょうか。 これは、はっきり言って異常事態だと思います。 一人の人間をめぐって、アンチとファンの間で分断が起こるということ自体、異常事態で

    ちょまど氏をめぐる異常事態 - アスペ日記
    peketamin
    peketamin 2016/12/05
  • 機械翻訳と意味 - アスペ日記

    ここ最近、Google翻訳がリニューアルされ、性能が向上したという話が流れてきたので、さっそく試してみた。 ぼくが真っ先に試したのは、「母は、父が誕生日を忘れたので、怒っている。」だ。 なぜこの文が気にかかっていたかは後述する。 結果は次の通り。 "My mother is angry because my father forgot her birthday." すばらしい。 では、「母は、父が鞄を忘れたので、怒っている。」はどうだろうか。 "My mother is angry because my father forgot his bag." 完璧だ! 「誕生日を忘れた」の場合は「母の誕生日」と解釈し、「鞄を忘れた」の場合は「父の鞄」と解釈する。 これこそ、利用者が翻訳に求めるものじゃないだろうか。 しかし、ここまでだった。 次にぼくは、「父」と「母」を入れ替え、「父は、母が誕生日

    機械翻訳と意味 - アスペ日記
    peketamin
    peketamin 2016/11/13
  • 翻訳の退場勧告 - アスペ日記

    SICPを訳し直したと、一年前の記事の善意のひどい訳についてに関して、はてな匿名ダイアリーのほうで言及していただきました。 翻訳は/誰がやっても/間違える (前編) 翻訳は/誰がやっても/間違える (後編) 誤訳の指摘ありがとうございます。 差し支えなければ追って反映したいと思いますが(反映について明示的に許可をいただければと思います)、まずはお礼を兼ねてお返事から。 また、タイトル575ありがとうございます。 77でお返しするのが礼儀かと思ったのですが、どうも思い浮かばず… 申し訳ありません。 ところで、匿名の方でお呼びしにくいので、増田*1という意味でMさんとお呼びしますね。 前もって申し上げますが、元記事にはごちゃごちゃした人間的な感情の絡む雑音的な部分も多いので、お返事できそうなところを自分でピックアップして回答しています。 「いや、ここも答えられるだろ」というところがあればご提示

    翻訳の退場勧告 - アスペ日記
    peketamin
    peketamin 2015/11/18
    うーん
  • 腐った翻訳に対する態度について - アスペ日記

    今回、SICPの翻訳改訂版を公開するにあたって、minghai氏の非公式日語版(以下、minghai氏版)については「惨憺たる翻訳」「そびえ立つクソの山」などと書きました。これらの言葉は、もちろん心からのものです。しかし、それを表に出すかどうかについては、冷静に考えた結果として意図的に選択したことも確かです。ここでは、その背景について書こうと思います。 約一年前、私が善意のひどい訳についてという記事を書いたとき、しぶかわよしき様から以下のコメントをいただきました。 趣味お金にならない翻訳だとだいたい最初の下訳で出しちゃいますね。だからといってそれが悪いことだとは思いません。英語を読まない人は言うまでもなく、英語を読める人でも「下訳」があれば原文を読む時にの速度は上がりますからね。クオリティに対して個人でできることといえば、指摘などで黙々と時間コストを代わりに負担するか、takeda2

    腐った翻訳に対する態度について - アスペ日記
    peketamin
    peketamin 2015/10/30
  • 非公式PDF版SICP・新訳 - アスペ日記

    計算機プログラムの構造と解釈、通称SICPを一から翻訳し直しました。 ファイル: SICP非公式日語版 翻訳改訂版 リポジトリ: https://github.com/hiroshi-manabe/sicp-pdf また、今回の翻訳をするにあたって考えたことを別記事にまとめました。 腐った翻訳に対する態度について SICPはMITの有名なプログラミングの教科書です。詳しくはminghai氏の記事をご参照ください。 この翻訳改訂版は、minghai氏の非公式日語版(以降、minghai氏版)のあまりにも惨憺たる翻訳を見かねて、原著から翻訳をし直したものです。この翻訳を進めるにあたっては、minghai氏版の訳を置き換えていくというやり方で進めていきました。しかし、差分を取ればわかっていただけると思いますが、minghai氏版のテキストは痕跡をとどめていないはずです。この方式を採ったのは、

    非公式PDF版SICP・新訳 - アスペ日記
  • 「許す」と「赦す」の件(みんな間違っている) - アスペ日記

    「シャルリー・エブド」誌の翻訳の問題がホットなようです。 銃撃の政治紙「すべては許される」と預言者風刺 「許す」と「赦す」 ―― 「シャルリー・エブド」誌が示す文化翻訳の問題 「許す」と「赦す」は同じ意味ですよ 私から見ると、みんな三者三様に間違っています。 (最初に書いておきますが、ここでは主に日語表記について述べ、シャルリー・エブド誌の表紙という題にはあまり触れません) 関口涼子氏の間違い まず、関口涼子氏の間違いから。 Tout est pardonnéを、「すべては許される」とすることで、この読みの多様性が全て消えてしまう。 もうすでにあちこちで指摘されていますが、「許す」は「赦す」を含んでいます。 現代日語で「許す」と「赦す」が排他的に使い分けられているなんていうことはありません。 で、こういうときには必ず、常用漢字(当用漢字)云々という人が出てきますが、それも誤解です。

    「許す」と「赦す」の件(みんな間違っている) - アスペ日記
  • 善意のひどい訳について - アスペ日記

    2014/10/14 追記: 補足記事を書きました。なぜ誤訳指摘をしたか ぼくは、ずっと昔から「ひどい翻訳」というものに憤りを感じてきた。 以前、別の記事に書いたこともある。 統計学を拓いた異才たちのようなひどい翻訳を見るたびに、どうして世の中からはこの手の悲劇がなくならないのかとため息が出る。 この前、またひどい翻訳を目にする機会があった。 C言語でプログラミングする際の覚書 ちょっと原文と比較すると致命的な誤訳がいくつも見つかる、最低クラスの翻訳だ。 やれやれと思いながら、翻訳のひどさを嘆くコメントをはてブに残して、ツイッターに流した。 pretty printers を優秀なプリンターと訳しているのを見て、これはちょっと手のつけようのない何かだと悟った / “C言語でプログラミングする際の覚書(Notes on Programming in C) - YAMAG…” URL 2014

    善意のひどい訳について - アスペ日記
    peketamin
    peketamin 2014/10/15
    コメント欄でとてもよい議論が読める
  • なぜ誤訳指摘をしたか - アスペ日記

    善意のひどい訳についてについての補足を書く。 まず、「なぜ指摘を公開でやったのか」ということから。 「アスペ日記」というタイトルで日記を書いてはいるけれど、「こんなふうに誤訳指摘したら気ぃ悪い(感じ悪い)*1よなぁ」ぐらいの感覚はぼくにもあった。 じゃあ、なぜそうしたか。 その理由を箇条書きしてみる。 この記事を書くことで、id:ymotongpoo さんの傷口に塩を塗るようなことになるかもしれないけれど、許してもらえればと思う。 1. 翻訳記事の読み方について考えるきっかけになると思った。 元記事は、ぼくが最初に見たときは100ブクマも行っていなかったと思うけれど、みるみるうちに伸びて、300ブクマを超えた。 あれだけ誤訳の多い記事が、ただ漫然と消費される様子に疑問を持った。 日語だけ読んでもおかしなところがある(指摘箇所を見てもらえばわかると思う)翻訳なのに、みんな適当に目を滑らせて

    なぜ誤訳指摘をしたか - アスペ日記
    peketamin
    peketamin 2014/10/15
  • C言語プログラミングの覚え書き(改訳) - アスペ日記

    原文: Notes on Programming in C Rob Pike 1989年2月21日 Copyright (C) 2003, Lucent Technologies Inc. and others. All Rights Reserved. Lucent Public License Version 1.02 前書き KernighanとPlaugerによる“The Elements of Programming Style” (「プログラム書法」木村泉訳)は重要で影響力のあるです。このにはそれだけの価値があります。しかし、その中の簡潔なルールが、来意図されたような哲学の簡潔な表現としてではなく、よいスタイルのレシピとして受け取られているように私は時々感じます。このが変数名は意味を持つようにつけられるべきだと言うなら、名前が使い方を説明するちょっとしたエッセイのような

    C言語プログラミングの覚え書き(改訳) - アスペ日記
    peketamin
    peketamin 2014/10/13
  • TeX の発音 - アスペ日記

    今さら、TeX の発音が話題になっているようです。 TeXはテック もう何度目だというぐらい目にしている気がするのですが、この問題は質的にややこしいのでどうしようもないですね。 この問題について書かれているページのひとつとして、以下のものがあります。 「TeX」の読み方はテフ、それともテック? これは非常に詳しく書かれていて、付け加えることなんてないようにも思えますが、ほかの言語の事情も含めて書いてみます。 まず、クヌース自身の書いていることから。 上記のページにある通り、彼は「TeXを知っている人は、TeXのχをxとは発音せず、ギリシャ語のchiのように発音する」と明確に書いています。 発音記号では [tex](「テッフ」のような音)となります。 この [tex] を正式発音と考えると話は簡単です。 いくつかの言語では、この正式発音をもとにして、それぞれの言語流の発音をしています。 ロ

    TeX の発音 - アスペ日記
    peketamin
    peketamin 2014/04/28
  • いい話(W社を辞めました) - アスペ日記

    (2015/09/01追記:この記事は私がW社に在籍した2013年4月から2014年4月までの間の個人的な経験に基づくものです。就職の参考にされる方は、その後W社の社風や開発者の扱いに変化があったかどうか等についてご自身で最新の情報を得ていただければと思います。) (2019/08/17追記:社名を「W社」に置換しました。) 記事タイトルの通り、W社を退職したので、退職エントリを書く。 (最近雑文に対していろいろと予防線を張ることが流行っているらしいので、一応これもポエムだと書いておく。役に立つことは書いていない) 今日が最終出社日だった。 ちょうど 1 年ぐらい勤めたことになる。 2 社連続で 1 年で辞めたことで、自分が社会不適合者であることが誰の目にも明らかになってしまった。 これから先の人生の見通しは暗い。 その間に子供が生まれたのだが、不憫でたまらない。 いい話というのは、Goo

    いい話(W社を辞めました) - アスペ日記
    peketamin
    peketamin 2014/04/07
    regexのくだり、多分お互いに「分かってねーなーこいつ」と思ってだだろうから、勉強不足の方に、これこれこうでこちらが保守性が高い、と説明出来ればいいのだろうが、強い上下関係には難しい…
  • プログラマの生産性と報酬 - アスペ日記

    追記: 続編を書きました。マッチョとの戦い 最近、プログラマの生産性が話題です。 いろんな意見があるものの、個人的には 10〜100倍の生産性の違いはあると思います。 いや、それは違う、生産性の高いエンジニアは生産性の低いエンジニアに作れないものが作れるのだからそういう話ではない、という意見もあります。 しかし、実際には生産性の低いエンジニアができもしないことをしようとして結局できないで終わるということがあったりしつつも、何らかの貢献をするというのが普通だと思いますので*1、最終的には 10〜100倍の違いといった形に落とし込めると思います。 で、この生産性の違いはどこから来るのか。 個人的には才能だと思っています。 ぼく自身は、自分のことを中間レベルのエンジニアだと認識しています。 平均の 3〜10 倍できて、トップより 3〜10 倍できないくらい。 でも、自分が平均から抜け出るために何

    プログラマの生産性と報酬 - アスペ日記
  • 「了解」は失礼か? - アスペ日記

    最近、「了解」は失礼だという説が出てきているようです。 どこの誰が言い出したのか知りませんが、ごく最近であることは確かです。 少し前のマナーには、そんなことは書いてありません。 たとえば、2003年のこれだけは知っておきたい! 改訂版 ビジネス・マナーハンドブックには、次のようにあります。 しかしそうしたルールができていない社外の人からのメールを受信したときには、「メール、受けとりました」「その件、了解しました」など、簡単でよいからすぐに返信し、… また、2005年の「こんなことも知らないの? 大人のマナー常識513」というマナーには、次のような記述があります。 内容に疑問のあるときにはその点を記して送信しますが、そうでなければ「メール拝見しました。○○の件は了解しました」などと簡単な返信でかまいません。 しかし、2008年の「信頼される社会人へのパスポート敬語検定」*1には、次のよう

    「了解」は失礼か? - アスペ日記
    peketamin
    peketamin 2014/02/09
    承知使いにくい!拝承の方が全然使えるし!
  • 完備辞書(簡潔ビットベクトル)の解説 - アスペ日記

    以前、「簡潔データ構造 LOUDS の解説」というシリーズの記事を書いたことがあります。 LOUDS というのは木構造やtrieを簡潔に表すことができるデータ構造なのですが、この中で「簡潔ビットベクトル」というものについてはブラックボックスとして扱っていました。 また、中学生にもわかるウェーブレット行列を書いたときも、その中で出てきた「完備辞書」の実装には触れませんでした。 この「簡潔ビットベクトル」「完備辞書」は、同じものを指しています*1。 今回は、このデータ構造*2について書いてみます。 完備辞書でできること ビット列に対する定数時間の rank と selectです*3。 rank()は、「ビット列の先頭から位置 k までに、1 のビットがいくつあるか」*4。 select()は、「ビット列の先頭から見て、n 個目の 1 のビットの次の位置はどこか」*5。 それぞれ例を挙げます。

    完備辞書(簡潔ビットベクトル)の解説 - アスペ日記