タグ

developmentとlanguageに関するlepton9のブックマーク (13)

  • Prompt Engineering Guide – Nextra

    Prompt Engineering Guide プロンプトエンジニアリングは、言語モデル(LMs)を効率的に使用するためのプロンプトを開発および最適化する比較的新しい学問分野です。プロンプトエンジニアリングのスキルを身につけることで、大規模言語モデル(LLMs)の能力と限界をより理解することができます。 研究者は、プロンプトエンジニアリングを使用して、質問応答や算術推論などの一般的なおよび複雑なタスクのLLMsの能力を向上させます。開発者は、LLMsやその他のツールとのインタフェースとなる強固で効果的なプロンプテクニックを設計するためにプロンプトエンジニアリングを使用します。 プロンプトエンジニアリングは、プロンプトの設計と開発に限らず、LLMsとのインタラクションおよび開発に役立つ幅広いスキルと技術を含みます。これは、LLMsとインタフェースすること、ビルドすること、能力を理解すること

  • Your code displays Japanese wrong

    A static site to link people to when their code is displaying Japanese wrong. View the Project on GitHub heistak/your-code-displays-japanese-wrong Why am I here? If someone gave you a link to this page, that person probably thinks your code displays Japanese wrong. In short, from a native Japanese eye, yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs. This page will give you a brief description of the glyph appe

  • はてブの闇を可視化してみた - 坂本から君へ

    三ヶ月ほど前に僕が「作ります!」と宣言していた、はてブホッテントリの感情分析サイトだが、ようやく完成したので公開したいと思う。 hotentry-sa.appspot.com このサイトでできること はてなブックマークのホッテントリ内の各エントリーについた全てのブクマコメントを解析して、感情的なネガティブ度・ポジティブ度を算出して表示している。 次の3種類の分析結果が表示できるようになっている。 闇ホッテントリ⇒ネガティブなコメントの多いエントリを順に表示する。 きれいなホッテントリ⇒ポジティブなコメントの多いエントリを順に表示する。 揺れホッテントリ⇒ネガティブとポジティブの間の揺れ幅が大きい、つまり賛否両論の激しいエントリを順に表示する。 サイトが出来上がるまでの経緯 今年の始めにネットのどこかのサイトを覗いていたら、グーグルが自然言語処理に関するWebAPIを提供しているということを

    はてブの闇を可視化してみた - 坂本から君へ
  • ソフトウェア・グローバリゼーション入門  I18NとL10Nを理解する

    世界で使われるソフトウェアを作るには、国際化(Internationalization, I18N)+地域化(Localization, L10N)が欠かせません。書はアジャイル時代に対応したソフトウェアのグローバリゼーション(G11N)について、その基から開発プロセス・具体的な手法やツールまで、G11Nの全体を解説します。 関連サイト書の関連ページが用意されています。 西野竜太郎書籍サポート内容紹介Webアプリケーションやスマートフォンが広く使われる現在、世界中で使われるソフトウェアを開発・配布するための障壁は薄まりつつあります。しかしながら、多くの人たちに使ってもらうには、さまざまな言語や文化に対応した、グローバルなソフトウェアを開発しなければなりません。 書はソフトウェア開発におけるグローバリゼーション(Globalization, G11N)についてのです。グローバルなソ

    ソフトウェア・グローバリゼーション入門  I18NとL10Nを理解する
  • 見えてきたC# 7: C#の短期リリースサイクル化

    C# 7にはどんな新機能が含まれるのかが見えてきた。これまでと比べて、C# 7はかなり速いペースでのリリースとなる。その背景にはどんな事情があるのだろうか。 ← 前回 連載 INDEX 次回 → 次期C#として提案されている機能のうち、どこまでをC# 7としてリリースするかが決まってきた。リリース時期は明示していないものの、今このタイミングで機能を決めたということは、今年中のリリースもあり得るだろう。 これまでのC#のリリースサイクルからすると、少し短くなっている。また、新規追加する機能を小さめに区切っている。今回はこのリリースサイクルの短縮についての話をしていこう。 C# 7 C# 7/VB 15(Visual Basic 15)に実装される予定の機能は以下のページにまとまっている。 Language Feature Status これで確定というわけではないが、変更は細々としたものにと

  • エンジニア・Webデザイナー必読: アプリケーションを国際化・多言語展開する前に知っておくべきこと - Qiita

    ちょろっとメモ。の割には長くなったけど、最後の方にいいことが書いてある。 ※技術英語や翻訳 Advent Calendar 2015に参加してみました。スレ違いだったらすみません。 追記: taka-oyamaさんの記事「多国対応ウェブアプリを開発する前に知っておきたかったこと」も参考になります。 追記: 「17ヶ国の多言語対応Tips」で当記事を紹介いただきました。素晴らしいスライドです。 追記: 「当にあった怖い誤訳」によると、今でも機械翻訳をそのままウェブページで使っている自治体があるそうです。怖す。 追記: ぼくたちのかんがえたさいきょうのi18n国家 - Qiitaもどうぞ。 概要 Web アプリやモバイルアプリを問わず、アプリで当てたらそれ英語化だ多言語化だ国際化だ、となることは多い。しかしアプリの作りなどさまざまな原因によって、他所の国の言葉に翻訳してもらっても実は現地の人

    エンジニア・Webデザイナー必読: アプリケーションを国際化・多言語展開する前に知っておくべきこと - Qiita
  • オープンソース版Google日本語入力をビルドしてみよう

    キタコレ!!!! Google 日本語入力 Android 版がオープンソースになりました。 – Google Japan Developer Relations Blog 以下の情報は 2013/3/29 現在の情報です。 なにはともあれ ubuntu です。今回は 12.10 64bit 版でやってみよう。 Download Ubuntu desktop, Ubuntu Server, Ubuntu for Raspberry Pi and IoT devices, Ubuntu Core and all the Ubuntu flavours. Ubuntu is an open-source software platform that runs everywhere from the PC to the server and the cloud.

    オープンソース版Google日本語入力をビルドしてみよう
  • Unicode 内のそれぞれの文字種の範囲 - みちのぶのねぐら 工作室 旧館

    郵便番号データを利用するサンプル を作っている最中に気になって、ひらがな、カタカナなどの文字種の Unicode の文字コードの範囲を調べました。 資料として http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/SHIFTJIS.TXT を使います。 “OBSOLETE” となっていますが参考にはなります。これを表計算のシートに貼り付けて Unicode 順に並べ替えるとわかりやすいです。以下の説明には unicode.org の対応する “Code Charts” の URL も記しておきましたので、個別の字面とコード値の確認のためにご参照ください。

    lepton9
    lepton9 2012/11/05
    unicode, shift_jis
  • 日本語と文字コード

    コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基単位として扱う前提で作られているものが中心です。そのなかで日語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日語の文字コードに関する基を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

    lepton9
    lepton9 2011/08/01
  • ISO-8859-1の拡張ascii文字 » Supper's Ready

    覚え書きっつーか、よそに掲載されていたテーブルなんだけど、残ってるのはキャッシュだけで、家は消えてしまっていたので仕方なく、そのままコピって貼り付けておくことにする。ちなみに実体参照の欄の&は、全角になっている。なぜなら半角にすると、WordPressが勝手に文字に変換してしまうからorz いらねえことすんなよ、まったくもう… ISO-8859-1の拡張ascii文字 文字 16進数での表現 10進数 文字実体参照 意味

  • (基礎|変態)文法最速マスターシリーズのまとめ - gifnksmの雑多なメモ

    数が増えてきたので別記事に分けてみました。分類は超テキトーです。変態文法シリーズも足してみました。 手続き型言語 汎用スクリプト言語 Perl Perl基礎文法最速マスター - サンプルコードによるPerl入門 Perlオブジェクト基礎文法最速マスター - 燈明日記 Moose & Mouse基文法最速マスター/The Fastest Way to Mastering Moose & Mouse - perl-mongers.org Ruby Ruby基礎文法最速マスター - Route 477 Rails基礎文法最速マスター - cod.note PHP PHP基礎文法最速マスター - Shin x blog php変態文法最速マスター - milieuの日記 Python基礎文法最速マスター - LazyLife@Diary VBScript 基礎文法最速マスター - CX's VB

    (基礎|変態)文法最速マスターシリーズのまとめ - gifnksmの雑多なメモ
  • iPhoneアプリ多言語化注意点 | fladdict

    多言語対応のiPhoneアプリをリリースしたとき、アンドキュメント気味な地雷があったのでメモ。 多言語対応のアプリの場合、iPhoneで設定した言語設定がない場合、第二プライオリティの言語が代替で自動選択される。ところが、どうもヨーロッパ系のiPhoneでは代替言語のプライオリティとして、日語のほうが英語より高い場合があるみたい。 そうすると、その国の言語に対応していない場合、英語が出てほしいのにUIやメッセージが全て日語になってしまう罠っぽい現象が。 まだ詳しい現象の見極め、必ず日語のプライオリティが英語より高いのか?とか、どの国でそうなのか?ということが絞り込めていないのだけど、とりあえずそういう現象が珠にリポートされてくる。 <追記> 手元のiPhoneだと、iPhoneの「設定」アプリから、どんなに言語設定を変更してもEnglishが必ず2番目のプライオリティになる。ところが

  • エブログ JavaScript で形態素解析もどき

    JavaScript形態素解析もどき JavaScript形態素解析のようなものを。 totonの日記 - すべての漢字を取り出す正規表現 「すべての漢字を取り出す正規表現」をPHPで試す:phpspot開発日誌 これらの記事を参考にして JavaScript で漢字、ひらがな、カタカナ、英数字に区切ることをしています。 ただ、文字コード的にちゃんとできるのか、よくわかりません。Seesaa はShift_jis なのでおかしくなる場合もあるかも知れないです。 下のテキストエリアに文章を入力して解析ボタンを押すと解析結果が表示されます。解析というか、単純に改行で区切っているだけですが。 サンプルは青空文庫の太宰治 走れメロスの冒頭部分。 メロスは激怒した。必ず、かの邪智暴虐(じゃちぼうぎゃく)の王を除かなければならぬと決意した。メロスには政治がわからぬ。メロスは、村の牧人である。笛

    エブログ JavaScript で形態素解析もどき
  • 1