並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 6916件

新着順 人気順

文字コードの検索結果361 - 400 件 / 6916件

  • 超入門SQL 初心者でも理解できるCOUNT()とSUM() ─ グルーピングと集約関数の基本|ハイクラス転職・求人情報サイト AMBI(アンビ)

    超入門SQL 初心者でも理解できるCOUNT()とSUM() ─ グルーピングと集約関数の基本 以前に掲載して好評を博している「SQL入門」の続編です。前回は基本的なSELECT文を解説しましたが、今回は簡単な集計に挑戦してみます。執筆は前回と同じく、日本MySQLユーザ会副代表の坂井恵さんです。 社内に蓄積された大量のデータを、エンジニア以外のスタッフが自分の手で抽出し、集計できる環境を手にする機会も増えてきました。ビジネスの現場にいるメンバーが、自らSQLを使用してデータ操作を行うことができれば、ほしい情報をスピーディーに利用できます。この記事ではそういった「エンジニアではないがSQLを利用できる環境にいる」方に向けて、SQLの便利な集計操作をいろいろと紹介していきます。 集計の基本: COUNT(*)関数で件数を取得する SQLの集計処理入門: GROUP BYによるグルーピング グ

      超入門SQL 初心者でも理解できるCOUNT()とSUM() ─ グルーピングと集約関数の基本|ハイクラス転職・求人情報サイト AMBI(アンビ)
    • 10年放置されたレガシーコードをモダン化する | BLOG - DeNA Engineering

      ゲーム事業部の酒井です。 今年DeNAのMobageは15周年を迎えます。同時にそれを支えてきた技術にも15年の歴史があることになります。サービスを構成しているさまざまな技術は、そのときどきの事情やトレンドによって適切に更新・メンテナンスしながら運用されてきました。 一方でサービスを構成する重要なコンポーネントであるにもかかわらず、多様な理由から長らくメンテナンスもされず、現場から忘れ去られてしまったものも存在します。実際Mobageのサービスのひとつ「アバター」にそのようなコンポーネントがあり、それがあることをきっかけにサービスの存続に関わる問題としてにわかに噴出するということがありました。 そのため該当コンポーネントのコードをアップグレードし、かつ今後は誰でもメンテナンスができるようビルド環境の再整備を行いました。今回はこの実例をもとに、レガシーコードをモダン化した試みを紹介します。

        10年放置されたレガシーコードをモダン化する | BLOG - DeNA Engineering
      • Macで濁点とかが起こす文字化け問題について

        B! 24 0 0 0 Macの中でGNU screenなどを立ち上げると文字化けすることがありますが、 その辺の問題についてのメモ。 Macでの文字化け問題 問題の確認 Windowsでの文字化け問題 HomebrewでインストールするGNU screenの文字化け対策 Macでの文字化け問題 Macの中でGNU screenを立ち上げたらファイル名の表示などが文字化けしたりすることがあります。 殆どの場合は日本語ファイル名で濁点を使ってる場合で、文字コードの問題です。 ただ、単純にUTF-8かShift_JISか、とかそういったものではなく、濁点や半濁点の扱いの特殊さによります。 MacではFinderでもターミナル上でも基本的にUTF-8で文字を扱いますが、 UTF-8の中でもいくつか文字の取り扱いに対して違うものが存在します。 FinderではNFD(Normalization F

        • DBMで単語辞書を作ろう - 豪鬼メモ

          データベースマネージャTkrzwを無事にリリースしたはよいが、ドッグフードは自分で食わないといけない。DBMを作るとまず最初にやりたくなるのが、それを使った単語辞書を作ることである。仕事柄、英和辞書と和英辞書はよく使うのだが、自分で作ったものを毎日便利に使っている。時間効率と空間効率に優れたDBMは辞書データを扱うのにうってつけだ。ということで、PythonでとDBMライブラリを使って単語辞書を実装していこう。 同じ仕組みで英和辞書でも和英辞書でも独和辞書でも中仏辞書でも何でも作れるが、当然ながら辞書データが必要である。私は普段、英辞郎のデータを購入して使っているが、ライセンス上、デモサイトの公開などには使えない。代わりに、この連載ではプリンストン大が公開しているWorldNetというデータベースを利用して英英辞書を作る方法を紹介する。ただし、入力データを先にTSV形式の中間データに落とし

            DBMで単語辞書を作ろう - 豪鬼メモ
          • 文字ときどきRuby / Character and Ruby (NSEG)

            MySQL徹底入門 第4版 - ユーザー管理とか文字コードとか / MySQL Book 4 - User and Charset

              文字ときどきRuby / Character and Ruby (NSEG)
            • ChatGPTでプログラミングのフラット化がはじまっている

              プログラミングを始めるハードルが爆発的に下がっている! MITテクノロジーレビューによると、囲碁AIの「アルファ碁」で有名な、ディープマインドが新しいアルゴリズムを発見したそうだ。アルゴリズムというのは、NHKの『ピタゴラスイッチ』でやってる「アルゴリズム体操」ではないが、コンピューターを内部的に動かす手順のことだ。 コンピューターで、ある問題を解きたいときにプログラムをどう書くか? 言葉で何かを表現するときにさまざまな言い方があるように、アルゴリズムもさまざまだ。アルゴリズムでは、とくに正確で速いことに意味がある。同社は、2022年にも「行列演算」を高速化するアルゴリズムを50年ぶりに記録更新しているが、今回は、プログラマーなら誰でも知っている「ソート」(並べ換え)のアルゴリズムだそうだ。 記事には、「それまで最善とされていた手法よりも最大70%速くリスト内のアイテムをソートする手法を発

                ChatGPTでプログラミングのフラット化がはじまっている
              • フィヨルドブートキャンプを(11ヶ月前に)卒業したこと、楽しいことをすること - Eggshell

                「フィヨルドブートキャンプ Part 2 Advent Calendar 2021 - Adventar」4日目の記事です。 2021年1月にフィヨルドブートキャンプというプログラミングスクールを卒業しました。2021年1月から永和システムマネジメントという会社で働いており、スクールを卒業して就職してから11ヶ月経ちました。卒業エントリにしては時間が経っているのですが、時間が経ったから見えてくることもあるかなと思うのでこれまでのことと、これからのことをつらつらと書いていきます。 フィヨルドブートキャンプとは フィヨルドブートキャンプとは、 プログラマーとして就職を目指せるだけのスキルを身につけることを目標としたオンラインプログラミングスクールです。就職を目指せるスキルを弊社では「現場の人間にとって、戦力になるプログラマー」としています。 というプログラミングスクールです。主にRailsエン

                  フィヨルドブートキャンプを(11ヶ月前に)卒業したこと、楽しいことをすること - Eggshell
                • できる mirakc

                  最新版「できるmirakc」はこちら。 はじめまして、masnagam です。mirakc の開発をしています。 これまで mirakc は、ソフトウェア開発の経験がある人が使用することを前提としてドキュメントを作成してきました。しかし、本記事では、対象読者をソフトウェア開発者に限定せず、すでに EPGStation や TVTest を使った録画及び視聴環境を持っている人が、mirakc を利用できるようになるところまで順を追って説明します。最終目標は、既に稼働している録画・視聴環境中の Mirakurun を、mirakc に置き換えて動かすことです。 🧪 mirakc って何ですか?始めて名前を目にした人もいると思うので、簡単に説明しておきます。 mirakc は、Raspberry Pi のような シングルボードコンピュータ (SBC) をターゲットデバイスとして、Rust 言語

                    できる mirakc
                  • SJIS-macに変換したはずなのにSJIS-winになる - Qiita

                    $utf8Str = "❶❷❸❹❺"; $sjisStr = mb_convert_encoding($utf8Str, 'SJIS-mac'); echo(mb_detect_encoding($sjisStr, ['UTF-8','SJIS-mac', 'SJIS-win', 'SJIS'])); // SJIS-win ← SJIS-macに変換したはずなのに、何故かSJIS-winと判定されてしまいます。 そもそもSJIS-macってなんだよって話ですが、単にMacJapaneseのエイリアスです。 従ってMacJapaneseと書いても同じく、正しく誤判定されます。 そしてコメント欄にThis is a bug in PHP's mbstring extension『mbstringエクステンションのバグじゃよ』という人が現れています。 間違ったコードを書いたときに自分のせいでは

                      SJIS-macに変換したはずなのにSJIS-winになる - Qiita
                    • RubyKaigi 2023に参加しました & 登壇しました - shioimm || coe401_

                      皆さんRubyKaigi 2023お疲れ様でした! あっという間で本当にたのしい3日間でしたね。わたしは一週間が経ってもいまだにわくわくした気持ちで日々を過ごしています。 今年もありがたいことにDAY2に登壇の機会をいただいたので、この記事では今回作ったものや会期中のあれこれを振り返ってみたいと思います。 今回の発表テーマを選んだきっかけ 今回はImplementing "++" operator, stepping into parse.yというタイトルにて「"MRIにインクリメント演算子を追加する"という取り組みを題材に、MRIの字句解析器(スキャナ)と構文解析器(パーサ)に親しむ」というテーマでプロポーザルを提出しました。 (今年のRubyKaigiはパーサ関連の発表が豊作だったので、思いがけず空前のパーサブームに加わることができて幸運でした) 自分自身の個人的な技術的興味はネットワ

                        RubyKaigi 2023に参加しました & 登壇しました - shioimm || coe401_
                      • 実務経験がないマークアップエンジニアが実践で注意しておくべきこと | ARUTEGA blog|アルテガブログ

                        web制作の実務経験でしか知ることができない注意点を記事にしました。 こちらは有料にて販売いたします。 実務経験がないマークアップエンジニアが事故るのは自己責任なので、私の知ったことではありません。 学習不足な本人が悪い。 でも、それでは依頼する側が可哀想。 二度と発注はしたくないでしょう。 この記事ではマークアップエンジニアが、事故る前に知っておかないとまずいことをまとめています。 自分も最初は知らなかったことなので、下記の方は参考にしてもらいたいです。 対象の人 コーディングはわかるけど実務経験がない コーディングの実務のフローを知りたい方 副業で事故りたくない方 Progateをやったけど、次に何をすればいいかわからない このような方を対象に書いています。 逆に、下記のような方は対象外なのでそっとブラウザを閉じてください。 対象外の人 フロントエンドエンジニアとして、すでに企業で活躍

                          実務経験がないマークアップエンジニアが実践で注意しておくべきこと | ARUTEGA blog|アルテガブログ
                        • macOS Catalinaの不具合、アプリの動作不良、各種問題報告まとめ | ゴリミー

                          macOS Catalinaの不具合、アプリの動作不良、各種問題報告まとめ アップデートは慎重に!アプリが最新macOSとの互換性がなく、起動できない場合も macOS Catalinaにアップデートすると「Office 2011」などの32bitアプリが起動不能になることを伝えたが、64bit対応アプリでも起動できない場合やクラッシュしてしまう場合がある。 本記事ではmacOS Catalinaにアップデートすることによって現時点で分かってる起動できないアプリや各種クラッシュ、不具合などを分かる範囲でまとめたので、アップデートを検討している人は参考にどうぞ。 なお、本文中に書ききれていない内容もあるので、コメント欄に皆さんが投稿して頂いた不具合情報もあわせてチェックするべし! 【不具合情報、随時募集中】 「このアプリは起動しなかった」「これはクラッシュした」「これの動作がおかしい」などの

                            macOS Catalinaの不具合、アプリの動作不良、各種問題報告まとめ | ゴリミー
                          • 言語処理100本ノック2020年版が公開!どこが変わったの? - Qiita

                            はじめに 自然言語処理の基礎を楽しく学べる問題集として長らく親しまれてた言語処理100本ノック、その2020年版が4/6に公開されました!これは5年振りの改訂です。 2015年版をやったけど興味ある人、15年版のQiita記事が役立たなくなって残念に思ってる人、15年版を途中までやってたけど20年版が出て心が折れそう、という人のために、どこが変わったのかをまとめていきます。もちろん非公式なので変更箇所の見逃し等はあるかもしれません。 改訂の概要 4/7現在、公式の更新履歴によると、次の3点が大きく変わったようです。 深層ニューラルネットワークに関する問題を追加 第8, 9, 10章が全て新規に作成された問題になっている 英語版の公開(39番まで) 40番以降も順次公開予定とのこと(著者Twitter) 旧第6章(英語テキストの処理)が英語版に移動 該当する英語版は未公開。作成中のようだ(G

                              言語処理100本ノック2020年版が公開!どこが変わったの? - Qiita
                            • ケーススタディで見る!字形を正しく表示させるために大事な3つのポイント|モリサワ note編集部

                              「自分はちゃんと伝えたはずなのに、相手には正しく伝わっていなかった……」 そんなちょっとしたすれ違いからトラブルになる、なんてことは誰しも経験があると思います。 文字の世界でもそれは同じ。 手書きなら「書き間違い」や「字の形の癖」などで間違って伝わることがありますが、PCをはじめとした電子機器で文字を扱うことが多い昨今、 「同じ内容を見ているはずなのに、なぜか自分と相手で表示されている文字の形が違う……」 ということが起こりえます。 同じテキストを開いているはずなのに!これは怪奇現象?システムトラブル? いいえ。これは、PCで文字を扱う「仕組み」が関係しています。 PCで文字を扱う仕組みって何……?と追求していくと、アマゾンの奥地のごとく深い専門的なところまでたどり着いてしまうのがこの分野。 ひとまずこの記事で、具体的なトラブル例を見ながらざっくり理解し、つまずきやすいポイントを押さえまし

                                ケーススタディで見る!字形を正しく表示させるために大事な3つのポイント|モリサワ note編集部
                              • 自治体職員もわかってないマイナンバー、電子証明書を格納しなければ意味なし マイナンバーカードの普及を阻む4つのパスワード、本当に必要なのか | JBpress (ジェイビープレス)

                                (榎並 利博:行政システム株式会社 行政システム総研 顧問、蓼科情報株式会社 管理部 主任研究員) ある会合で社会保険労務士さんから聞いた話である。 たまたま自治体の窓口で、担当者が高齢者にマイナンバーカードを交付する場面に遭遇した。その時、職員が電子証明書は使いませんよねと言って、電子証明書を格納せずに渡していた。思わず、「これじゃ健康保険証として使えないじゃない」と心の中で叫んだという。 この話を知り合いにしたところ、自治体では高齢者に「(住民票などの)コンビニ交付でマイナンバーカードを使いますか」と尋ね、「使わない」と答えた人には電子証明書を格納せずにマイナンバーカードを交付しているケースがあるという。 マイナンバーカードを使ったサービスにおいては、一部チップの空き領域を使ったサービスも実施されているが、ほとんどのケースではチップに格納された電子証明書を使っている。つまり、電子証明書

                                  自治体職員もわかってないマイナンバー、電子証明書を格納しなければ意味なし マイナンバーカードの普及を阻む4つのパスワード、本当に必要なのか | JBpress (ジェイビープレス)
                                • ドトールにあって、スタバにないもの…それは“アスキーアート”である「スタバもカップにモナーとか描いてくれんかな」

                                  リンク ドトールコーヒーショップの紹介 ドトールコーヒーショップ ドトールコーヒーショップの公式ホームページです。 5 users 333 リンク Wikipedia アスキーアート アスキーアート(ASCII art)とは、プレーンテキストによる視覚的表現技法のことである。 「ASCII art」とは本来、英語コミュニティにおいて「ASCII文字コードに含まれる文字・記号を用いた表現」のことを指した。日本語の入力環境としてはASCIIコードよりもシフトJISやEUC-JPなどが主流だが、テキストアート一般を指す語として日本語でも「アスキーアート」と呼んでいる。一方、英語ではこれらは「シフトJISアート(Shift_JIS art)」と呼んで、ASCII artとは明確に区別する。 ア 31 users 76

                                    ドトールにあって、スタバにないもの…それは“アスキーアート”である「スタバもカップにモナーとか描いてくれんかな」
                                  • Unicode変体仮名一覧

                                    Unicode(ユニコード)に登録されている変体仮名(へんたいがな)286文字(U+1B001〜U+1B11E)を、現代のひらがなごとにまとめ直し、ひらがなごとに字母を確認できるようにしました。 表の左列のリンクから、日本古典籍くずし字データセットに収録された実際の字形を確認できます。ただしすべての字母に対応する字形が収録されているわけではない点にご注意下さい。なお、変体仮名や字母の説明については、くずし字とは?をご覧下さい。くずし字の字形については、くずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)やくずし字データセット 文字種(くずし字)一覧をご利用ください。

                                      Unicode変体仮名一覧
                                    • UTF-8のバリデーションとモノイドと半群

                                      この記事はUTF-8のバリデーションとオートマトンの続きです。 前回はUTF-8のバリデーションが8状態のオートマトン (DFA) で表現できることを見ました。状態と遷移を擬似コードで書けば次のようになるでしょう: -- 8つの状態 data State = START | TAILx1 | TAILx2 | TAILx3 | A | B | C | D -- 入力バイトに応じて次の状態を返す。次の状態が該当しなかったら Nothing を返す next :: Word8 -> State -> Maybe State +----+----+-----+----+ | a0 | a1 | ... | aN | 8ビット整数列 +----+----+-----+----+ | | | v v v +----+----+-----+----+ | m0 | m1 | ... | mN | モノ

                                        UTF-8のバリデーションとモノイドと半群
                                      • さくらの VPS を使用してオープンソースのアクセス解析ツール 「Umami」 をホストしてみる

                                        Google Analytics の代替候補、シンプルな機能と画面が特徴のオープンソース、セルフホスティング型アクセス解析 「Umami」 を さくらの VPS (Ubuntu 20.04) を使用して立ち上げてみたというお話。 Web サイトのアクセス解析において、Google Analytics を利用しているというケースは多いと思います。私がお仕事で Web サイトの構築をお手伝いする場合でも、ほぼ 100% といっていい確率で、Google Analytics 導入してくださいっていう話になりますし、まぁ確かに無料であれだけの機能が使えれば便利ですから使わない理由はないですよね。 とはいえ、アクセス解析って導入は簡単なんですけど、実際に活用できるかっていうとまた別の話で、実際に導入した後でたま~に月のアクセス数だけ見て終わり、何も活用できてませんなんて人も多いんじゃないでしょうか。

                                          さくらの VPS を使用してオープンソースのアクセス解析ツール 「Umami」 をホストしてみる
                                        • Python/C/C++向けライブラリ「StringZilla」が登場、SIMD命令を利用して文字列操作を高速化

                                          アルメニア出身で米サンフランシスコ在住の開発者であるAsh Vardanian氏は、Python/C/C++向けライブラリ「StringZilla」のバージョン1.1.3を8月31日(現地時間)に公開した。StringZillaはApache 2.0ライセンスと3条項BSDライセンスで公開しているオープンソース・ソフトウェア。ユーザーはどちらかのライセンスを選んで利用できる。 StringZillaは、大規模な文字列データを単語ごとに区切ったり、区切った単語をソートするなどの機能を提供している。StringZillaの最初のバージョンであるバージョン1.0.0が公開されたのは2023年7月13日。それに先立ってVardanian氏が公開したブログポストでは、StringZillaの基本的な考え方を解説している。 StringZillaは、長い文字列が対象であっても最初の4文字が合致していれ

                                            Python/C/C++向けライブラリ「StringZilla」が登場、SIMD命令を利用して文字列操作を高速化
                                          • 【多言語対応】Spring Boot+Java - 動的に言語を切り替る方法 - - RAKUS Developers Blog | ラクス エンジニアブログ

                                            はじめに 多言語対応とは さっそく環境準備から message.propertiesを作成する Configを設定する ResourceBundleMessageSourceを継承した独自クラスを作成する Controllerから作成したMultiMessageSourceを呼び出す 実行してみる まとめ はじめに はじめまして、バックエンドエンジニアのryrkssです。 今回、担当する開発業務にて、Javaのフレームワークの中でも有名なSpring FrameworkにあるSpring Bootを使用して、多言語対応しましたのでそのお話をさせていただきたく思います。 多言語対応で調べたときの記事で動的ではない言語対応方法(ユーザの言語設定に左右されない)の記事が多い印象でした。 たしかにサンプルとしてはいいかもしれないんですが、実際のアプリケーションでは動的に言語を切り替えたいはずです。

                                              【多言語対応】Spring Boot+Java - 動的に言語を切り替る方法 - - RAKUS Developers Blog | ラクス エンジニアブログ
                                            • 日本語で絵文字入力するための IME 追加辞書を公開しました - Qiita

                                              概要 - Overview この辞書を Google日本語入力・ATOK・Microsoft IME などに導入することで、 GitHub, Slack, Qiita のようにコロン : をトリガーとして IME でも絵文字を入力することができるようになります。 「GitHub, Slack, Qiita 以外のアプリケーションでも GitHub, Slack, Qiita のように絵文字を入力したい」 という要望に応えるための IME 追加辞書です。 ちなみに GitHub や Qiita は英語で絵文字を探す必要がありますが、この辞書を利用することで GitHub や Qiita でも Slack のように日本語で絵文字を入力することができるようになります。 GitHub に MIT License で公開しており、現在は 8264 ペアの絵文字とその読みが収録されています。 👇辞書

                                                日本語で絵文字入力するための IME 追加辞書を公開しました - Qiita
                                              • ソフトウェアエンジニア版 親父の小言 pyspa編

                                                ドメインモデルは貧血にするな Keep it simple stupid バリューオブジェクトはイミュータブルにしろ 博打は決して打つな YAGNI 分散トランザクションとか寝言言ってるんじゃねぇ 使わなくなったコードはさっさと消せ コメントも含めてメンテしろ 推測するな、計測しろ そのアラートは必要ない ロールよりプラクティス コードが書けない奴がチームにいることを肯定するためにスクラムという言葉を使うな ソースと一緒にドキュメントもメンテしろ 欲しいのはエンジニア上がりのPM、エンジニア崩れのPMは要らん 分野ごとの最適なアルゴリズム選びはきちんとやれ プロパティをむやみに作るな 狭くて深いモジュールにしろ 英語を勉強しろ 早く寝ろ DB切り替えとかの予定もないのに、最初からインタフェース切ったりするな。本当にそれが有用なら、そういう機構を誰かがすでに用意したり事例があるはずだ。ないな

                                                  ソフトウェアエンジニア版 親父の小言 pyspa編
                                                • 2023年 わたしの Neovim

                                                  はじめに こんにちは、あろーです。 Neovim をメインのエディタとして使いはじめてから、ちょうど 1 年くらい が経っていました。 ひとつの区切りとして、なんだかちょうど良い感じがしたので現在のわたしの環境についてまとめてみたいと思います。 こんな感じ 設定の方針 厳密に守っているわけではありませんが、以下の方針で設定しています。 設定は基本 Lua で書きます プラグインの実装に使われている言語は問いません(Vim script で実装されているから使わないなどはしない) 常に表示される情報は最小限に留め、できるだけシンプルな画面を維持します 起動速度にはあまりこだわりません。気にならない程度の速度であればよしとしています(沼すぎるので…) わたしの使い方 OS は macOS、または Linux を使います ターミナルは Wezterm です コーディングからドキュメント作成、Gi

                                                    2023年 わたしの Neovim
                                                  • Excel CSV形式ファイルにおける今どきUTF-8文字コード問題の傾向と対策

                                                    環境依存文字を含むデータをCSV形式でやりとりするには 人名や地名の中には、環境依存文字(異字体など)が含まれていることがある。環境依存文字を含むExcelのシートをCSV形式でやりとりしなければならない場合、文字コードにUTF-8を指定するとよい。なお画面の住所録は、「テストデータ・ジェネレータ」によって作成した架空のサンプル用のデータを記事用に修正したものである。 「Microsoft Excel(エクセル)」で作成した表を、CSV形式で保存し、別のアプリケーションに読み込ませることはないだろうか。また、取引先にデータを送る際に、XLSX形式ではなく、CSV形式が要求されることもあるだろう。逆にCSV形式で受け取ったデータをExcelで読み込んで処理したいというケースもあり得る。 このような場合、環境依存文字(機種依存文字)が含まれていると、CSV形式に変換する際に、正しく文字が出力さ

                                                      Excel CSV形式ファイルにおける今どきUTF-8文字コード問題の傾向と対策
                                                    • ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた

                                                      「『生成AIを使ってこんなもの作ってみました』開発者LT大会」は、急速に発展しているChatGPTや生成AIといったAI技術を使って何かを作ってみた人たちがアイデアや成果を共有する、ログミーTech主催のイベントです。ここでPR TIMES社の土屋氏が登壇。「ChatGPTを使って文字コードを扱う負担を軽減できるか」という調査の内容と結果について紹介します。 Shun氏の自己紹介と、本セッションのアジェンダ Shun氏(以下、Shun):それでは、PR TIMES社の土屋が発表します。私の名前はShunといいます。PR TIMESに勤めていて、ソフトウェアエンジニアをやっています。 本日のアジェンダです。私の発表はどちらかというと、個人開発でChatGPTを使ったものを作って、それで実験をしてみたという内容になっております。 表題にもあるとおり、ChatGPTに文字コードのことを聞いてどん

                                                        ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた
                                                      • 図解!PythonでSeleniumを使ったスクレイピングを徹底解説!(インストール・使い方・Chrome) - ビジPy

                                                        Seleniumとは Seleniumとは、ブラウザを自動的に操作するライブラリです。主にWEBアプリケーションのテストやWEBスクレイピングに利用されます。 主にWEBスクレイピングでは、JavaScriptが使われているサイトからのデータの取得や、サイトへのログインなどに使われています。 ここではまずスクレイピングの流れを確認し、その中でSeleniumがどのように使われるかを説明します。 スクレイピングの流れ スクレイピングは、大まかに3つのステップに分けることができます。 1つ目はWEBサイトのHTMLなどのデータ取得です。ただし、HTMLには必要な文章のデータだけでなく、タグなどのデータも混じっているので、必要なものだけを抽出する作業が必要になります。 そこで2つ目のデータの抽出が欠かせません。ここでは、複雑な構造のHTMLデータを解析し、必要な情報だけを抽出します。データの抽出

                                                          図解!PythonでSeleniumを使ったスクレイピングを徹底解説!(インストール・使い方・Chrome) - ビジPy
                                                        • MacBookAir2020を買ったのでHomeBrewで色々入れる - ねこの足跡R

                                                          MacBookAir2020買いましたヽ(=´▽`=)ノ そしてMacBookAir 2020年版も到着! 商売道具は3年毎に変えないとね(・∀・) 裏側のAppleロゴが光らないのはやっぱり寂しいけど、今のところ満足度は高い。今週は設定祭りだなー。 pic.twitter.com/72e9Tm5TN5— 勝部麻季人 💦👏 (@katsube) 2020年4月20日 1年以上前から買い換えようと何度も店頭に足を運んだのですが、バタフライキーボードが全然しっくり来ない、価格的にもそれならPro買うわといった感じでコスパも今ひとつ。そんなときに突然発表された2020年版がそれらの悩みをすべて解消した神モデルということで迷わず購入。新型コロナが蔓延する情勢不安な中でしたが商売道具をケチってはいけませんw 一体どうしたんだAppleらしくないぞw 顧客の要望を足蹴にし阿鼻叫喚に叩き落とす経営方

                                                            MacBookAir2020を買ったのでHomeBrewで色々入れる - ねこの足跡R
                                                          • Windows10 WSL2にLinux居城を爆誕させる - Qiita

                                                            ひどい……こういうことする気でしょう! するとどうなる? 知らんのか PowerShellすら不要になる 完 目次 WSLの中身は単純にUbuntu18.04の環境構築としても使えると思うんですけど (名推理) WSL2とUbuntu18.04LTSを整備する WSL2とUbuntu18.04LTSのインストール (前提) 日本語化する パッケージ (管理ツール)を最新化しておく WSL2のPATHからWindowsパスを抜く Vimをクリップボードに対応させる デフォルトのPythonバージョンを3にする 開発用ディレクトリはWSLファイルシステム内にしておく WSL2が使えるメモリ量を制限する IPv6を無効化する Windows側からWSL2内のサーバに localhostで接続できるようにする WSL2内のサーバにlocalhostで接続できない問題が起きたら ALSAを使っている

                                                              Windows10 WSL2にLinux居城を爆誕させる - Qiita
                                                            • Xcode11からja_JPロケールのNumberFormatter出力でnbspが入るようになった - 麦芽を支える技術

                                                              事の発端 元々以下のように数値を通貨形式の文字列フォーマットに変換する処理のユニットテスト書いてあったんだけど、Xcode11にしてからテストが失敗するようになってしまった。 let target = 1000 XCTAssertEqual(target.yenFormattedString, "1,000円") // "1,000 円" is not equal "1,000円" ちなみに、ここでやっている .yenFormattedString は以下のようなIntのExtension。 extension Int { var yenFormattedString: String { let formatter = NumberFormatter() formatter.locale = Locale(identifier: "ja_JP") formatter.numberStyle

                                                                Xcode11からja_JPロケールのNumberFormatter出力でnbspが入るようになった - 麦芽を支える技術
                                                              • 動き出す日本の大事業「自治体システム標準化」、困難の中に光明を見た

                                                                自治体システムの機能だけでなく、住民の氏名や住所を示す文字コードも標準化する――。講演を聴いた筆者は「政府は本気だ」とうなってしまった。 2021年6月15日、全国地域情報化推進協会(APPLIC)主催のオンラインイベントで、総務省地域情報化アドバイザーの前田みゆき氏が登壇。「自治体システムの標準化について」をテーマに講演した。 前田氏は内閣官房IT総合戦略室(IT室) 政府CIO補佐官も務め、政府が進める自治体システム標準化の動向に詳しい。同氏は標準化の経緯や進捗を紹介したうえで、主な聴衆である自治体のシステム担当者に対して「標準仕様が固まるまでの間に、(システムが扱う住民データについて)外字から『文字情報基盤文字』への同定を進めてほしい」と呼びかけた。 筆者がこの発言に「標準化への本気度」を感じたのは、外字にまつわる問題は自治体システムの刷新を長年にわたり妨げてきた、いわばラスボスのよ

                                                                  動き出す日本の大事業「自治体システム標準化」、困難の中に光明を見た
                                                                • String meets Encoding

                                                                  https://rubykaigi.org/2022/presentations/ima1zumi.html#day3

                                                                    String meets Encoding
                                                                  • Maximum call stack size exceeded について解説

                                                                    "Maximum call stack size exceeded" というエラーに関する解説を書きます。JavaScript を前提に解説しております。 ざっくり解説 Uncaught RangeError: Maximum call stack size exceeded これは、関数が何度も深く深く呼ばれてしまった場合に出るエラーです。 大抵は、間違って自分自身の関数を呼んでしまった、もしくは再帰の終了条件をミスった場合に発生します。 ここに検索で来た方は、自分自身を呼んでいたり、関数同士が循環的に呼びあっていたりするミスを犯していないか確認してください 。 図にすると、こんな感じです ちなみに、関数呼び出しがなければこのエラーは発生しません。ただの無限ループでは決して発生しないエラーです。以下、解説を書きます。 「関数を深く呼ぶ」とは? ここでは、関数からリターンせず再度関数を呼び

                                                                    • デジタル庁の考える文字情報基盤とJIS X 0213:2012 | yasuokaの日記 | スラド

                                                                      戸籍・住記等システム間において氏名等を情報連携する場合には、文字情報基盤として整備された文字とする。 住民記録システムと戸籍・住記等システム以外の標準準拠システムとの間において氏名等を情報連携する場合や、戸籍・住記等システム以外の標準準拠システム間において氏名等を情報連携する場合は、JIS X 0213:2012の文字とする。 いや、それはマズイ。いくらなんでもJIS X 0213:2012や文字情報基盤では、個人の氏名のみならず法人名が書ききれない。JIS X 0213は、そもそも法人名を対象としていなかったし、文字情報基盤も登記ガラミの文字を対象としていないのは、以前、私(安岡孝一)の日記にも書いたとおりだ。これ、法人住民税とか固定資産税のシステムだと、どう考えても無理なんだけど、と思いつつ、前後を読んでみると、さらに恐ろしいことが書いてあった。 戸籍・住記等システム(戸籍システム、戸

                                                                      • Nexus FrontierTechで活躍中の id:mizuno_takaaki を訪問 | はてな卒業生訪問企画 [#7] - Hatena Developer Blog

                                                                        こんにちは、取締役の id:onishi です。 Hatena Developer Blogの連載企画「卒業生訪問インタビュー」では、創業からはてなの開発に関わってきた取締役の id:onishi、CTOの id:motemen、エンジニアリングマネージャーの id:onkが、いま会いたい元はてなスタッフを訪問してお話を伺っていきます。 id:onishiが担当する第7回のゲストは、ロンドン、シンガポール、ハノイを拠点とするAIソリューションプロバイダー Nexus FrontierTech のCo-Founder CTOであり、著書「Web API: The Good Parts」、訳書「プログラマー脳」「JavaScript: The Good Parts」「入門 自然言語処理」などの執筆・翻訳でもご活躍されている、 id:mizuno_takaakiさんこと、水野貴明さんです。 mi

                                                                          Nexus FrontierTechで活躍中の id:mizuno_takaaki を訪問 | はてな卒業生訪問企画 [#7] - Hatena Developer Blog
                                                                        • データドリブンな意思決定を支援する社内データ分析基盤 - estie inside blog

                                                                          はじめまして!estie VPoEの青木です。 社内では、エンジニアチームが全速力で正しい方向に走れるようにお手伝いをしています。 最近は、コロナの影響もあり自宅にいる時間が長くなってきたので、ハリネズミを飼おうかなと真剣に検討し始めました。 さて、そんな雑談はさておき、今日はestieのデータ基盤についてご紹介します。 そもそもestieってどんな会社? オフィス不動産を主なドメインとする"不動産テック企業"です。 現在、以下2つのプロダクトを様々な領域のオフィス不動産に関わるユーザに提供しています。 estie pro 全国8万件以上、都心5区90%を網羅した日本最大級のオフィスビル情報プラットフォームです。 オフィス不動産業界の物件を所有している「オーナー」、オフィスに入居される企業様との間で契約を仲介する「仲介会社」といったオフィス不動産に関わる「pro」のユーザーの方々に利用して

                                                                            データドリブンな意思決定を支援する社内データ分析基盤 - estie inside blog
                                                                          • 2021 年振り返り

                                                                            2021 の出来事を振り返ります。 学校 2021 年 4 月で B3 になるはずだったんですが、留年しました。 留年していたらしいということを夏頃に知りました。後輩が教えてくれました。僕が留年したことを教えてくれた後輩たちの顔はすごく楽しそうでした。 いつか留年するつもりではいたので特に悲しい気持ちはなかったんですが、留年したことに気づくことすらできてなかったのはちょっとおもしろいなと思いました。両親も「そりゃそうだよね」みたいな反応をしていました。 筑波大学の留年の仕組みをよく知らないので自分が B3 と名乗るべきなのか B2 と名乗るべきなのかよくわからないんですが、少なくとも卒業までの年数が1年伸びたのは確かなようです。 留年はしたものの、線形代数 A という科目を再々履修で修得することができました。すごく嬉しかったです。色々と教えてくれた同級生、後輩、知りあいのエンジニアの方々、

                                                                              2021 年振り返り
                                                                            • 『WordPressでトラブった時に使う外部ツール2刀流解説で・・・』

                                                                              WordPressを外注することなく自分でカスタマイズなどを行う時に必ずと言っていいほど使うツールがあります。 今回は、テーマファイルをちょっと自分でカスタマイズしたい時に使うツールを中心にオススメのアプリや使い方について解説していきます。 考え方は、いろいろで人によるとそれはプラグインを使ってやればそこまで必要ないといわれる方もいらっしゃいますが、知っておくとトラブった時にも役立つことがあります。 この記事で紹介させていただくアプリなどは無料で使えるものばかりです。 WordPressを自分でカスタマイズできるようになりたい方は、覚えておいてください。 今回紹介するのは大きく分けて2種類です。 自分のパソコンにダウンロードしてインストールして使うものと使っているブラウザの拡張機能として使うものダウンロードして使うものは、WindowsとMacで別のアプリになりますので別々に開設しますが、

                                                                                『WordPressでトラブった時に使う外部ツール2刀流解説で・・・』
                                                                              • 「シュレーディンガーの猫」みたいな言葉を自動生成するサイト「エポニムの標題」が永遠に遊べそう

                                                                                ※本記事はアフィリエイトプログラムによる収益を得ています 「シュレーディンガーの猫」や「カノッサの屈辱」のような言葉を自動生成するサイト、「エポニムの標題」が近ごろ注目を集めています。ワンクリックで「オルフェウスの提灯」やら「ケリュネイアのカーペット」やら、アカデミックな響きが生まれて永遠に遊べそう。 「タイトルを作る」を押すだけで、魅力的な言葉がランダムに生成。図らずも恐ろしい言葉が出てきてしまった 「○○の××」の形になっているエポニム(人名や地名に由来する言葉)を学術用語等から2つピックアップし、新しい言葉へミックスする仕組み。例えば、「ブロッケンの妖怪」と「ケーララの赤い雨」を合わせて、「ブロッケンの赤い雨」といった具合です。 過去の履歴はTwitterでシェアできます。合成元の意味も表示されるので、雑学も身につく 生成と同時に元ネタの解説が表示される親切さもあって、サービスは「ず

                                                                                  「シュレーディンガーの猫」みたいな言葉を自動生成するサイト「エポニムの標題」が永遠に遊べそう
                                                                                • Pythonで簡単CLIツール作成。Python Fireを試してみた | DevelopersIO

                                                                                  手元で実行するちょっとしたCLIツールを作成したくなること、ありますよね。今回はPythonでCLIツール作成をする際に便利そうなライブラリ、Python Fireを試してみました。 こんにちは。サービスグループの武田です。 手元で実行するちょっとしたCLIツールを作成したくなること、ありますよね。いくつか選択肢はありますが、シェルスクリプトで作る人。Node.jsで作る人。Goで作る人。そしてPythonで作る人。今回はPythonでCLIツール作成をする際に便利そうなライブラリ、Python Fireを試してみました。 Python Fireとは Python FireはPythonで定義した関数やメソッドをCLIで簡単に呼び出せるようにするライブラリです。とても多機能なので今回はすべてを紹介することはできませんが、興味を持たれた方はぜひドキュメントなども見てみてください。 googl

                                                                                    Pythonで簡単CLIツール作成。Python Fireを試してみた | DevelopersIO