この記事で紹介するのは高スループットなBase64エンコードの実装方法です。 Base64は、Webの世界を始めとして、世界中さまざまな箇所で使われているエンコード方式です。とてもよく使われるので、高速化についてもしばしば研究されてきたようです。 高速化の最新成果として、2019年10月に、Wojciech Muła, Daniel Lemireによる新しい論文がarxivに投稿されました。なかなか強烈なタイトルが付いています。 Base64 encoding and decoding at almost the speed of a memory copy 論文の主張としては、x86 CPUの持つ最新の命令群を駆使することで、非常に高効率なBase64エンコード・デコードが実現できたというものです。このQiita記事では論文の内容の一部を紹介します。 Base64は問題としては単純に見え
JR相模線は茅ケ崎駅(神奈川県茅ヶ崎市)と橋本駅(神奈川県相模原市)を結ぶ33.3kmの路線。茅ケ崎駅で東海道本線、橋本駅で横浜線と京王相模原線に接続し、一部列車は橋本駅から横浜線に乗り入れ、八王子駅まで運転される。相模川に沿って神奈川県中央部を南北に結び、西側には丹沢山地が控え、関東平野の西端ともいえる位置にある。 205系500番台が活躍する相模線。海老名駅で小田急線・相鉄線に乗り換えることもできる この相模線に関して、神奈川県と沿線4市1町などで組織する「相模線複線化等促進期成同盟会」により、相模線複線化の早期実現をめざすためのキャッチフレーズが募集されている。相模原市の電子申請サイトから応募でき、沿線住民以外も参加可能。締切は12月15日。最優秀賞を1点選び、賞状と副賞としてQUOカード3万円分が贈呈される。同じキャッチフレーズの応募があった場合は3万円を受賞者で分ける。発表は20
PDFからテキストを取り出すのは、意外と大変です。 それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵(「グリフ」)をコンピューターで扱えるような「文字」にする方法です。 これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出す このうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法 この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。 これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ(文字の形)をページ上に表示するための汎用の仕組
第22回情報論的学習理論ワークショップ (IBIS 2019) | 第22回情報論的学習理論ワークショップ, 2019.11.20〜23, ウインクあいちに行った. 昨年の札幌に比べると名古屋は近い いつもの胃ではなく腸の具合が完全に悪くて半分ぐらいまともに発表を聞かずにトイレにいた ウインクあいち2階上のトイレは人も少なくホールの音声も聞こえて快適 抗生物質を処方された時は忘れずに整腸剤も貰わないと本当に駄目だと痛感しました 有料のチュートリアルも聞きたかったのですが朝から握手会があったので断念 11/20 グラフ文法を用いたグラフ生成 「化学構造式のためのハイパーグラフ文法」を発表した(JSAI2018) で予習していた 分子グラフの生成をしたい (ハードな)原子価の制約を必ず満たす分子ハイパーグラフ文法を提案 ソフトな制約は VAE で学習する 全てを深層学習でやるのではなく,ハード
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く