タグ

ブックマーク / qiita.com (72)

  • 最も「ありそうで存在しない漢字」は何か? - Qiita

    タイトルが全てです。 個々のパーツとしてはありふれた部品なのに、合体させると「存在しない漢字」になる組み合わせは一体何なのか調べてみました。 ※この記事は TSG Advent Calendar 2022 の14日目の記事です。 手法 以下の手順で「ありそうで存在しない漢字」を調べることにしました。 すでに存在する漢字を構成する部品を調査する 出現回数が多い部品どうしを組み合わせ新たな漢字を作る 構成する部品の出現頻度から、それぞれの組み合わせの「ありそう度」をスコア付けする スコアが最も高いものを「最もありそうで存在しない漢字」とする CHISE 漢字構造情報データベースは、Unicodeに収録されている全漢字を含むさまざまな漢字の部品構造をデータベース化したオープンデータです。今回はこちらのデータを利用して調査を行うことにしました。 頻出部品を調査する UnicodeのCJK統合漢字か

    最も「ありそうで存在しない漢字」は何か? - Qiita
    n_knuu
    n_knuu 2023/01/03
  • ググり時間をぶった切る。AWSを最速で攻略するサイト13選 - Qiita

    はじめに 自分がAWSをこれっぽっちも知らない頃、 ググって出てきたどこか知らんサイトからだと、「欲しい情報はこれじゃない」ってのが多くあった。 そんなこと繰り返していると エラー、トラブル時に即対応できない 間違って構築したせいで運用時に悪化してしまう 古いソースコードでエラーがでて動かない これで無駄な時間を過ごすことになる。 要は「ググって得たその情報で、作ったものは正しいのか?」 AWSは常にアップデートされ続ける 欲しい情報を手に入れるまで調べる時間を割くなら、 公式展開してるサイトから得たほうが正確である。 ということで、最速でAWSを攻略するサイトをまとめる。 この記事をブックマークでもしておくと、ググる手間も省けるだろう。 目次 AWSドキュメンテーション AWSサービス別資料 トレーニングライブラリ AWSブログ アーキテクチャーセンター ワークショップをする よくある質

    ググり時間をぶった切る。AWSを最速で攻略するサイト13選 - Qiita
    n_knuu
    n_knuu 2022/12/29
  • なぜ、ソフトウェアプロジェクトは人数を増やしても上手くいかないのか - Qiita

    はじめに ソフトウェアプロジェクトには不思議な性質があります。現状のスケジュールに課題を感じて、短くするために人員を投下しても、なかなか思い通りに短くならない。それどころか悪化してしまうことがあります。場合によってはプロジェクト自体が破綻して失敗してしまうことすらあります。 今回は、このようなソフトウェアプロジェクトに潜む直感に反する性質を数理的なモデルを介して理解していく試みです。ある種の思考実験としてお楽しみください。 宣伝 Qiitaさんとコラボ企画でアドベントカレンダーをつくりました。 DXをめちゃくちゃ改善した話を募集しています。 https://qiita.com/advent-calendar/2021/dx-improvement 10人の妊婦がいても1ヶ月で一人の子供は生まれない これは誰かの技術力やプロジェクトマネジメント力に欠陥があるのではなく、「人月の神話」で有名な

    なぜ、ソフトウェアプロジェクトは人数を増やしても上手くいかないのか - Qiita
  • すべての開発者へ。すごいGitHubリポジトリ10選 - Qiita

    記事は、Simon Holdorf氏による「10 Extraordinary GitHub Repos for All Developers」(2021年4月4日公開)の和訳を、著者の許可を得て掲載しているものです。 こちらもどうぞ すべてのウェブ開発者へ。人気GitHubリポジトリ9選 面接のリソース、build your own X、優れたパブリックAPIのリストなど Photo by Vishnu R Nair on Unsplash はじめに GitHubは、あらゆる種類の技術、フレームワーク、ライブラリ、コレクションなどを共有するためのNo.1プラットフォームです。しかし、その巨大さゆえに、最も有用なリポジトリを探すのが難しいという問題もあります。そこで私は、すべてのソフトウェアエンジニアに大きな価値のある、素晴らしいリポジトリ10選を作ることにしました。すべてに多くのGitH

    すべての開発者へ。すごいGitHubリポジトリ10選 - Qiita
  • 形式手法はなぜ流行っていないのか - Qiita

    はじめに みなさん形式手法をご存知でしょうか? 名前くらいは聞いたことあるけどいまいち何かわからないという方が多いのではないでしょうか。 その通りです。形式手法はアカデミアではそれなりに研究されているものの、 一般の(特にWeb系)ソフトウェア開発者が携わることはなかなかないのではないかと思います。 この記事ではソフトウェア開発に形式手法が導入されないのはなぜなのかを考察します。 この記事ではアジャイルソフトウェア開発において形式手法を導入する際のハードルについて考察します。 追記 記事について、「形式手法は流行っていない」というのは正確ではないのではないかという指摘をいただきました。組み込み系や社会インフラ系等バグを絶対に出せないシステム開発では形式手法がよく使われているそうです。 ちょっと古いデータですが活用事例です。 誤解を招く紹介となっていたことをお詫びします。 さらに追記 ku

    形式手法はなぜ流行っていないのか - Qiita
  • 日本語 LaTeX の新常識 2021 - Qiita

    オリジナルの TeX が誕生してから40年以上の歳月が流れ,そして日語 LaTeX が現在主流の姿 (pLaTeX2e) になってからも25年以上が経過しました.この間 LaTeX は多くの人に使われ続けて来ましたが,その歴史の中でさまざまな変遷を辿り,明示的なドキュメントにはなっていないながらも,ユーザ間ではある意味「常識」として定着した知識が積み重なってきました. 歴史が長く,よくも悪くも「安定している」と評されるために見過ごされているかもしれませんが,日語 LaTeX は今も開発が続く「生きた」ソフトウェアです.そのため歴史の中で培われた常識的な知識が古くなり,新しい知識が必要になる場合があります.そしてその傾向は特にこの数年顕著で,TeX コミュニティに属する人々が多く集まる TeXConf などの会議で,主に中上級者向けに新しい知識が啓蒙されてきました.稿では,そのような日

    日本語 LaTeX の新常識 2021 - Qiita
    n_knuu
    n_knuu 2021/01/14
  • 文書のランキングは情報推薦なのか? - Qiita

    検索エンジンにこれらのフィールドを持つ文書として格納します。「冷蔵庫 安い 黒」のような文字列のクエリが来たら単語に分解して各フィールドに一致する文書をフィルタして、なんらかの方法でソートして表示すればよさそうですね。このように基的に検索システムは候補生成とランキングの多段構成になっています。候補生成に関してはクエリ拡張や候補拡張など様々な手法が提案されてきて、多くの現場で実際に使われていると思いますが、ランキングはどうでしょうか。 文書のランキングの目的は検索結果の有用性を最大化することです。1977年にRobertsonは与えられた文書セットに対して関連度の確率を高い順にソートしたときに有用性が最大になるというProbability Ranking Principleを提案し、それ以来人々は様々な方法で関連度を推定しようと試みてきました。 従来の単語の出現頻度からランク付けをする手法

    文書のランキングは情報推薦なのか? - Qiita
  • 2億資金調達してから二年、結構量子コンピュータ頑張った結果 - Qiita

    はじめに 2008年に起業してからコツコツやっていましたが、2014年くらいから量子コンピュータの研究開発をがんばりました。資金調達もしてある程度技術に目処がついたのと、若者から起業したいという相談をよくもらうので、まとめておきます。 経営は大事 簡単にいうとベンチャーをやろうとしたら技術よりもキャッシュが大事です。なので、財務や経営感覚がついてから技術をつけないと結構大変と思います。特に1年目は慣れない事務に忙殺されますし、二年目以降はキャッシュが厳しくなります。 あとは、最初は経営に夢見て舞い上がりがちなので、その気持ちがおさまって厳しさが一通り身についたところからが番です。 調達の前に譲渡 2008年から10年くらいはコツコツ会社をやっていた上、そんなに頑張るタイプでもなかったのですが、たまたま2014年からやっていた量子コンピュータのニュースが巷で新聞に載るようになってから、周辺

    2億資金調達してから二年、結構量子コンピュータ頑張った結果 - Qiita
    n_knuu
    n_knuu 2020/07/27
    良い話だった
  • BERTの精度を向上させる手法10選 - Qiita

    はじめに 自然言語処理タスクでBERTをfinetuningして使うことが当たり前になってきました。Kaggleなどのコンペや精度要件がきつい案件を行う場合に少しでも精度を向上させたいというシーンが増えてくると考えられます。そこで、精度向上手法をまとめます。タスクとしては分類タスクを想定しています。 文字数調整 学習済みのBERTに入力可能な単語数は最大512個です。そのため、512単語以上のテキストを使用する場合は特別な工夫が必要となります。ここの処理方法の変更が精度向上に寄与することが多いので要チェックです。 例として次のテキストから6単語取得することを考えます(句点も1単語とします) 吾輩 / は / / で / ある / 。 / 名前 / は / まだ / ない / 。 1. Head-Tail 吾輩 / は / / で / ある / 。 / 名前 / は / まだ / な

    BERTの精度を向上させる手法10選 - Qiita
    n_knuu
    n_knuu 2020/06/25
  • クランフィールド検索実験から2019年のニューラルモデルまで - Qiita

    このテーブルからクエリが「quick」ならDoc1が「news」ならDoc2が「fox」なら両方の文書が関連しているドキュメントとして候補になることがわかります。ドキュメントを絞り込んだ後どのように並べるかですが、おおまかに分けるとクエリと文書をベクトルに変換して類似度を比較するVector Space Modelと、関連度を文書とクエリが与えられたときの条件付き確率 $P(rel \mid q, d)$ と定義するProbabilistic Modelがあります。その中でも70年代に発明されたBM25というアルゴリズム ("Best Matching" の頭文字) はElasticsearchに採用されていることもあり広く使われているので、検索に携わっている方ならば一度はこの式を見たことがあるのではないでしょうか。 $$ BM25(q, d) = \sum_{t_{q} \in q} i

    クランフィールド検索実験から2019年のニューラルモデルまで - Qiita
  • Qiitaの退会方法まとめ - Qiita

    この記事も少ししたら見れなくなります。 1. 右上の自分のアイコンをクリックし、 マイページ を開きましょう 2. マイページが開いたら左上のカード部分の中央辺りにある プロフィール編集 をクリック 3. 左上の選択カードで アカウント をクリック 4. 一番下までスクロールし、 アカウントを削除する をクリックしましょう。

    Qiitaの退会方法まとめ - Qiita
    n_knuu
    n_knuu 2020/03/26
  • ラグランジュ双対問題について解説 - Qiita

    機械学習系のには, SVMの例などで双対問題の導出の仕方は載っているが, なぜそのようにして良いのかについては触れられていない. うまく説明されているは, Convex OptimizationのDualiyの節である. 日語は見当たらなかったため, ここに記す. (LaTeXが重いので, 式が表示されるまでお待ち下さい) Keywords: Lagrange, Dual Problem, Duality, Slater condition, KKT conditon 実際に最適化を体験してみたい方は凸最適化ソルバーCVXPYの紹介を参照. ラグランジュ双対関数 理論のみを紹介する. 具体例などは, Convex OptimizationのDualiyを参照してください. ラグランジアン 次の最小化問題を考える. \begin{split} \min_{x\in\mathbb{R}^

    ラグランジュ双対問題について解説 - Qiita
  • Microsoft Academic のすゝめ - Qiita

    先日『Ananta: Azure を支えるステートフル L4 ロードバランサー - Qiita』という記事を書いたのですが、そのときに偶々見つけた Microsoft Academic と呼ばれる文献検索サービスが相当優秀だったので紹介します。 ■ Home | Microsoft Academic https://academic.microsoft.com/home TL;DR Microsoft Academic は、高度な文献検索機能を有する Google Scholar のような Web サービス Microsoft Research が研究開発した、自然言語処理によるコンテンツのトピック抽出技術、意味論的検索エンジン、文献重要度の算出手法などを活用 検索の他にも、文献やトピックをフォローして関連情報を収集できる機能も Microsoft Academic とは? Microso

    Microsoft Academic のすゝめ - Qiita
    n_knuu
    n_knuu 2019/12/23
    Microsoft Academic、Google Scholar に慣れてるとごちゃごちゃしてる感じがあって好みじゃない
  • YouTuberから学ぶデータサイエンスまとめ。海外チャンネル多め。 - Qiita

    はじめに AdventCalendar何書こうかなぁと色々考えた結果、最近プログラミングや機械学習のレクチャーをしてくれるYouTuberの動画をよく見ているのでそれをシェアすれば良いのでは?と思い、まとめてみました 嘘です。あまりに過去書いたGCP関連のQiita記事が伸びないからグラドルが脇見せ始めるのと同じように売れ線の記事を書きたくなっただけです。 リンクをクリックするとそのままYouTube動画が開始されることがあるので、音声をオンにしている人(or 職場で見てる人)は注意してください 基は再生リスト画面に飛ぶので再生されることは少ないですが直接動画に飛ぶリンクについては注記しております。チャンネルのイメージを掴んでいただくため引用の範囲でチャンネルTop画面をキャプチャしてます。 とりあえずここにあげてるのをチャンネル登録しておくと幸せになれる(はず) ジャンル チャンネル

    YouTuberから学ぶデータサイエンスまとめ。海外チャンネル多め。 - Qiita
  • [和訳] Dropboxアカウントのせいで胃潰瘍になった - Qiita

    こちらのReddit投稿 (https://www.reddit.com/r/sysadmin/comments/eaphr8/a_dropbox_account_gave_me_stomach_ulcers/) の和訳記事です。番環境でやらかしかった人シリーズが盛り上がっていたので波に乗って(?)Twitterにヤバすぎる恐ろしい話が流れてきたのをすかさず和訳してみました。やらかしちゃった人というよりはやらかされちゃった人目線ですがいずれにせよそこら辺の怪談話よりよっぽど怖いです。 Dropboxのアカウントのせいで胃潰瘍になった。 皆は誰もが触れたがらない、会社を紐やガムやクリップでつなぎとめている「例のアレ」を見つけたことってある?そういうのって往々にして大型連休前の金曜午後4:45に落ちるし、般若のような様相を呈した上司が「このままだと第二のスターリングラード攻防戦が勃発するぞ

    [和訳] Dropboxアカウントのせいで胃潰瘍になった - Qiita
  • 3年かけてたどり着いた英語記事を読むための方法 - Qiita

    2023/07/03 要約ツールに「ChatGPTを利用する場合」を追加し、サンプルの生成結果を記載しました。 以前は英語の記事の読み書きが苦手だったのを、このようにして克服した、という話を書きます。 成果を数値で測ってないですが、RSSフィードに登録している英語メディアの数が大幅に増えました。以前は全体の5%程度に対し、今は50%以上が英語メディアになっています。英語に対する心理的ハードルは大きく下がりました。 また、読む力を付けたことで自作のOSSのREADMEもほぼ自力で書けるようになりました。 https://github.com/goodwithtech/dockle/blob/master/README.md では始めます。 全体像 僕の場合、1000文字以上の英文記事を読む場合、STEP1に含まれる内容は必ず行います。 STEP2に含まれるものは、辞書なしで読めないときだけ行

    3年かけてたどり着いた英語記事を読むための方法 - Qiita
    n_knuu
    n_knuu 2019/10/27
    #今日の曖昧性
  • Visual Studio Codeで競プロ環境構築(実践編) - Qiita

    "cin_vector_int":{ "prefix": "cvi", "body":[ "vector<int> $1($2);", "REP(i, $2) cin >> $1[i];", "$3" ], "description": "vector<int>の受取" } エディタ上で "cvi" と打ってtabを押すと、\$1 の部分にカーソルが移った状態でスニペットが挿入されます。複数ある \$1 は連動するので、例えばVと入力すれば2行目のREPマクロ内の \$1 にも Vが入力されるわけです。 tabキーを更に押すと次のタブストップ($2)に遷移します。 独自のスニペットを作成 | Visual Studio Code Docs 入力受け取りの部分を書く際にめちゃめちゃ重宝します。 何でもかんでもマクロにする競プロerもいますが、適度に使い分けたほうがコードは読みやすい気がします

    Visual Studio Codeで競プロ環境構築(実践編) - Qiita
  • 私たちはどうして公式ドキュメントが読めないのか? - Qiita

    少しプログラミングを覚えてきた初学者が、さらに力をつけるために必要なのが公式ドキュメントを読むことだと思います。 公式ドキュメントには、日語の記事には書かれていないような詳細な説明や、APIの使用方法、そしてリリースノートなど、実装には不可欠な情報が掲載されています。 しかし、公式ドキュメントが上手く読めずにつまづく人も多いのではないでしょうか?慣れていない人にとっては、技術について書かれたドキュメントを読むのは難しいものです。 この記事では、つまづいてしまう人が少しでも減るように、公式ドキュメントが読めない原因と対策をいくつか書いていきます。 公式ドキュメントとは この記事で言及している「公式ドキュメント」は、フレームワークやライブラリ、言語について、その公式組織が出している文書のことです。 具体的にはこのへん。 どうして公式ドキュメントが読めないのか 原因1. 公式ドキュメントを読む

    私たちはどうして公式ドキュメントが読めないのか? - Qiita
    n_knuu
    n_knuu 2019/02/13
    3だよね(全体がわかってないと読んでもピンとこない)
  • 2018年のPythonプロジェクトのはじめかた - Qiita

    4/30 公開 5/1 増補改訂: 大幅加筆しました。 この記事では、2018年以降に実現可能になったモダンなPythonプロジェクトのはじめかたを整理して紹介します。 PythonにもPipenvという公式推奨の高機能なパッケージマネージャーが登場し、さらに2018年に入ってからの機能向上で、npmやyarnのような開発体験が得られるようになってきました。 私はここしばらくはフロントエンドやNode.jsに携わっていて、npmやyarnに慣れきっていたせいか、pipenv導入以前はvirtualenvやpipを組み合わせた開発が面倒で仕方なかったですが、Pipenv導入によって一変しました。 これからはPythonプロジェクトがよりクリーンかつ簡単にはじめられるようになり、開発体験も向上するでしょう。 それでは、まずはPythonのインストールからです。 Pythonのインストール P

    2018年のPythonプロジェクトのはじめかた - Qiita
  • 「AWS is 何」を3行でまとめてみるよ - Qiita

    すべてのAWSのサービスを 3行以下でまとめました。 AWSが色々ありすぎてわからん! 3行以下で誰かまとめて!!という思いで、AWSを3行で書いてるところがなかったので自分で作りました。 掲載した金額は最小使用時のもの。無料枠や大量購入割引(Volume discount)、あと転送量でかなり変わるので、参考程度に。 以下からのカッコよすぎな見出しは AWSクラウド製品のページ からのそのままの引用です。「 広範かつ奥深いコアクラウドインフラストラクチャサービス」って僕が言ってるわけじゃない! 広範かつ奥深いコアクラウドインフラストラクチャサービス なんのこっちゃ。 よーするに「基サービスですよ」ってことらしい。基サービス多すぎだろ・・・。 い。 コンピューティング AWS is 何 いくら?

    「AWS is 何」を3行でまとめてみるよ - Qiita