SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII
tatamilab.jp
We are looking moderator / translator for several languages . See details to apply clicking the button below. Learn more Spoonkid Akinator Helldiver Vladimir Guerrero Jr. Akinator´s daughter Matt Sturniolo Your mother's friend Mickey Mouse Lena De Spell Jeremy Renner
違法素数(いほうそすう/英: illegal prime)とは、素数のうち、違法となるような情報やコンピュータプログラムを含む数字。違法数(英語版)の一種である。 2001年、違法素数の1つが発見された。この数はある規則に従って変換すると、DVDのデジタル著作権管理を回避するコンピュータプログラムとして実行可能であり、そのプログラムはアメリカ合衆国のデジタルミレニアム著作権法で違法とされている[1]。 経緯[編集] DVDのコピーガードを破るコンピュータプログラムDeCSSのソースコード 1999年、ヨン・レック・ヨハンセンはDVDのコピーガード (Content Scramble System; CSS)を破るコンピュータプログラム「DeCSS」を発表した。ところが2001年5月30日、アメリカ合衆国の裁判所は、このプログラムの使用を違法としただけではなく、ソースコードの公表も違法である
「完全に狼狽(ろうばい)した」――「はてなブックマーク」(はてブ)リニューアルのディレクターを務めたはてなのディレクター・伊藤博典さんは、リニューアルに対するユーザーの反応を見た感想を率直にこう語る。 1月8日、はてなブックマークのトップページとカテゴリーページをリニューアル。アルゴリズムを刷新し、同じ記事が長く滞留しないようにしたほか、デザインも一新。ブルー一色のリスト風の記事一覧からカラフルな配色に変え、一部ページではタイルを並べたようなデザインに刷新した。 大幅なリニューアルは2008年以来、4年ぶり。思い切った刷新を評価する声がある一方、ドラスティックな変更に対する否定的な意見も殺到し、ブログ記事のブックマークには「これはひどい」タグが付き、「見づらくなった」など辛らつな声が次々に寄せられた。 4年間変化のなかったトップページをガラリと変えれば、ユーザーは驚くだろうと想定はしていた
Bijostagram(びじょすたぐらむ)というWebサービスを作ってみました。 Bijostagram - Cute Girls on Instagram きれいなおねいさんは、好きですか? Bijostagramとは? Bijostagramは、きれいなおねいさんの画像がたくさん眺められるサービスです(個人的に作りました)。一番の大きな特徴は、Instagramから自動的にきれいなおねいさんの画像を集めてくる、というところです。Bijostagramでは、集めてきたおねいさん画像をランダムに表示しています。 Instagramは写真版Twitterで、しかも撮影した画像をオサレな感じで加工できてツイートできるというサービス。2月末に公式のAPIが公開されたので、いじってみました。→インスタグラムのAPIについてはこちら Bijostagramは、画像抽出と画像配置のアルゴリズムをPer
apache や nginx の設定をしたことがあれば以下の様な行を見たことがある人も多いのではないでしょうか。(※ 下記は nginx の設定。apache の場合は SSLCipherSuite です。) ssl_ciphers AES128-SHA:AES256-SHA:RC4-SHA:DES-CBC3-SHA:RC4-MD5; これが暗号スイートを指定している箇所です。そしてこの部分、わけのわからない文字列の羅列なのですごく取っつきにくくて何を指定したらいいかわからないので、コピペしてしまう人も多いんじゃないでしょうか。かくいう私も数年前に趣味で TLS 対応の Web サービスを作った時はコピペで済ませていました。この暗号スイートは、以下のような OpenSSL のコマンドを使って対応している一覧を見ることができます。 $ openssl ciphers -v AES128-SH
「Java News.jp(Javaに関する最新ニュース)」の安藤幸央氏が、CoolなプログラミングのためのノウハウやTIPS、筆者の経験などを「Rundown」(駆け足の要点説明)でお届けします。(編集部) プログラミングと検索エンジンは切っても切れない プログラミングと検索エンジンの関係は切っても切り離せないものです。プログラミングに役立つドキュメントやノウハウを探したり、参考になるサンプルプログラムを見つけ出せます。 さらにバグの回避方法を見つけたり、エラーメッセージを検索エンジンで探して、解決方法が見つかることも多いでしょう。良質のソースコードから、的確なアルゴリズムや、思いもしなかったようなコード例を見いだすのも新たな楽しみです。 さて、ここではプログラミングの際に便利に利用できるソースコード専用の検索エンジンをいくつか紹介しましょう。ソースコード専用の検索エンジンを利用した検索
はじめに 本書は,筆者が長年書き溜めた様々な実務的な最適化問題についてまとめたものである. 本書は,Jupyter Laboで記述されたものを自動的に変換したものであり,以下のサポートページで公開している. コードも一部公開しているが,ソースコードを保管した Github 自体はプライベートである. 本を購入した人は,サポートページで公開していないプログラムを 圧縮ファイル でダウンロードすることができる. ダウンロードしたファイルの解凍パスワードは<本に記述>である. 作者のページ My HP 本書のサポートページ Support Page 出版社のページ Pythonによる実務で役立つ最適化問題100+ (1) ―グラフ理論と組合せ最適化への招待― Pythonによる実務で役立つ最適化問題100+ (2) ―割当・施設配置・在庫最適化・巡回セールスマン― Pythonによる実務で役立つ
プロダクトマネジメントのコーチをしています。プロダクト開発の中でもGPT4を使うケースが増え、相談されることが増えてきました。 ChatGPTのGPT4を用いた際の、専門家として信用できる精度で推論させるための工夫の一部を紹介します。精度が必要な専門職かつ中級者向けになると思います。「機密情報の入力をどうさけるか」といった運用の話は今回はしません。 やったことと起きたこと一通り論文を読んで試したり、試行錯誤しました。 その結果、専門家として業務レベルで使える程度のものができるようになってきました。 クライアントのプロンプトを添削する仕事も増えつつあります。副作用として、日本語なのに日本語と感じられない自然言語に目覚めてきました。この片鱗についてお話しします。 分かったこと分かったこととして、精度を業務レベルで用いるためにまずはじめにとりくむことは下記です。 ・接待モードを切る ・指示の質が
「マッチ箱の脳」という森川くんが書いた本は、 その世界で、かなりの評判を呼んでいます。 まだ、売り出されてまもないこの本を、 森川君、WEB用に再編集して、 「ほぼ日」に連載してくれることになりました。 なんとふとっぱらで、骨惜しみしない男なのでしょう?! ◆気前がいいだけじゃ生きられない。 ただのケチでは生きている資格がない。 謹んで、感謝の意をこめて、上記のことばを 森川くんにささげさせていただきます。
講義ノートの目次へ 微分方程式の基礎を学ぶための講義ノートPDF。 独学に使えるオンライン教科書を集めた。院試対策の演習問題と解答もある。 微分方程式は,大学1年で必ず押さえておこう。 そうしないとあちこちで(ほとんど全分野で!)つまづいてしまう。 物理や工学の他にも,化学反応,生き物の個体数,価格の変動…などなど, 「数式で動きをモデリング」する時に何にでも使う。早いうちにマスターしよう。 とくに解が厳密に求められるケースでは, 解き方のパターンを一通り押さえておく必要がある。 求積法 →解を積分で表現 級数解 →解を無限和で表現 演算子法やラプラス変換 →代数的・記号的な操作 こういった基礎ができれば,次はもっと実用的な段階にステップアップできる: 難しい微分方程式の場合,コンピュータで数値的に シミュレーションして解を求める。 ルンゲ・クッタ法などのアルゴリズムを使う。 現実世界では
Google検索終わってしまったの?という話で界隈が少し盛り上がっていてうーんはてなってなっていてそこはかとなく嬉しい。 goldhead.hatenablog.com orangestar2.hatenadiary.com 本件については僕も定期的に何かを言っている話ではあるんだけど、特にここ最近でキャッシュの検索もしなくなったってところが非常に象徴的だなあと思っています。キャッシュすることが著作権上問題だ何だで揉めたのが懐かしいよね。令和に至ってはウェブコンテンツの揮発性のほうがもはや問題である、と。 (個人的には依然として「なくなる権利」の方が重要と思っているだけど) 黄金頭さんが書いている「個人の日記が引っかからない」というのはもうずっと前から同感で、何かを見たことを共有したくて感想を探したところで例えば映画なら映画のあらすじサイトばかり引っかかる。体裁としては個人だけど明らかに広
sangmin.eth @ChoimiraiSchool @gijigae これはすごい👏!世界初となる対話型検索エンジン、Perplexity Ask( @perplexity_ai )が登場です。答えの根拠として最新情報を参照+対話形式で追加質問ができる。日本語にも対応してますのでぜひ! pic.twitter.com/4bUQ12Yr22 2023-01-20 14:25:43 sangmin.eth @ChoimiraiSchool @gijigae . @perplexity_ai(👉perplexity.ai)をさらにバージョンアップさせたい全ての方にお勧めしたいのが、Perplexityを検索エンジンとして登録すること。Chromeだと、 ①設定 ②検索エンジン ③追加 の順で登録完了です。Chromeの検索窓からPerplexityを指定して検索できるので超便利✨。 t
JVNやJPCERT/CCの記事があまりにもさらっと書かれていて、具体的なリスクが想像しづらいと思うので説明します。 今北産業 (今ニュース見て来たから三行で教えて欲しいという人向けのまとめ) インターネット上の「暗号化」に使われているOpenSSLというソフトウェアが2年間壊れていました。 このソフトウェアは便利なので、FacebookだとかYouTubeだとか、あちこちのウェブサイトで使っていました。 他の人の入力したIDとかパスワードとかクレカ番号とかを、悪い人が見ることができてしまいます。(実際に漏れてる例) 他にも色々漏れてますが、とりあえずエンジニア以外の人が覚えておくべきはここまででOKです。もう少し分かりやすい情報が以下にあります。 OpenSSL の脆弱性に対する、ウェブサイト利用者(一般ユーザ)の対応について まだ直っていないウェブサイトもあれば、元々壊れていないウェブ
4年前に会社の福利厚生を使ってスタンフォードの授業を取ってみたら面白く、 働きながらでも続けられそうだなという実感を得たので、 2年後、受験を経てジョージア工科大学にリモートで通い始めた。 そして先日、ジョージア工科大学からコンピュータサイエンス修士号をいただくことができた。 画像の学位記は卒業式イベント用の非公式のもので、1~2か月すると Masterとちゃんと書いてある本物が来るらしい *1 。 After 1 year and 9 months, I graduated from Georgia Tech and got a master's degree in computer science. It was intense to be a student while working full-time, but I learned a lot. pic.twitter.com/J
11月21日に羽田発福岡行日本航空335便がオーバーブックのために欠航となったニュースは皆さまご記憶にあると思います。 オーバーブック(以下、OBと略)とは飛行機の座席数以上に予約を取ることを言いますが、航空会社では日常的にこのOBを行っています。今回は375席の飛行機に401人の予約が入っていて、その処理に手間取ったため、羽田の出発が予定時刻よりも大幅に遅れ、このままでは福岡空港の門限(夜10時)に間に合わないことが判明したため、便そのものを欠航させてしまったことが大きなニュースになりました。 座席数より26人多いお客様のご予約ですが、そういう時はあふれたお客様に降りていただくことで便を出発させ、降りていただいたお客様には一定の賠償金をお支払いし、次の便をご案内するというのが運送約款で定められている手続きですが、今回の「事件」は、便そのものが欠航になってしまったために、約400名のお客様
こんにちは。 新規事業開発室の @mosa_siru です。 ブロックチェーンAdvent Calendar 14日目の記事です。 社内では新テクノロジーに対しての研究を一部で進めており、スマートスピーカーやVR/ARなどに加え、ブロックチェーンを現在調査しています。この研究・調査の一貫でマイニングについて調べてみました。 この記事では、マイニングの基礎知識と概観について、かなり平易に説明します。基本から順に説明していくので、知ってる人はどんどん飛ばして読んでってください。 また、弊社が進めているブロックチェーン技術に関する研究内容は下記のブログで紹介しています。 blockchain.gunosy.io マイニングって? マイニング報酬 送金手数料 difficultyの調整 ハッシュレートと価格の関係 価格 => ハッシュレート ハッシュレート => 価格 ハッシュアルゴリズムとマシン
ここでは、はてなブックマークがサービスを運営するにあたっての考え方と、はてながサービスを健全に運営するための方針、また、サービスをより有益に使っていただくためユーザーのみなさまにお願いしたいことをガイドラインとして公開します。 はてな全体のルールとガイドライン はてなでは、サービス利用について下記のようなルールとガイドラインを公開しています。 はてな利用規約 はてなプライバシーポリシー はてな情報削除ガイドライン はてなコミュニティガイドライン 特に、はてなコミュニティガイドライン では、はてな全体のユーザーコミュニティに対する価値観と、サービス上で生じる問題に対する指針を記載しています。ぜひご一読ください。 はてなブックマークは、ご利用いただくみなさまが、サービスを通じて以下のような体験が得られる場であることを目指しています。 新たな発見が多く得られる 情報への深い理解や洞察が得られる
ユーザーに届ける価値を徹底的に追求する マーケティングを提供します © Copyright 2022 バズ部. All rights reserved. ソーシャルメディアが台頭してきた現在でも、検索エンジン対策を無視することはできない。 なぜなら、検索エンジンからのアクセスは目的意識の高い読者が集まるため、その他のアクセスと比べてコンバージョン率が何倍も高いからだ。 しかし、「検索エンジンは結果が出るまでに時間がかかり面倒」という理由で、疎かにしている方は非常に多い。それでは非常に勿体ないので、本日は実例を基に、最も効率的な検索エンジン対策の方法をご紹介する。 以下が、バズ部を立ち上げてから2ヶ月での検索エンジンからのアクセス数だ。 本日は、この結果を得るために、日頃から徹底している検索エンジンマーケティングの5つの対策をご紹介する。 1.検索エンジンの仕組みを知る検索エンジンで上位表示
Googleが大鉈を振るった。不正確な医療情報を大量生産するメディアに。 2016年11月末に閉鎖された『WELQ』以降、ネットの医療情報を巡る動きは、「もぐらたたき」の状態だった。 情報の信頼性よりもコスパを優先し、記事を大量生産して、検索結果を独占する。WELQで問題となった手法を駆使するネットメディアは次々と現れた。 BuzzFeed Japan Medicalや一部の専門家が、問題のある記事やメディアの指摘を重ねてきたが、検索結果上位に不正確な情報が並ぶ状況は続いていた。 それが12月6日、一変した。 検索サービス最大手Googleが「医療や健康」に関する検索結果の改善を目的としたアップデートを実施したと発表したのだ。 これまで情報の信頼性が疑問視されてきたメディアや記事の多くが、検索結果の上位から姿を消した。 BuzzFeed Japan Medicalは、今回のアップデートの狙
この記事は、前出の本に入れる予定だったコラムのうちの一つです。 正確にいうと、本に入れる予定だったけど、メイン側で締め切りをぶっちぎっていたら、コラムを追加できるような空気じゃなくなって、書くのをやめたものです。 本の宣伝を兼ねて、没にしたコラムに日の目を見させて、あわよくば第二版で入ればいいなー、という内容です。 データサイエンティストの頭の中「偉い人たちは頭がおかしい」と言っても、それは相対的なものであるため、比較対象であるデータサイエンティストの頭の中を覗いてみましょう。 データサイエンティストは組織におけるデータ活用状況について、レベル分けして考えます。そして、基本的に前のレベルが実現できなくては、次のレベルに進むことはできないと考えています。 以下のレベル分けは私が適当に思い描いているものですが、同業者なら大よそ一緒なんじゃないかと思います。 Lv0: データ収集、ログ設計Lv1
1.具体的な事が分からないプログラミングで主にやる事は下記の2つ。 ①IFでAかBを選択させてどっちかの設定を実行 ②Whileで決められた回数分繰り返す これでやりたいことは分かる。分かるけれどこれでどうやって動画や音楽のエンコードをしたり 画像処理をしたりするソフトウェアになるのかというのがよく分からない。 あるいはWordとかExcelとかがどうやってこんなので作られているのかが分からない。 プログラミング入門書を読んでも、一般的に知られているソフトウェアの作り方みたいな事が 書いてないので、ゴールが見えてこない。だからうんざりしてくる。 入門書を読むと、判定と繰り返しとあとどこかからかそういうプログラムが既に作られている フレームワークだとかよく分からないものを持ってきて使ってくださいってなっている。 だからそのフレームワークがどういう風になっているのかって説明からして欲しいって思
この特集で挙げた57の要因に関して、Yahoo! JAPANに限定して集計した重要度のランキングを示す。 プラス要因トップ20(Yahoo! JAPAN)titleタグ内でのキーワード使用被リンクのアンカーテキストサイト全体でのリンクポピュラリティ本文でのキーワード使用Yahoo!ディレクトリへの登録サイト内部構造としてのリンクポピュラリティリンク元サイトのサイト全体でのリンクポピュラリティサイト開設からの経過時間被リンクの話題関連性サイトの主要テーマと検索の関連性リンク元ページとの話題の関連性被リンク増加率本文のコンテンツとキーワードの(トピック分析による)関連性インデックス可能なテキストコンテンツの量h1タグ内でのキーワードの使用話題コミュニティ内でのリンクポピュラリティリンク元サイトとの話題の関連性リンク設置からの経過時間文書公開からの経過時間リンク周辺のテキストマイナス要因トップ5
この記事ははてなエンジニアアドベントカレンダー2014の23日目とシステム系論文紹介 Advent Calendar 2014の23日目を兼ねています。 今回は、インフラエンジニア向けにシステム系論文を読むということについて書きます。 ここでいうインフラエンジニアは、Webサービスを作る会社のサーバ・ネットワーク基盤を構築・運用するエンジニアを指しており、はてなではWebオペレーションエンジニアと呼んでいます。 人が足りなくて普通に困っているので採用にご興味のある方はぜひこちらまで。 SRE (Site Reliability Engineer) 職 - 株式会社はてな はてなでは、id:tarao さんを中心に有志で論文輪読会を定期的に開催しており、システム系論文にかぎらず、言語処理系、機械学習についての論文などが読まれています。 だいたい1人でインフラまわりの論文を読んでいて、インフラ
新入社員のこばかなさんが、「こばかなスケッチ」という自分企画を頑張っている。THE GUILDでの日々の仕事と、読書で学んだことを、一枚のスケッチにまとめるチャレンジだ。 彼女のスケッチが溜まってきたので、復習とサポートを兼ねて、解説を書いていきたい。第二回はこの絵。 行動 = 動機 × 実行能力 × きっかけ今回のこばかなさんのイラストは、「フォッグの消費者行動モデル」という概念モデルだ。ざっくり言うと、ユーザーが行動を起こすために必要な3条件を示している。 このモデルでは、「ユーザーが何かアクションを起こす」条件を、 B = MATという、とてもシンプルな式で表現する。 その意味は、「行動(Behavior)」には、「動機(Motivation)」と「実行能力(Ability)」があるタイミングで、「きっかけ(Trigger)」が訪れなければならない…というものだ。 ・動機(Motiv
.NET開発者中心 厳選ブログ記事 開発者が知っておくべき、6つのUIアーキテクチャ・パターン ―― 「matarillo.com」より ―― 猪股 健太郎 2011/12/15 「.NET開発者中心 厳選ブログ記事」シリーズでは、世界中にある膨大なブログ・コンテンツの中から、特にInsider.NET/.NET開発者中心の読者に有用だと考えられるブログ記事を編集部が発掘・厳選し、そのブログ記事を執筆したブロガーの許可の下、その全文を転載・翻訳しています。この活動により、.NET開発者のブログ文化の価値と質を高め、より一層の盛り上げに貢献することを目指しています。 Martin Fowler氏の『GUI Architectures』を訳して公開しようと思ったのだが、FAQページに「PofEAAの続編などは商業出版する予定なので翻訳はしないでほしい」と書いてある。なので翻訳の公開はやめて、「
もう外野になった人間ががとやかく言うのも、中の人的には面白くないかもしれないけれど... 言わないで後悔するより言った方がマシ、という精神で書き残します。あくまで個人の視点です。あまり賛同してもらえないと思うし。 純粋にインタフェース、という意味の改善ではすごく良いなあと感じた モダンになったし、拡張性のある UI だと思った 使いやすいと思う 一方、コンセプトの転換、という点ではあまり評価できない マイホットエントリーは、技術屋がアルゴリズムを使ってみたいからそうしましたというのを抜け出せてない と、現時点では思ってしまった。作った人には、申し訳ない まだ精度のチューニングが十分でないから? 夕方に新UIに切り替えてから、ほとんどフィードが流れてない まだ、facebook の News Feed のような「大きな問題を解決」した機能にはなってないと思った 今のはてなブックマークは、ユー
携帯版には、半径1.5km内に一言コメントを残す機能がついています。 QRコードを読み取って携帯電話からサイトへアクセスしてください。 http://m.ichiten.com/ ←携帯電話からしかアクセスできませんのでご了承下さい。
◆◆◆ 「確率的に確からしい」という言葉を続けるロボット ――最近、ChatGPTという言葉をよくインターネットで目にします。なんとなく「こんなことができるのかな……?」というイメージは湧いているのですが、具体的なサービス内容を簡単に教えてもらえるでしょうか。 深津貴之氏(以下、深津) 一言で言えば「人間の言葉で質問すると、人間の言葉で答えてくれるロボット」です。 例えば、質問に答えてくれたり、相談に乗ってくれたり、長文を要約してくれたり……。これまでの“検索”とは違って、人間的な知性があるかのように“文章で返答をしてくれる”のが大きな特徴というサービスですね。 お昼ごはんについて質問したときの回答。これまでの“検索”とは良くも悪くも勝手が違うことがよくわかる これはAIに大量の単語を学習させることで、「直前の単語に対して、最も可能性が高い次の単語を予測している」んです。例えば「むかしむか
2021.02.16 「私はロボットではありません」はワンクリックでなぜ人間を判別できる? 仕組みとその限界を聞いてきた WebサイトにIDとパスワードを入力するとき、ときどき「私はロボットではありません」にチェックを求められることがあります。 僕はロボットではないので、当然チェックを入れて認証を進めるわけですが……。でもちょっと待ってください。なぜクリックひとつで、人間かロボットかを判断できるんでしょう。 これはきっと、人間ではないなんらかの不正アクセスを防ぐ仕組みのはず。でもチェックを入れるくらい、プログラムを作ってなんやかんやすれば、シュッとできるのでは? 「私はロボットではありません」は、どんな仕組みで人間とロボットを判別しているのか。もっといい方法はないのか。これまでの歴史的経緯も含め、情報セキュリティ大学院大学の大久保隆夫教授に聞きました。 気づかないうちに「人間かロボットか」
2016年秋、キュレーションメディアの事件は、健康系メディアWELQの低品質な記事の問題から始まりました。 多くのメディアが情報の信頼性など多くの問題提起を行い、11月中旬よりWELQの記事は消され始めて12月2日にはサイトが非公開に。そのままいまも再開はされていません。 あれからもうすぐ半年になります。 この半年は日本のインターネットメディアと検索エンジンにおいて大きな変化があった期間です。 ネットメディアとしては、WELQの終了を前後して運営を終了するメディアや、運営体制の見直しなど品質を高めようとする動きが多く現れました。 検索エンジンGoogleも、WELQの退場後数ヶ月遅れでいくつかの対策を発表しています。2月には事実上のキュレーションメディア対策を行ったことを発表した後、4月には更に信頼性や正確性などを重視するアルゴリズムがローンチされたと発表。その他にもいくつかの改善を続け、
機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning) 作者: 加藤公一出版社/メーカー: SBクリエイティブ発売日: 2018/09/21メディア: 単行本この商品を含むブログを見る発売されてからだいぶ経ちますが、構想段階の頃より著者の「はむかず」さんこと加藤公一さんからお話を伺っていて注目していたこちらの一冊をようやく一通り読みましたので、サクッと書評めいた何かを書いてみようかと思います。 各章の概要 言うまでもなく実際の内容は皆様ご自身でお読みいただきたいのですが、これまでの書評記事同様に概要を簡単にまとめておきます。 第01章 学習を始める前に Python環境やAnacondaのインストールについての説明もなされているんですが、重要なのは後述する「本書は何を含まないか」という節。ここに本書の狙いの全てが書かれていると言って
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く