タグ

2016年1月31日のブックマーク (7件)

  • 過去のホームページを収集・公開しているウェブアーカイブサービス7選

    過去のホームページを文化遺産として捉え、収集事業をしているサービスは世界中に存在する。もっとも有名なのはInternet Archiveが運営する「Wayback Machine」だが、それ以外にも特定地域やジャンルに強いアーカイブサービスは多数存在しており、海外のサイトながら日語サイトを収集しているサービスも一部に見られる。今回は、日語サイトを収集・保存していることが確認できるアーカイブサービスを7つ紹介する。 ◇Wayback Machine ご存知ウェブアーカイブの大御所。1998年以降、世界中のサイトを収集しており、その数は4600億件にも及ぶ。クロールの頻度も飛び抜けて高い。

    過去のホームページを収集・公開しているウェブアーカイブサービス7選
  • 【チュートリアル】機械学習を使って30分で固有表現抽出器を作る - Qiita

    はじめに 固有表現抽出は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を抽出する技術です。固有表現抽出は、質問応答システム、対話システム、情報抽出といった自然言語処理を用いた応用アプリケーションの要素技術としても使われています。 今回は機械学習技術を使って固有表現抽出器を作ってみます。 ※注意事項 理論的な話は一切出てきません。理論を知りたい方は他を当たってください。 対象読者 固有表現抽出を少しは知っている方 固有表現抽出器を作ってみたい方 Pythonコードを読める方 固有表現抽出とは? ここでは、固有表現抽出の概要と方法について説明します。 概要 固有表現抽出は、テキストに出現する人名や地名などの固有名詞や、日付や時間などの数値表現を抽出する技術です。具体例を見てみましょう。以下の文から固有表現を抽出してみます。 上記の文に含まれる固有表現を抽出すると人名と

    【チュートリアル】機械学習を使って30分で固有表現抽出器を作る - Qiita
  • 画像処理の数式を見て石になった時のための、金の針 - Qiita

    画像処理は難しい。 Instagramのキレイなフィルタ、GoogleのPhoto Sphere、そうしたサービスを見て画像は面白そうだ!と心躍らせて開いた画像処理の。そこに山と羅列される数式を前に石化せざるを得なかった俺たちが、耳にささやかれる「難しいことはOpenCVがやってくれるわ。そうでしょ?」という声に身をゆだねる以外に何ができただろう。 稿は石化せざるを得なかったあの頃を克服し、OpenCVを使いながらも基礎的な理論を理解したいと願う方へ、その道筋(アイテム的には金の針)を示すものになればと思います。 扱う範囲としては、あらゆる処理の基礎となる「画像の特徴点検出」を対象とします(実践 コンピュータビジョンの2章に相当)。なお、記事自体、初心者である私が理解しながら書いているため、上級画像処理冒険者の方は誤りなどあれば指摘していただければ幸いです。 画像の特徴点とは 人間が

    画像処理の数式を見て石になった時のための、金の針 - Qiita
    gayou
    gayou 2016/01/31
  • 「囲碁の謎」を解いたグーグルの超知能は、人工知能の進化を10年早めた

  • 機械学習とディープラーニングとは その2 | IoT NEWS

    昨日に続き、IoTをゼロベースで考えるの第21回は「機械学習」と「ディープラーニング」についてだ。 前回機械学習について説明をしたが、今回はディープラーニングについて説明をする。 前回の機械学習の記事はこちら ディープラーニングという言葉の意味を的確にとらえるのはとても難しい。ただでも難解な数学の知識が前提になっているからだ。しかし、ここではなるべくわかりやすく書くことにする。 前回の機械学習の説明の最後に、機械学習の課題があると述べた。学習に必要なパラメータを結局はヒトがやっているという点だ。 このパラメータは、学習すべき内容の「特徴」とも呼び変えられるもので、ヒトは、この「特徴」をうまく脳でとらえることができる。 例えば、ネコの写真とイヌの写真を見て、こっちがネコで、こっちがイヌだと見分けるとき、「目のカタチ」「耳のカタチ」「しっぽ」「立ち居振る舞い」など、様々な特徴を瞬時に判断して区

    機械学習とディープラーニングとは その2 | IoT NEWS
  • 機械学習とディープラーニングとは その1 | IoT NEWS

    IoTをゼロベースで考えるの第20回は「機械学習」と「ディープラーニング」についてだ。 この言葉、IoTや人工知能の話題ではよく出てくる言葉だが、きちんと説明するのはとても難しい。私も以前聞かれた時とても曖昧な答えしかできなかったので、整理してみる。前後半にわけて解説し、第一回は機械学習についてだ。 機械学習と切っても切り離せないのがインターネットの普及だ。Googleができたのが、1998年、データマイニングの研究が盛んになったのも1998年ということで、このあたりから機械学習の研究は大きく発展したということだ。 機械学習の概念を簡単にいうと、「意味は特に考えず、単に機械的に、正解の確率の高いものを当てはめていく」やり方だ。例えば、翻訳の世界でいうと、「英語でこういう単語の場合は、日語ではこの単語で訳される場合が多い」「英語でこういうフレーズの時は、日語ではこういうフレーズで訳される

    機械学習とディープラーニングとは その1 | IoT NEWS
  • re:dash - オープンソースのデータプラットフォーム

    MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しました 世の中ではオープンデータの流れが進んでいます。企業はもちろんのこと、政府や自治体においてもデータを再利用しやすい形でオープンにしています。 そんなデータをみんなにとって使いやすい形で公開、シェアできるのがre:dashです。 re:dashの使い方 ダッシュボードです。すでに公開されているデータがたくさんあります。 グラフで描画されています。 CSVとして確認もできます。 ピボットテーブルも用意されています。 CartoDBとの連携もできます。 こんな複雑なグラフも描けます。 自分で追加もできます。データソースは一般的なデータベースはもちろん、BigQuery、Googleスプレッドシート、ElasticSearch、Amazon Redshift、Hive、InfluxDB、Tr

    re:dash - オープンソースのデータプラットフォーム