タグ

ブックマーク / codezine.jp (7)

  • 検索技術と自然言語処理技術を駆使して話題のトピックをひとまとめ ~はてなブックマークのトピックページの作り方

    はじめに 稿では、はてなブックマークの10周年記念の第1弾として開発した「トピックページ」の作り方について解説します。トピックページとは、インターネット上で話題となったトピックを閲覧できるページです。 トピックページは、トピックに関連する記事の集合とトピックを表すタイトルから構成されます。 トピックページ生成の流れは以下の通りです。 トピック生成 トピック表すキーワード集合を獲得し、そのキーワードに関連する記事を収集する。 トピックタイトル生成 トピックに関連する記事の情報を利用してトピックを表すタイトルを生成する。 稿では、Elasticsearchなどの検索技術を活用したトピック生成方法、および、CaboChaなどの自然言語処理技術を活用したトピックタイトル生成方法について説明します。 対象読者 Elasticsearchを利用している/したい方 検索技術、自然言語処理技術に関心の

    検索技術と自然言語処理技術を駆使して話題のトピックをひとまとめ ~はてなブックマークのトピックページの作り方
  • 「PostgreSQL 9.4」がリリース、データ型にJSONBをサポート、GINインデックスの性能が改善

    最新版では、新たなデータ型として「JSONB」(バイナリJSON)を追加しており、データストアのリレーショナル/非リレーショナルの選択は不要で、両方を同時に利用できる。JSONBは、高速なルックアップと、Generalized Inverted Indexes(GIN)を利用した簡易な検索クエリ記述をサポートし、JSONデータを一般的なデータベースと同等か、それ以上のパフォーマンスで扱える。さらに、テーブルとドキュメントの容易な統合を実現する。 ほかにも、複数マスタのPostgreSQLクラスタ作成をサポートする、双方向レプリケーションのように利用可能な、レプリケーションの読み取り/フィルタリング/操作に対応するAPIの提供を行う。また、レプリケーションスロットや時間差レプリカ、レプリカサーバにおける管理機能などの向上も行っている。 なお、GINインデックスの進化によって、インデックスサイ

    「PostgreSQL 9.4」がリリース、データ型にJSONBをサポート、GINインデックスの性能が改善
  • モダンPerl入門増補改訂版(仮)

    ページは『モダンPerl入門 増補改訂版(仮)』の特設サイトです。商品紹介のほか、電子書籍版の早期ディスカウント販売(β版を先行提供)などを予定しています。今後の更新情報は「CodeZine Books」のFacebookページなどで配信していきます。 書の内容 書は、Perl言語でプログラミングする上で、筆者の経験を基に日々の仕事で使えそうなティップスやベストプラクティスを集めたです。基礎知識は身につけている読者を想定して、Perlの基文法やプログラミングの基は意図的にカバーしていないため、プログラミング初心者にとって書は難解かもしれません。 2009年に刊行した初版では、いまだに根強い「PerlCGI」「Perl=オブジェクト指向ができない」「Perl=開発が止まっている」といった間違った思い込みを正したいという当時の筆者の思いから、筆者が使っている最新ツールやモジュ

    hide_o_55
    hide_o_55 2013/09/18
    “刊行日: 2013年1月予定” ん?2013年・・・?
  • マルチスレッドを意識しないマルチスレッド・ライブラリ「Intel Concurent Collections」がおもしろい

    「Intel Concurrent Collections for C++」(CnC)とは 実際並列処理はややこしいしおっかないです。大きなキッチンで大勢のコックが包丁とフライパン振り回しているようなもので、ほっとけばしっちゃかめっちゃかになっても不思議じゃない。各人はそれぞれの役割に専念し、他人のふるまいを気にせず勝手に働きながらも全体としては統制のとれた動きを作り出さにゃなりません。mutexで排他制御したりjoinで完了を待ったり、さまざまな道具を駆使して統制のとれた動きを作り出しているのはプログラマであり、そこがいちばん難しく悩ましいところです。 C++,C#あるいはVB,Javaもそうですが、コードは原則的に並べた順に実行されます。 と書けば、まずf()、それが終わればg()、しかるのちh()の順で呼び出されます。たとえこの3つをどの順にやっても(あるいは同時にやっても)構わない

  • Perlユーザーの国内動向調査、幅広い参加を呼び掛け

    Perl5 Census Japan 2013 アンケートはGoogleドキュメントのフォームを介して匿名で受けつけており、Perlをメインで使っていないユーザーの回答も歓迎している。投稿期限は4月19日を予定。 集計結果は、後日グラフの形で開示したり、Perlユーザー向けの年次イベント「YAPC::Asia Tokyo 2013」で利用したりする意向を表明している。既に多くの回答が得られているようで、「それなりに興味深いデータが出始めてる。まだクロスリファレンスとかやってないからもう少しいじるとおもしろいかも・・・」ともコメントしている。 このような国内調査の機会は希少なため、過去にPerlを一度でも触ったことがあるエンジニアはぜひ参加してみるとよいだろう。回答所要時間は数分程度。 【関連リンク】 ・Perl5 Census Japan 2013 ・@lestrrat(牧氏のTwitte

    Perlユーザーの国内動向調査、幅広い参加を呼び掛け
  • C#たんと学ぶ/わりと硬派なソフトウェア開発講座 第2回「デスクトップアプリケーション」

    CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

    C#たんと学ぶ/わりと硬派なソフトウェア開発講座 第2回「デスクトップアプリケーション」
    hide_o_55
    hide_o_55 2011/06/06
  • 分散環境でのPHPによるタスク管理 - Zend_Queue -

    連載では、PHP上で動作するアプリケーションフレームワークであるZend Frameworkについて紹介していきます。今回は分散アプリケーション間でのデータのやりとりを行うための方法の一つである「メッセージキュー」を利用するためのZend_Queueコンポーネントを紹介します。 はじめに 連載では、PHP上で動作するアプリケーションフレームワークであるZend Frameworkについて紹介していきます。今回は分散アプリケーション間でのデータのやりとりを行うための方法の一つである「メッセージキュー」を利用するためのZend_Queueコンポーネントを紹介します。 ユーザからデータを受け取り、それの処理をするようなサービスがあったとします。この処理に時間がかかるようであれば、例えばフロントエンドでは「データを受け付けました」とだけ表示し、バックエンドでデータを処理する仕組みが必要です。こ

    分散環境でのPHPによるタスク管理 - Zend_Queue -
  • 1