タグ

2015年10月29日のブックマーク (12件)

  • PGroonga(ぴーじーるんが) 1.0.0リリース

    PGroonga(ぴーじーるんが) 1.0.0リリース 今日は肉の日ですね! PostgreSQLからGroongaを使えるようにするPGroongaの1.0.0をリリースしました!最初のメジャーリリースです! PGroongaについて PGroongaはPostgreSQLを高速に日語全文検索可能なシステムに拡張する魔法のような拡張機能です。PGroongaの他にも類似の拡張機能はありますが、速度・機能面で他の拡張機能とは一線を画しています。これはPGroongaはバックエンドにGroongaという格的な全文検索エンジンを使っているためです。 速度面では類似の拡張機能であるpg_bigmよりも高速です。インデックス作成時間、検索時間ともに数倍から10倍以上高速です。 PostgreSQLで日語全文検索 - LIKEとpg_bigmとPGroonga - ククログ(2015-05-2

    PGroonga(ぴーじーるんが) 1.0.0リリース
  • 3割の力で作って、新聞やテレビで紹介され、生活費くらいのお金が入るネタサイトの作り方【連載:村上福之】 - エンジニアtype | 転職type

    DB設計のメモ。ネタサイトのレベルであれば、これくらいで問題がないと思う ネタサイトの作り方その2: コードをもりもり書く。なるべくPHPで ある程度設計が固まったら、ブラウザでCloud9を起動して、いきなりコードをもりもり書きます。 サーバの言語はPHPが多いです。運良くヒットした時、日の大きな会社にサービスを売却するのに便利なのはPHPだからです。 Cloud9は素晴らしいです。感動します。無料でいきなりクラウド上のオンラインIDEとサーバを用意してくれます。ApacheとMySQLRubyPHPとGitくらいは普通に入っています。 昔は、オンラインIDEは遅くてダメなものが多かったのですが、Cloud9だけは別格です。テキストエディタすら立ち上げません。3割くらいの力でネタサービスを作るには最強の環境です。 オンラインIDEでは珍しく、ターミナルも叩けますので、普通にGit

    3割の力で作って、新聞やテレビで紹介され、生活費くらいのお金が入るネタサイトの作り方【連載:村上福之】 - エンジニアtype | 転職type
  • さくらインターネットがクラウド市場で負け組にならない理由 (1/3)

    Amazon Web ServicesやMicrosoft Azureなど外資系の事業者が圧倒的な存在感を誇るクラウド市場。こうした中、気を吐いているのが、さくらインターネットだ。コミュニティ、人材登用、パートナー施策、R&D、スタートアップ支援など矢継ぎ早に繰り出される施策、そして全体を貫く「熱量」と「寛容さ」について田中邦裕社長に聞いた。(インタビュアー:TECH.ASCII.jp 大谷イビサ 敬称略) われわれ以外の人たちで熱量を昇華させるものが必要だった 大谷:まずはユーザーコミュニティ「さくらクラブ」についてお聞きします。7月に鹿児島で行なわれたキックオフイベントにお邪魔したのですが、さくらインターネットファンの熱意と活気に驚きました。設立の意図についてお聞かせください。 田中:はい。「さくらの夕べ」もそうですが、今まではわれわれが主体でやっている活動がすべてで、ユーザーさん主体

    さくらインターネットがクラウド市場で負け組にならない理由 (1/3)
    aki77
    aki77 2015/10/29
  • 毎日コードを書くことと、それにまつわること

    とあるきっかけで、ここ1年半近くやってきた、毎日コードを書くことについて振り返ってみようということになった。 実質続いてるのは約一年。始めたのは2014年の3月頃。 約1年前に1週間ほど途切れた期間があるが、そこからちゃんと再開しているので、そこについても言及した方が良いかもということであえて試みを始めてからの期間で1年半と言っている。 これは現時点のコントリビューションの状況。 思いのほか、気づきがあって良かったと思う。きっかけを与えてくれた2人に感謝。 自分がこんなエントリを書くとはおこがましいという感覚があるのだけれど、2人の意見を聞いて、もしかしたらこの話をオープンにしたら誰かの役に立つかもと思い、一度Secret Gistとして書いたものをもう一度時間を取って振り返り、バックグラウンドの説明を含めたりしつつ書き改めてみた。 前置きが長くなったが、これは毎日コードを書くことのような

  • TechCrunch | Startup and Technology News

    French AI startup Mistral is introducing new AI model customization options, including paid plans, to let developers — and enterprises — fine-tune its generative models for particular use cases. The…

    TechCrunch | Startup and Technology News
    aki77
    aki77 2015/10/29
  • Elasticsearch 日本語で全文検索 その2

    Elasticsearch では、すでに日語で全文検索する為のトークナイザーやノーマライズなどの加工処理で使用するフィルターなどがビルトインまたは、サードパーティ製のプラグインとして多数存在します。 ここでは、日語全文検索で使用しそうなトークナイザーやフィルターなどを説明します。 主要モジュールNGram Tokenizer N-グラムを提供するトークナイザーです。Elasticsearch にバンドルされています。Japanese (kuromoji) Analysis for Elasticsearch 日形態素解析を提供するプラグインです。各種 Analyzer、Tokenizer、TokenFilterが含まれます。cjk_width Token Filter 半角・全角などを統一するためのフィルターです。Elasticsearch にバンドルされています。Lowercas

    Elasticsearch 日本語で全文検索 その2
  • Elasticsearch 日本語で全文検索 その1

    語は、分かち書きしない言語のため日語でちゃんと全文検索できるようにする為には、検索対象のコンテンツの内容、利用するユーザーのスキルなどを考慮しなければ検索精度を向上させることは非常に困難です。逆を言えば、検索対象のコンテンツ、利用するユーザーのスキルが変われば設計が変わってくると言えます。 日語を検索できるようにトークナイズするには、代表的なものに形態素解析とN-グラムがあります。簡単に説明すると形態素解析を検索で使用すると、単語単位で検索するため、適合率が高く(マッチ度が高いものが検索される)、再現率が低くなります(検索漏れが多くなる)。例えば、キーワード ”京都” では、”東京都” はヒットしません。一方、N-グラムを検索で使用すると、データベースのLike検索に近い検索が可能になり、形態素解析とは逆に、再現率が高くなり、適合率が低くなります。 これらの日語解析の特徴と、検索

    Elasticsearch 日本語で全文検索 その1
  • 本が売れぬのは図書館のせい? 新刊貸し出し「待った」:朝日新聞デジタル

    公立図書館の貸し出しによりが売れなくなっているとして、大手出版社や作家らが、発売から一定期間、新刊の貸し出しをやめるよう求める動きがある。背景には、深刻化する出版不況に、図書館の増加、サービス拡充もある。を売る者と貸す者、相反する利害のはざまで、出版文化のあり方が問われている。 「増刷できたはずのものができなくなり、出版社が非常に苦労している」。10月半ば、東京都内で開かれた全国図書館大会の「出版と図書館」分科会。図書館関係者が多くを占める会場で、新潮社の佐藤隆信社長が、売れるべきが売れない要因の一つは図書館の貸し出しにある、と口火を切った。 佐藤社長は、ある人気作家の過去作品を例に、全国の図書館が発売から数カ月で貸し出した延べ冊数の数万部のうち、少しでも売れていれば増刷できていた計算になると説明。司会役の調布市立図書館(東京都)の小池信彦館長が「それは微妙な問題で……」と言葉を濁

    本が売れぬのは図書館のせい? 新刊貸し出し「待った」:朝日新聞デジタル
    aki77
    aki77 2015/10/29
  • すごい速度で文章が読めるようになる「Spritz」をウェブページで使用可能にするブックマークレット「OpenSpritz」

    By Paul Watson 単語が目に飛び込んできてすごい速度で文章を読めるようになる「Spritz」という技術に着目したRich Jonesさんが開発したブックマークレットが、ウェブページのテキストをSpritz方式で表示させる「OpenSpritz」です。 Announcing OpenSpritz - A Free Speed Reading Bookmarklet - Gun.io https://gun.io/blog/openspritz-a-free-speed-reading-bookmarklet/ Spritzがどんな技術なのかは以下の記事を読めば分かります。 単語が目に飛び込んできてすごい速度で文章を読めるようになる「Spritz」 - GIGAZINE 「OpenSpritz」を使用するには、まずこのページへ飛び、「OpenSpritz this!」と書かれたアイ

    すごい速度で文章が読めるようになる「Spritz」をウェブページで使用可能にするブックマークレット「OpenSpritz」
  • サイト訪問者がcookieを切っていても追跡可能な手法が明らかに

    by Andy Arthur ウェブサイトによる行動追跡を防ぐためにcookieを削除していても、そのユーザーが以前に訪れたサイトのドメインや履歴を知ることができる手法があると、研究者が発表しました。 Unpatched browser weaknesses can be exploited to track millions of Web users | Ars Technica http://arstechnica.com/security/2015/10/unpatched-browser-weaknesses-can-be-exploited-to-track-millions-of-web-users/ これは独立系研究者のYan Zhuさんが「ToorCon: San Diego 2015」の中で語ったもの。講演時の資料のPDFファイルが以下のツイートからダウンロード可能です。

    サイト訪問者がcookieを切っていても追跡可能な手法が明らかに
  • CSSfmtをつくった話、もしくは本質的な問題解決とは - Qiita

    CSSfmtという、CSSとSCSSのコードを自動整形するツールをつくった。 使い方はREADMEを見たらわかると思う。Atom, Sublime Text, Vim, Emacs用のプラグインがあるので、エディタで使うのがおすすめ。コマンドラインからも使える。 atom-cssfmt sublime-cssfmt vim-cssfmt cssfmt.el AtomでCSSfmtが動いている様子: なぜつくったのか チーム開発において、コードのフォーマットが統一されていないことがある。 フォーマットの小さな違いはわざわざ指摘するのもめんどうだし、指摘されても嫌な気分になる。なので、コードをあるルールに従って自動で整形するツールの導入は必須だと思う。 CSSコードの整形ツールはいくつかある。CSS BeautifyやCSScomb、stylelintでも可能だ。 これらのツールとCSSfmt

    CSSfmtをつくった話、もしくは本質的な問題解決とは - Qiita
  • Otto : モダンな開発者の新しい友人 | Yakst

    HashiConfで発表されたHashiCorpの新しいツールOtto。Vagrantの後継という位置付けですが、OttoとVagrantとの技術的な違いは何か、コンセプトはどのようなものか、今後どのように使われていくのかといったことを分かりやすくまとめた記事。 出典について この記事は、Benny Cornelissen氏によるOtto: a modern developer's new best friendを翻訳したものです。 Ottoとは? HashiCorpによると、OttoはVagrantの後継という位置づけです。Vagrantはリリースされてからたくさんの変更が加えられていますが、大きな改善をしつつも、最初にリリースされた時とほとんど同じことを基的にはやっています。Ottoを使えば、ローカル開発からデプロイまでのワークフロー全体を見直されることになるでしょう。 Ottoは

    Otto : モダンな開発者の新しい友人 | Yakst