先日学生に聞かれたんですよ。 「下流工程は大変って聞きますが、上流は楽なんですよね?」 よろしい、君はよく勉強している。でも根本的に間違っている。下流工程が辛いのは、上流工程でちゃんと仕事ができなかったからだ*1。 というわけで、主に学生向きに話を単純化して語ってみます。これが普通だとか、一般的だとか言うつもりはなく、違う視点もあるかと思いますが、一つの考え方として。 SIでのシステム開発は、建設業にたとえられます。が。 顧客の希望を聞き、設計し、施工し、引き渡す。こういった工程を踏む仕事ということで、システム開発はよく建設業にたとえられます。実際に工程管理の手法なども似通っています。ところが、大抵の場合、耐震偽造をした建築物よりもシステムのほうが脆弱に仕上がります。何故でしょうか。 一つには、建物の図面を引くには建築士の資格が必要ですが、システムの設計に資格は必要ありません。 もう一つ、
http://dl.dropbox.com/u/511116/noime/noime.html そもそも「変換候補が表示されてそこから選ぶ」というのがめんどくさいから、ぜんぶ Google 日本語入力 API に任せたらどうなるかを試してみた。最後の入力から 0.5 秒経ったら自動で変換処理を開始する。IME を OFF にして "toukyoutokkyokyokakyoku" とかをキーボードから入力するとどういうことか分かる。JavaScript でテキストエリアの文字列を管理するのがむずかしくていろいろちゃんと動いてないけど、だいたい感じは掴めた。違うものを作ってたつもりなのに結局これ (変換操作を省いて自動的に変換・確定する:IME即効テクニック) の劣化版みたいな感じになったような…。 あと副産物として GlitchIME の JavaScript 版とかも作った。
holly's wiki hollyさんのwiki トップページページ一覧メンバー掲示板編集 perlねた 最終更新: kurt0027 2012年11月25日(日) 19:25:55履歴 Tweet システムのバックエンドはなんだかんだとperlをメインでつかってていろいろノウハウがあるのでまとめてみる インストール windowsはとりあえずおいといて、linuxだとrpmで入っているバージョンは古いので、ソースから最新のバージョンをインストールする インストール方法は結構ふるいので、perlbrewとかつかったほうがいい。最近のperl事情2012参照 cd /usr/local/src wget //www.cpan.org/src/5.0/perl-5.12.2.tar.gz tar xvfz perl-5.12.2.tar.gz cd perl-5.12.2 ./Configu
昨晩勉強会のあと20分くらい takuo-h くんと話したのだが、授業や勉強会が多過ぎてキャパシティを超えているとのこと、たぶん松本研の M1 はみんなそうではないかな。自分も M1 の間は平日は毎日3時間睡眠で予習・復習・勉強会そしてバイトと大変だったし、大体みんな忙しいのである。 NAIST の M1 自体がそもそも授業の負荷が高いのに加え、松本研は特に勉強会の数が多いので、全部出ていると相当しんどいはず。とはいえ、出ていると耳学問でいろいろと学ぶこともあるので、可能な限り出るとあとあと「限界に近かったけど出ていてよかった」と思うこともあるだろうし、そのあたりは自分の体力との相談かと…… そういえば以前書いた松本研究室の手引きという文書を発掘した。修士の2年間しか書いていないので、博士の3年間も書きたいのだが、結婚して夫婦で1年間奈良で暮らしたりしていて、あまり他の人の参考にならないの
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
日本語の単語分割処理は、一般に、単語辞書と単語間連接の規則や学習データに基づいて行われます。オープンソースとして有名なものがいくつもあります。 KAKASI - 漢字→かな(ローマ字)変換プログラム JUMAN - KUROHASHI-KAWAHARA LAB chasen legacy -- an old morphological analyzer http://mecab.sourceforge.net/ これらのツールは主に新聞記事のような一般的なテキストが対象です。単語辞書に登録されていない語は未知語として処理されますが、特定分野のテキストを対象として解析精度を保つためには、専門用語や新語などを適宜登録する必要があります。 他方、文字間に単語境界があるかどうかを機械学習の2値分類問題として解く手法があり、ツールも公開されています。 KyTea (京都テキスト解析ツールキット) 次
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く