タグ

ブックマーク / cafebabe.hatenablog.com (34)

  • 某ワークショップ - かふぇ・べいぶ別館

    今回はO形氏が中心になって企画した改定常用漢字表についてのワークショップ(講演資料が公開されている)に参加.東京で開催されると気軽に参加できて嬉しい. 最初のO形氏による問題をわかりやすく整理した発表があり,その後各自の発表がおこなわれて,最後にパネル討論. M先生の発表は,実際に用いたnグラムを用いた頻度調査資料の簡単な分析.委員会では,頻度だけでなく「造語力」も重視されているとのことだが,実際にどのような分析がおこなわれたのか不明だが,これは比較的簡単に定義できるのではないか?と後からM先生とH原氏と議論.ただ,「醤」が出現頻度が高くても漏れているようだが,これはほとんど「醤油」としか出現しないからではないかと思われるが,反面「醤油」という言葉は「醤油ラーメン」,「醤油味」,「醤油バター」,「醤油せんべい」など,単語としての造語力はあるのでないかと思われるので,文字だけでなく単語にも注

    某ワークショップ - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2010/08/16
    文字コード改訂ワークショップの話。資料も公開されている。ウェブの普及は日本語にとってけっこう大きな変化だと思う。
  • 訪問 - かふぇ・べいぶ別館

    G社に行って,技術者採用の担当者に会ってきた(←H田氏とかは「なんでまた…!」と爆笑しそう(笑)).もちろん私が求められているタイプの人材ではないことは自覚しているが,人事部の名前を出されると通常の転職コンサルからのメールや電話のように無視するわけにもいかないし,単に詳しく知りたいだけでもかまわないというので,普段エンジニアから聞けないような話を聞くためだけに行ったのである. 詳しい話はここに書かないが,G社がソフトウェアエンジニアの大量採用を始めたという噂は当だ.ただ,六木ヒルズへの引っ越しが関係しているようで,その後しばらくは反動で採用を減らす可能性が高く,転職するなら今年がチャンスだそうだ.要求するプログラミングスキルは依然として高いものの,語学力,学歴などの条件は若干緩和したそうなので,気軽にチャレンジしてみてはどうか.いろいろ聞き込んできたので,ここに書かない話も直接メールで

    訪問 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2010/05/27
    「G社がソフトウェアエンジニアの大量採用を始めたという噂は本当だ.ただ,六本木ヒルズへの引っ越しが関係しているようで,その後しばらくは反動で採用を減らす可能性が高く,転職するなら今年がチャンス」
  • 「研究」と「開発」 - かふぇ・べいぶ別館

    私が忙しくててんやわんや状態の時に,日企業に一年間しかいなかったり,これから行く人達で某所で面白い議論が行われていたようだ.しかし,一部の発言が消されていたりした(爆)ので,何人かの発言をここに匿名でこっそり取り上げてコメントすることにする. (表には書かなかったけど)自分は「自分の仕事は研究開発です」と言う人はマユツバだと思っている。XXさんの言うように研究と開発はかなり乖離があるのが一般的(IBMやGoogleみたく近いところもある)なので、自分の軸足がどちらかによっていずれか片方を名乗るはず。 会社で「研究開発」というラベルを付けられているから,そう名乗るのだろう.私も会社の人事資料に「研究開発」と書かれているし,他にも「研究開発技術部」のような組織名とか.でも,実際には現在の日企業で「研究」だけという人たちはほとんどいないと理解すればいいはず. 「研究開発です」と言う人は、そ

    「研究」と「開発」 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/12/20
    参考になります!(爆)
  • 某シンポジウム(T大Y田講堂) - かふぇ・べいぶ別館

    朝からT大でウェブ関係のシンポジウム.なおY田講堂に入るのは初めてだったが,歴史があるだけあって,設備の古さが目立つ.まずテーブルは用意されておらず,椅子は小さくクッション性がなく,お尻が痛くないように姿勢を変えているとギシギシして煩い.しかもAC電源がなく,せっかく用意された無線LANも人数が多すぎて使い物にならない(結局ソフトバンク&ドコモの3G回線経由).これで,Twitter経由でしか質問を受け付けないので,会場にいる意味なかったかも.しかも,ライブ感はTwitterを見ていないと決してわからないという逆転現象まで生じていたのだから,会場にいた人は当に大変だったと思う.実は途中で気で会社に戻ろうかと思いましたぁ(爆) しかし,それを逆に見ると,バーチャルな学会の開催という点で意義は非常にある.あえて会場に行く意味をなくし(爆),興味を持つ研究者とエンジニアによる自律分散的な協調

    某シンポジウム(T大Y田講堂) - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/12/09
    参考になるコメント
  • Google日本語入力 - かふぇ・べいぶ別館

    GoogleMac用とWindows用の日本語入力を公開した. 思いどおりの日本語入力 - Google 日本語入力GoogleBlog) 以下はインプットメソッドの感想. 入力レスポンスは快適.素晴らしい. H氏によると「貴社の記者は汽車で帰社した」が変換できるので凄いと言っていたが,「貴社の記者は車で帰社した」は「貴社の記者は車で記者した」になってしまう(笑)ので,文法解析よりも膨大な使用履歴の解析に助けられているのか?ちなみに,MS-IMEやことえりは意外にも一発変換する. このインプットメソッドの登場で期待したことは,「異なるOS(Mac OS XとWindows)のマシン間で同じユーザ辞書を(できれば学習結果も)共有する」ことだが,現在はサポートされていない.私はMac OS Xでは「ことえり」を使っているのだが,その一番の理由はユーザ辞書の共有機能があることだ.この機能

    Google日本語入力 - かふぇ・べいぶ別館
  • 雑用 - かふぇ・べいぶ別館

    誰にも英文添削依頼書類の最新フォーマットのありかがよくわからないというのはどういうことか?まさか英文添削室に置いてあるフォーマットが最新じゃないとは…. デモ用のMacBook Pro 17インチを手配.Windows用のノートパソコンを含めて検討したのだが,自分のプログラムはJavaで書いているので,マシンは何でもいいと思っていたのだけど,さすがに重量が1〜2kgも重いことに気が付いた点で体が負けたorz 確かに今まで学会で大画面ノートを使っていたのを見ると,Dellのノートパソコンとか当に巨大だからなあ….若干CPU能力に欠ける点はプログラミングでごまかさねば…. 最後に翌日の部議資料を作成して,補佐に送付.明日は朝一番で来なければいけないらしい.そのために今日ぐらい早く帰るつもりが,補佐から資料の修正の依頼があり,結局会社を出たのが22時過ぎorz 投稿予定の特集号や面白そうな国際

    雑用 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/10/28
    MacBook Pro 17インチですかー。15インチと悩みます
  • 「優良」企業はHadoopに走る? - かふぇ・べいぶ別館

    Hadoopに関するなかなか興味深い記事. Hadoop World Report:優良企業はなぜHadoopに走るのか(@IT) 独断と偏見に基づいて,理由をまとめてみる. 実行性能の確保.細粒度分散が適した領域では,劇的に高速化できる. 運用の容易さ.細粒度分散が適した領域では,実行性能と容量の確保も単なるノードの追加で済む. クラウドにおけるデータポータビリティが確保でき,データが特定のベンダにロック・インされない. データとシステムのポータビリティが確保できることで,クローズドなプラットフォームを提供する特定のベンダに非常に高額なライセンス料を払う必要がなくなった. 複数の企業が貢献・意見交換・ノウハウ共有できる「標準」のクラウド・プラットフォームとなった. これらを考えると,今時自前のクラウド・プラットフォームを作るのは非常にリスキーな気がする.その理由は,同等以上の性能が確保で

    「優良」企業はHadoopに走る? - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/10/16
    Hadoop に走る企業たち。でも Hadoop は特定のタスクには非常に強力だとは思う。
  • Twitterのフォローと同類選択性 - かふぇ・べいぶ別館

    Twitterにほとんど書き込まない私が書くのもなんだが,Twitterのフォローの仕方には次の二種類があるように思う. 比較的似た相手を見つけてフォローする(例,友人,同業者,同じ趣味の人など) 自分と異なる優れたorこまめに情報を提供してくれる相手を見つけてフォローする(有名人,ニュース関係,企業の公式アカウントなど) 今までいろいろなネットワーク構造を分析してきた経験から推測すると,1はいわゆる社会ネットワークであり,次数(フォロー数,被フォロー数)相関などを見ても正になる(つまり,比較的近い次数の人同士が結びつきやすい)のではないだろうか.これに対して,2はWWWであり,次数相関は負,つまり被フォロー数が多い人を多くの被フォロー数が少ない人がフォローするようになる. 言い換えると,1は情報共有のためのネットワークである.つまり,同類の人達の間の発言を見て,彼らとの情報共有をおこなえ

    Twitterのフォローと同類選択性 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/10/01
    アカウント分離している人たしかにいますね
  • 真っ当な研究者・開発者はぐるなびやホットペッパーで検索しない - かふぇ・べいぶ別館

    今までがんばってくれていたU山補佐が交代するために慰労会が企画されているので,お店の選定がどうなっているかH氏とU越氏に聞いたときに,「忙しいんで,適当にぐるなびで検索して選びます」という返答だった. そこで,以前にここに書いたように,ぐるなびを使って店を選ぶなと言い出そうとすると,横からT氏までが「ぐるなびは店舗情報を知るために使ってもよいが,店を選ぶのに使ってはいけない」と言い出してくれて,これは情報処理研究者の共通認識であることを確認した. 結局,ぐるなびのように店舗情報掲載で収入を得ている場合には,まともな評価システム・ランキングシステムは目的に反するために内部に構築することはできないのだ.だから,評価・ランキングは,一般のサーチエンジンやクチコミサイトなど,別のシステムで代替する必要があるのだ. また,優秀な研究者・開発者はたいていグルメであるということもある.結局,普段から

    真っ当な研究者・開発者はぐるなびやホットペッパーで検索しない - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/30
    広告収入ビジネスモデルの弊害?
  • 某勉強会 - かふぇ・べいぶ別館

    プライバシー保護データマイニングに関する勉強会.数学も統計も不勉強なので完全に理解するのは困難だが,それでも一生懸命聞いてエッセンスでも把握したいと思う. さて,私の話したのは検索クエリをチェックして,問題がある場合には結果を返さないという手法の話.ただ,実際にはかなり狭い部分だけしか議論しなかったり,結果を返して問題がない場合も拒否してしまったり,実際のシステムへの適用はまだかなり遠い道のりのようである.後半部わからない部分があったので,逆に聴衆に質問してみたが誰も知らず,理解できてもいないようだったので,時間がないこともあり少しすっ飛ばした.やはりあそこは難しかったのか…. C大のO田氏のネットの匿名性・個人情報保護に関する招待講演がすごく面白い.実名(identity),仮名(pseudonymity,異なるサービスでも同じユーザ名を使うような場合),完全匿名(anonymity)と

    某勉強会 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/27
    招待講演おもしろかったですね
  • バンビ 茗荷谷駅前店(茗荷谷) - かふぇ・べいぶ別館

    I田氏と昼に行こうとしたら,N先端大のK町氏に「昼をご一緒してもいいですか?」と声を掛けられる.承知しながらも,なぜ私なんかに…と思っていたのだが,まず義兄のA社のインターン(海外)に行っていたことから始まり,Y社のS々野氏の部署やM社(海外)にもインターンに行っているらしいし,弊社のN田氏と共同研究もしているらしい.まさにスーパーマンである.そんな凄い人なのに,不思議なことにこのブログも読んでいるらしい(爆)…なぜだ???ちなみに,あまりにいろいろなところに行くものだから,奥さんが寂しがって大変だそうだ.ぜひ奥さんを大事にしてあげて欲しい. さて,土曜日なので,いつものピカヴォはランチは休み.Namaskarも営業しているか不安なので,駅の近くで探して,I田氏お薦めの「バンビ」に.メンチカツカレーにしたが,予想よりかなり大きい皿で出てきてびっくりした.

    バンビ 茗荷谷駅前店(茗荷谷) - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/27
    SP 研でインターンシップしてたことを伝えてなかったかも(笑)
  • 本読み - かふぇ・べいぶ別館

    某勉強会のための読み&発表資料作成.もっと検索技術よりの話かと思ったら,かなり傾向が異なる.実は私は統計的知識の基礎力に欠けるので,結構大変で悪戦苦闘.まあ,自分なりに一通り終わらせて,発表の時に識者達のコメントでフォローしてもらうしかないな. では,なぜ引き受けたかというと,実はこの分野の研究者であるI田氏を単なるお客ではなく,積極的に議論に関わる立ち場としてこの勉強会に参加させることが来の目的で,多少分野が違う私だが自ら模範を示さねばならないと思ったからだ.しかし,I田氏は担当から逃げてしまったんだよね(爆)女性特有の苦労があるので何も言えないのだが,優秀な研究者は目の前の問題に逃げずに取り組んで来たからこそ成果が出ているので,できる限りでよいから,すこしづつがんばって欲しいのだけど.

    本読み - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/25
    研究者は目の前の問題から逃げずに向かいあうことが重要
  • 某解析の会 - かふぇ・べいぶ別館

    WWW2009論文一気読み大会.前日にTwitterで進行状況が刻々と入って来てあせるが,当日の朝7時頃,とりあえず読み終わる(ただし,一は手抜き(爆)). 当日は各自が選んだ論文を55短時間で紹介.今回の論文の傾向をほんとうにざっくり見ると次のような感じか.面白いのは最初のあたり. 大規模データを手抜きで処理しても,質はそれほど落とさない方法を考えた(G社多し). 個々の技術は既存のものだけど,それらをうまく統合することで面白いことができた. 企業サービスの補完にWebデータを活用して利便性を上げた(企業システムは閉鎖的で使いにくいことが多い) 画像検索サービスと地理情報サービス関係の面白いアイデア. 他の人が使えない企業の内部データを解析した(ただし,一部何も目新しくないものあり). とにかく徹底的に評価・分析する傾向あり(ただし,中にはあまり意味のないものも…) 学習でやってみた

    某解析の会 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/16
    企業内データの問題は自分も痛切に感じます
  • 某研究会ナイトセッション - かふぇ・べいぶ別館

    某研究会に招かれて,伊香保温泉に泊って深夜までWeb技術について議論.あらかじめまとめておいたいくつかのテーマに従って,各グループで議論した結果をさらに全体で議論した. たとえば,ボヘミアン的研究と貴族的研究の話,多くの研究者がWeb研究に行き詰まり感を持っていること,そもそもWebインテリジェンスの「インテリジェンス」って何か?(実は明確に定義されていないらしい),Webが人間の情報処理能力…特に取捨選択能力を低下させている,携帯は人を幸せにするか?,今後の情報検索の方向性,「あってもいい」は「なくてもいい」,オンラインコミュニティ消滅問題,OLのパソコン使用行動(平日昼間が多い(爆)),Twitterは何が良いか?,?ahoo! Japanの訴訟の話(爆),当に重要な情報はWeb上にないこと(またはあっても識別できない),ネットとリアルの融合など. なかなかいろいろな意見があって興味

    某研究会ナイトセッション - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/11
    活発ですね〜24時までとは。。。
  • 〆切 - かふぇ・べいぶ別館

    伊香保温泉で関係者に聞いたところ,投稿先会議(国内・査読つき)は発表枠が22件なのにすでに60件以上登録されているとのこと.投稿件数が多いのに加えて,連続開催の研究会があると安心して招待講演を沢山企画して発表枠が減少したことも今年の倍率増加に影響しているらしく,その研究会の予定枠を含めてもオーバーしている状況だとか.こりゃ真面目に書かないと査読に通らないと,卒論の時からここぞ!という時に使用しているヤクのリポビタンDスーパー(無水カフェインが大量にぶちこまれて眠くなく,ハイになるが,切れると一気に疲労で死ぬ個人的禁止薬物)を服用してがんばる.しかし,提出する日の午前中に未だに最終的な分析プログラムを書いている状況って,研究者としてどうよorz(最初は「僕は研究者 電卓片手に」というつもりが,あまりに組み合わせ数が多すぎて不可能なことが判明)Eclipseを使って,Java言語でありながらイ

    〆切 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/11
    大規模データの中にいなくてもできる研究きぼん
  • iPhone OS 3.1 - かふぇ・べいぶ別館

    最近ショッキングな出来事があって,今日もなかなか寝つけなかったので,とりあえず燗酒を二合呑んでみたが寝れず,そのうちiPhone OS 3.1がダウンロードできるようになったので,二時間ぐらい掛けてダウンロードして,iPhone 3GとiPhone 3GS,そしてiTunesもアップデートしている内に朝(爆)今日〆切で,夕方から呑みに行く約束をしているのに,まったく寝ないで当に大丈夫か?>自分 感覚的には,iPhone 3Gでもかなり軽くなった気がするが,これはSnow Leopardと同様にObjective-Cのリンカを改良したことも影響しているのではないだろうか?(義兄が前に3.1ではアプリの使用メモリが激減と言ってた)なお,再び会社の自席で3Gの電波を拾うようになった.

    iPhone OS 3.1 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/09/11
    iPhone OS 3.1 は速くなりましたね。木田さんが 3GS にしていてうらやましい! 自分はまだ 3G です。。。
  • 某勉強会 - かふぇ・べいぶ別館

    プライバシ保護データマイニングに関する勉強会.今日は,制御法,匿名性の評価法,アルゴリズムの定量化,k-匿名性に関する4章と招待講演. 発表者によると,この分野の研究はまだまだ発展している最中で,きっちり固まっていないし,穴が多いという感じだ.比較的理論がまとまっているように見えるk-匿名性に関しても,プライバシー保護の程度を示す目安としては重要だが,現実に適応するには厳しすぎて,現場導入されている例は稀だとか.K嶌氏が,今このを日語訳するのは早い,時間が掛かる書籍よりもタイムリーな情報提供をすべきだと言っていた理由がわかる気がした. 招待講演は,K大のセンシングウェブの話.これは,一言で言えば,画像が背景情報,雰囲気情報(日当りや日照の度合い,看板の有無),個人情報(人物など)から構成されるとしたら,個人情報だけを認識してシンボル化し,変換後画像とシンボルに関する情報(人数や移動とか

    某勉強会 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/08/26
    K嶌さん。。。
  • HT-03A安売り - かふぇ・べいぶ別館

    社内の正式ルートから,個人用・法人用としてHT-03Aを買ってくれという依頼が回ってくる.単なる販売会社でなく,あの会社から直接依頼が来たのは初めてではないかと思う.それにしても,すでに買いたい奴は買ってしまっているし,自分の給料を丸ごと自宅購入資金として貯金しているH氏は涙目かもしれない.もっと早く言ってくれれば彼も…orz ああいうデバイスをいろいろもてあそんでくれる集団として研究所に目をつけたのは賢いと思うが,少々タイミングが遅すぎる.てこ入れかなあ?

    HT-03A安売り - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/08/21
  • 某ワークショップ二日目 - かふぇ・べいぶ別館

    午前中はSNSのセッションで,so-netの多くのSNSのデータを三人の研究者が異なる視点で解析しており,なかなか興味深い.懇親会でデータをどのように提供してもらったのかをI氏に聞くと,学会に参加している時にある人からコンタクトがあったらしい.やはり地道な学会活動で研究者として認知してもらうことがチャンスを生むために重要なのだろう. 午後は三件の招待講演.一件目の国際テロのネットワークでは,テロリストのネットワークの使い方が面白かった.彼らは電子メールで連絡を取るのだが,当然NSAに盗聴されるので一切メールを送信しない.どうするかというと,複数のメールアカウントをテロリスト間で共有し,メッセージをドラフトとして保存しておくことで情報を共有するのだという.目から鱗である.しかし,現在のアルカイダのテロネットワークはアメリカを攻撃するものでありながら,インフラは完全にアメリカのものを使っている

    某ワークショップ二日目 - かふぇ・べいぶ別館
    mamoruk
    mamoruk 2009/08/17
    テロリストはメッセージをドラフトに保存して情報交換する、というが、これだと gmail 側では内容分かってしまうような?
  • スマートフォンユーザ増加 - かふぇ・べいぶ別館

    あれほど「iPod Touchで充分です!」と断言していたmrknから,「実はこっそりiPhoneを買っていた」,「MMSに対応したので,ドコモは解約することにした」と連絡が来た.実際に使ってみて,実情を知らないのに安易に批判してしまう危険さや,常に手の中にWeb 2.0端末があることの便利さに気が付いたのかもしれないが,人間変われば変わるものである. 職場では,恐家でマイホーム貯金のために無くした携帯の裏蓋を買うのも許されずそのまま使っていた(爆)H氏が,なんとHT-03Aを購入.上司のK林氏は会社の金で購入したのに,見所がある.でも技術オンチのK林氏はどうせ使わないだろうから,奪ってしまえばよかったのに(爆) 両方を毎日触っていて,だんだん方向性の違いが見えてきた気がする.たとえば,iPhoneアプリはWeb閲覧や地図表示などもアプリ内に持ったりして,肥大化する傾向があるのに対して,

    スマートフォンユーザ増加 - かふぇ・べいぶ別館