トートロジー トットちゃん あと一つは?
エビ→シュリンプ クレープやいたやつ→ガレット ゼリー→ジュレ コーヒー牛乳→カフェオレ チーズお粥→リゾット カタツムリ→エスカルゴ キャベツの漬物→ザワークラウト かき氷→フラペチーノ オーツ麦→オートミール ほかにある?
“[ ]”などを個別に読む場合はleft/open bracket, right/close bracketと読んでください。 “<“はless than、”>”はgreater thanとも読みます。 Dave Thomasは”<<“を”less than, less than”と読んでいました。 “-“がdashなのかminusという話しについては、The difference between a dash and a minus signを参考にしてください。 あまり、この読み方はしないよ!とか、私はこう読むよ!とかあれば、@masuidriveまでmentionください。 [2013/11/21 14:00:00] 色々な方々にコメントを頂き追加しました。 速く・正確に読む ITエンジニアの英語 ITエンジニアの ゼロから始める 英語勉強法
Haxe empowers cross-platform development Haxe is an open source high-level strictly-typed programming language with a fast optimizing cross-compiler. Download 4.3.7 Released: 2025-05-09 Get a glimpse of Haxe 5.0! We just released a preview version of Haxe 5.0. More features are coming; see also nightlies for the very latest Haxe. Download 5.0.0-preview.1 Released: 2025-07-04 Haxe can build cross-p
はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。 タイトルは釣りじゃない。その理由を10個挙げる。 自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎる ボリュームがあるのに書き方が平易でついつい読みふけってしまう 演習問題があり,自分の理解度を確かめられたりするのもケシカラン 原著は欧米語のための言語処理について書かれた書籍なのに,日本語の形態素解析などについても解説してあって我慢できない 必要ライブラリのインストールなど環境構築に時間が取られそうでヤバい 書籍の応用でBotとか人工無能とか作ったらどうかな−,と
霊長類の中でも特にオランウータン・チンパンジー・ボノボ・ゴリラの知能は高く、人間の5才児程度に相当し、ある程度は抽象的な思考もこなせることが分かっています。言葉に関しても手話を操るチンパンジーやゴリラの話は有名でしょう。 中でもゴリラについては実際に森に住むゴリラと人間が言葉でやり取りをすることさえ可能で、京都大学の山極寿一教授は10種類ほどのゴリラ語を話すことができるといいます。そう考えると彼らの為のプログラミング言語があってもおかしくありません。いや、むしろ無いことの方がおかしく思われます。 そこで私はゴリラ用プログラミング言語「ゴリスペース」を開発しました。*1 ソースコードサンプル Hello World ウホホホホウホホホ、ウホホ。ウッホホ。ウホホホホウホウッホホホホ。ウホホホホ、ウホホウホウホホーイウッホウホホホーイ。ウホホホホウホウホホホホ、ウホホウホホホホ。ウッホホウッホホ
$BF|K\8l9=J82r@O%7%9%F%` (B KNP $B!! (BKNP $B$OF|K\8lJ8$N9=J82r@O$r9T$&%7%9%F%`$G$9!#7ABVAG2r@O%7%9%F%`$N2r@O7k2L (B( $B7ABVAGNs (B) $B$rF~NO$H$7 (B, $B$=$l$i$rJ8@aC10L$K$^$H$a (B, $BJ8@a4V$N78$j $B0J2 % cat test $B3JJ8K!$OK\ KNP Ver.2.0 $B$r%@%&%s%m! (1,571,201 bytes) KNP Ver.2.0 (Windows $BHG (B) $B$r%@%&%s%m!(1,797,651 bytes) JUMAN/KNP $B$N%A%e! ( $B5~ETBg3X3X=Q>pJs%a%G%#%"%;%s%?!pJs=hM}@l=$%3
日本語形態素解析システム JUMAN 本システムは, 計算機による日本語の解析の研究を目指す多くの研究者に共 通に使える形態素解析ツールを提供するために開発されました。その際, 学校 文法が計算機向きではないという問題を考慮し, 使用者によって文法の定義, 単語間の接続関係の定義などを容易に変更できるように配慮しました。 新バージョン5.Xの拡張点の概要は以下の通りです. 日本語の基本的語彙,約3万語(固有名詞を除く)を選定した. 表記バリエーションの整備を行い,代表表記を出力することとした. その他の整備(読みの音訓情報の付与,「読ます」「読まされる」などの使役形への対応) 例えば,以下のような解析結果がえられます. % cat sample.txt 子どもはリンゴがすきだ かぜでおくれた % juman -B -e2 < sample.txt 子ども こども 子ども 名詞 6
split の研究 split 関数の挙動が言語ごとに微妙に異なると知人と話題になったので調べてみました。結果はまとめをどうぞ。 Ruby まずはRubyから調べてみます。irb を使って調べました。 % irb ... まずは普通に分割 >> "a,b,c".split(",") => ["a", "b", "c"] 末尾に空要素があると、省略されてしまう >> "a,,c,,".split(",") => ["a", "", "c"] 末尾の空要素を省略しないためには -1 が必要 >> "a,,c,,".split(",", -1) => ["a", "", "c", "", ""] 空文字列だと結果も空 >> "".split(",") => [] -1 をつけても同様 >> "".split(",", -1) => [] 分割パターンを指定しない場合も同様 >> "".split
「しりとり」は経験者人口が極めて多いゲームだけど、鬼神のごとき強さで他を圧倒するしりとりプレイヤーを私は知らない。ちょっと真剣に戦ってみたところで、 そんな程度のレベルで満足していやしないか。 さいしょは「る」の同字返しでガッチリ組み合う。先に「る→る」のストックが切れて、「る」で返せなくなったほうがひたすら「る攻め」で投げられ続ける。 小学生の時から進歩していないような、こんな大雑把でマンネリな「る攻め」戦略から脱却できないものか。 攻撃防御比最大の最強文字「る」 復習。周知の事実だが「る」は強い。 下の表は、[A](文字Xで終わる単語)と、[B](文字Xではじまる単語)をその比[A/B]の高いものから順にリストしたものである。標本の単語数は20万語であり豚辞書から、伸ばし棒をトリムした上で抽出した。*1 文字X[A]Xで終わる単語[B]Xで始まる単語[A/B] 1位る43235208.
はてなの質問に1万円使い、残り広報予算は14万円。 ここから更に1万円捻出し、AppStore用の紹介文を外注してみた。 発注先はイタリアのDYS Translations。前評判ではレスポンスの速さと価格がウリときいてます。さっそく、ストア用の紹介文(480文字)をお願いしました。以下レポート。 見積もり請求 まずフォームで見積もり請求。 「日本語を英語、フランス語、ドイツ語、イタリア語、ロシア語に翻訳してほしい。おいくらぐらい? 支払い方法は?」的なことを書いて、アプリの紹介文を添付して送信。 見積もり返信~依頼 半日後に返信が。噂通り反応が速いです。 「1言語17ユーロだけど、複数なので1つ15ユーロに値引きするよ」とのことでした。 ロシア語はまだ未対応らしく、最終的に米仏独伊の4言語で注文すること。計60ユーロ、約8000円。 230円アプリの場合、売り上げが50個プラスでペイする
■ [event][esobook] 今週末、梅田でトークイベントします (12/18追記: 会場がそれほど広くないようで、定員は40名と決まっているそうです。 予約の申し込みは「ジュンク堂書店 大阪本店 3階東カウンター」か、TEL. 06-4799-1090で行えるそうです。) 関西Ruby会議の出張Ruby本販売が好評だったようで、 「またRuby本イベントなどしたいですね」「そういえば昨年度まで関西にいたyharaさんが本を出すようですよ」 「じゃあトークセッションですね」「そうですね」→「というわけでジュンク堂梅田本店(←「大阪本店」が正式名称でした。すみません)で何かしゃべりませんか」「ええっ!?ちょwww」 …というやりとりがあったとかなかったとか。 ジュンク堂書店大阪本店 トークセッション情報 まだ何を話すか決めてないのですが、本の紹介と、「Matz江から見たRuby」とい
Build the skills your teams need Give your teams the O’Reilly learning platform and equip them with the resources that drive business outcomes. Click on a feature below to explore. Trusted content Live online events Courses Interactive learning Certification prep O’Reilly Answers AI Academy Assignments Insights Dashboard Trusted content you can count on More than 60K titles from O’Reilly and nearl
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル
実は両親とも有名人と知って驚いた芸能人ランキング!杉咲花、趣里、Taka(ONE OK ROCK)、1位は?
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く