読み方:バイグラム bigramとは、任意の文字列が2文字だけ続いた文字列のことである。 任意の文書や文字列などにおける任意のn文字の連続は、n-gramと呼ばれる。この内、1文字続きのものはunigram、2文字続きのものはbigram、3文字続きのものはtrigram、と特に呼ばれ、4文字以上のものは、単に4-gram、5-gramと表現されることが多い。 全文検索システムなどでは、形態素解析によるインデキシングによる検索漏れを回避するために、分かち書きの手法としてbigramが使われることもある。