24日のシリーズBラウンドでの資金調達の発表を受け、日本国内でもツイッターのトレンド入りなどで急速に話題になっているClubhouse。「声の扱い方が一体Zoomとどう違うのか?」を考えてみた。 下記は、一般のビジネスパーソン向けに技術的な内容を一部デフォルメしているので、技術系読者にとっては物足りない結果となるがご了承されたい。 結論から言うと、声被りをしない大きな理由はスピーカー(話者)間の遅延の小ささに由来している。インターネットを介した通話をおこなう場合、実はスピーカー間はリアルタイムに通話していない。データが世界中を飛び回って受信者に送られてきているので、テレビのニュースで海外特派員とのやり取りほどは気にならないが、若干の遅延が常に発生している。 人間の脳は10ms(1/100秒)とか20ms(2/100秒)程度の遅延から違和感を感じ始めると言われており、最近5Gの文脈で1ms(