Согласно исследованию Университета Джонса Хопкинса, стандартные технологии сжатия голоса могут сильно повысить вероятность прослушивания. Обычно при шифровании звонков VoIP длина фраз остается той же, что и в обычной речи, и разговоры защищены достаточно хорошо. Но если шифрование используется в комбинации со сжатием при переменной скорости передачи битов (VBR), появляется высокая уязвимость.

Причина в том, что при VBR степень сжатия зависит от сложности звука. В получаемом аудиопотоке, зашифрованном с сохранением длины фраз, легко вычленить звуки, основываясь на битовых комбинациях.

Выяснилось, что отдельные фразы идентифицируются с точностью более 90%, а при расшифровке фонетически насыщенной речи различных людей в среднем удается извлечь 50% информации. Ученые восстанавливали содержание разговоров, пользуясь словариком звуков и не прибегая к взлому шифрования. Учитывалось и влияние постороннего шума.

По мнению исследователей, снизить угрозу можно при помощи «набивки», однако они отмечают, что ее использование не оговаривается в стандарте безопасности SRTP (Secure Real-time Transport Protocol).