Die Trennung von Sitzungs- und Medienaushandlung ist ein weiterer Vorteil von SIP, da somit eine große Flexibilität bei der unterstützten Nutzlast erlaubt wird. Durch die Trennung können die beiden Datenströme jedoch auch unabhängig voneinander verschlüsselt werden. Man kann SIP über das TLS-Protokoll (ähnlich wie im HTTP), auch SIPS genannt, verschlüsseln und den Medienstrom (Sprachdaten) ebenfalls über das SRTP-Protokoll.
Zwecks einer sicheren Verschlüsselung müssen beide Datenströme (also Sitzung und Medien) gleichzeitig verschlüsselt werden. Aus Gründen der Performance und der dafür benötigten Ressourcen kommen dazu symmetrische Verschlüsselungsverfahren zum Einsatz. Die symmetrischen Schlüssel des Medienstroms werden dazu über das SDP (Session Description Protocol) in der SIP-Signalisierung ausgetauscht und wären somit aber über ein unverschlüsseltes SIP angreifbar.
Die ebenfalls symmetrischen Schlüssel von TLS werden zwar am Anfang der Sitzung auch ausgetauscht, jedoch greifen hier vorab die Mechanismen der SSL-Zertifikate, bei denen die symmetrischen Schlüssel durch die asymmetrischen Schlüssel der SSL-Zertifikate sicher verschlüsselt getauscht werden.
Bei TLS und SRTP handelt es sich um eine Verschlüsselung zwischen zwei SIP-Punkten. Bei einer Kommunikation zwischen SIP-Endgerät 1 – SBC – Softswitch – SBC – SIP-Endgerät 2 sind dies bereits vier separate Abschnitte, die einzeln verschlüsselt werden müssten. Aus Kostengründen wird daher oft nur zwischen Endgeräten und SBC verschlüsselt.
In einem Versuchsaufbau wurden Messungen (The Impact of TLS on SIP Server Performance, 2010) durchgeführt und man kam zu der Erkenntnis, dass die Verwendung von TLS die Performance eines softwarebasierenden SIP-Softswitches bis um den Faktor 17 gegenüber klassischem SIP-over-UDP reduzieren kann.