|
|
Comment mesurer la qualité de la voix sur IP ?

Depuis quelques décennies
nous nous sommes habitués à la numérisation de tout et de rien. Nous
nous sommes habitués à la qualité " numérique ". Mais pourquoi donc
le téléphone, largement numérisé par les exploitants du téléphone
depuis longtemps, n'est il que balbutiant sur l'internet ? Le
problème, à l'évidence, n'est pas simple. De nombreux paramètres ont
dû être maîtrisés afin d'approcher la simple qualité " analogique "
du combiné S63 d'antan. La persévérance des laboratoires de
recherche nous proposent aujourd'hui des solutions de plus en plus
performantes. Il y a seulement 4 ou 5 ans le simple fait de rajouter
un routeur ou un pare-feu de plus sur le chemin d'une liaison voix
sur IP était suffisant pour en compromettre définitivement l'usage.
Examinons certains paramètres, pas tous, qui influent fortement sur
la qualité observée d'une liaison VoIP. Nous terminerons sur les
méthodes de mesures employées par ip-label.
LES CAUSES D'UNE DEGRADATION DE QUALITE
Codecs
Les progrès ces derniers temps débouchent sur des solutions diffusables en
masse. Le choix du codec (codeur/décodeur) est important. Plus de compression ?
Plus de débit ? C'est au choix du fournisseur. Il n'y a pas de codec parfait, et
si l'on réduit le débit, la qualité de la voix va probablement s'en ressentir.
Chaque choix est un compromis.
Délais
La qualité de la voix dépend beaucoup du délai de transit total. Trop de délai
nuit à l'interactivité d'une conversation au point d'en devenir gênant, voir
inutilisable par l'usager moyen. Le tableau suivant résume la relation entre ce
délai et la qualité perçue de la liaison (tiré de la recommandation UIT-TG114) :
Classe Délai chaque sens Commentaires
1 0 à 150 ms Conversations sans critique de la part des interlocuteurs
2 150 à 300 ms Provoque quelques critiques mais supportables (conversation via
satellite 250 ms par saut)
3 300 à 700 ms Similaire à une communication halfduplex
4 Au-delà de 700 ms Inutilisable en pratique publique
Mais où un message peut-il perdre du temps ? Cela commence au départ dans le
codec par le délai d'échantillonnage :
le délai d'échantillonnage : temps de traitement Analogique/numérique par le
codec, et vice-versa. Délai fixe.
le délai d'accès au réseau : dépend du traitement et des conditions d'accès à la
couche MAC. Délai variable.
le délai de propagation : délai de propagation de l'information. Dépend de la
distance parcourue et du média utilisé (cuivre ou fibre optique). Pour parcourir
20.000 km sur fibre optique, il faut plus de 67 ms. Délai fixe, sauf changement
de route.
le délai de transit dans les équipements réseau : délai pour traverser routeurs,
multiplexeurs…. Délai variable.
le délai du/des tampon(s) de gigue : temps de stationnement à l'arrivée pour
resynchroniser les paquets. Délai fixe.
Tous ces délais, plus ou moins longs, fixes ou variables, peuvent finir par
dégrader l'information voix. Les constructeurs ne cessent de les maîtriser, ne
serait-ce que pour compenser les imperfections du réseau de transport
sous-jacent.
Gigue
Plus encore que les délais eux-mêmes, la variation de ces délais impacte la
qualité de la voix. C'est ce que l'on appelle communément la gigue de phase.
N'oublions pas que, pour des raisons d'efficacité, les protocoles d'échange de
la VoIP se basent sur le couple RTP/UDP. Cela signifie que le réseau ne garantit
absolument pas ni les délais d'acheminement, ni l'ordre, ni le même chemin pour
tous les paquets, ni le bon acheminement… La responsabilité incombe aux
différents équipements qui induisent un délai variable, dû par exemple, à des
problèmes de congestion réseau ou tout simplement des problèmes de fiabilité des
réseaux.
L'oreille humaine est très sensible à ces problèmes de gigue. Au point que les
conversations peuvent devenir inintelligibles. C'est pour cela que les
fournisseurs de solutions VoIP traitent avec attention ce problème au moyen de
tampons de régulation. Beaucoup de progrès ont été faits dans ce domaine. Mais
toutes les solutions ne sont pas égales devant la qualité….
La perte de données
Le transport de l'information voix codée se fait par datagramme. Les contraintes
de temps réel ne supportent aucun protocole avec une garantie d'acheminement au
moyen d'une retransmission des paquets perdus. Cela signifie que des paquets
peuvent se perdre. Selon la politique de compensation des paquets perdus et le
taux de perte, on constate une déformation et une dépréciation de
l'intelligibilité de l'information voix.
LES MESURES
ip-label a choisi de mesurer la Qos de
la Voip, sur une échelle MOS en s'appuyant sur deux normes de UIT, E-model (qui
permet une évaluation très orientée réseaux) et le PESQ reproduisant le modèle
acoustique humain.
Echelle MOS
La première approche pour mesurer la qualité d'une restitution sonore est de
faire appel à un panel observateurs qui va l'évaluer. C'est le principe qui
sous-tend la méthode MOS (Mean Opinion Score). Cette technique est issue de la
téléphonie analogique. C'est une mesure subjective. Elle souffre de plusieurs
inconvénients : elle est chère, elle est lente, elle ne permet pas d'effectuer
des mesures en masse. Les deux méthodes suivantes ont pour but de remédier à ces
inconvénients.
E-Model
Le E-Model consiste à effectuer des mesures réseau sur les qualités objectives
directement à partir des trames réseau (délais, gigue…). Il a été standardisé
par l'UIT. On complète ces données avec des informations issues d'une table
d'évaluation des codecs. On obtient ainsi une note R comprise entre 0 et 100.
Une table de correspondance permet d'établir un lien calculé entre l'échelle R
et l'échelle MOS comprise entre 1 et 5. On obtient in fine des résultats très
proches de ceux obtenus dans les mêmes conditions par le modèle MOS d'origine.
Cette mesure est entièrement automatisable et peut aussi servir à effectuer de
la surveillance.
PESQ (Perceptual Evaluation of Speech Quality)
L'ETSI en collaboration avec certains laboratoires a recommandé un autre outil
de mesure de la qualité d'une transmission VoIP, le PESQ (Perceptual Evaluation
Speech Quality). Le but était de proposer un modèle objectif, basé sur le modèle
psycho-acoustique humain. Il effectue une mesure comparative entre deux
informations : celle injectée à une extrémité et la même information recueillie
à l'autre extrémité après avoir traversé le système étudié. Après traitement, le
PESQ restitue ses résultats sur une échelle MOS.
Posté le 08 avril 2005 par _SebF
- source IP-Label
Vous pouvez commenter cette nouvelle
en posant vos avis, questions et remarques
sur les forums FrameIP
|
|