14 juillet 2025

Comprendre la latence audio : tolérance humaine et enjeux musicaux

La latence audio désigne le délai entre l’émission d’un son (par un instrument, un chanteur, etc.) et sa perception (par soi-même ou d'autres), après passage dans une chaîne audio numérique. Dans un monde où la musique se fait de plus en plus en ligne ou via des interfaces numériques, comprendre les limites humaines de perception de cette latence est essentiel.


1. Qu'est-ce que la latence audio ?

Dans un système numérique, chaque étape — de la conversion analogique-numérique (ADC), traitement logiciel (buffering, effets), à la conversion numérique-analogique (DAC) — ajoute un temps de traitement.
À cela s’ajoutent :

  • les latences réseau en cas de jeu en ligne (aller-retour),

  • la latence des pilotes audio (ex : ASIO vs WDM),

  • et parfois la latence induite par les interfaces utilisateurs (ex : monitoring via une DAW).

Une latence totale se compose généralement de :

latence ADC + buffer input + traitement + buffer output + latence DAC

2. La perception humaine de la latence

Des études scientifiques et des retours d’expérience montrent que l’humain est très sensible au décalage temporel lorsqu’il joue d’un instrument ou chante. Voici ce que dit la recherche :

✔ Études de seuil de perception :

  • CCRMA – Stanford University : une latence > 20 ms commence à altérer la précision rythmique dans les performances synchronisées, comme un duo ou une rythmique batterie/basse.

  • Université de Regensburg (2024) : la Just Noticeable Difference (JND) en écoute musicale est d’environ 49 ms à zéro latence, mais diminue à 27 ms dès que la latence de base est de 64 ms. Donc, plus on a déjà de latence, plus on perçoit vite les différences.

  • Étude sur les percussionnistes : les musiciens expérimentés remarquent une dégradation de la qualité perçue dès 10 ms de latence avec un jitter > 3 ms. Le jitter est donc aussi critique que la latence moyenne.

✔ En situation réelle :

  • Dans des tests comparant différents niveaux de latence en monitoring, beaucoup de musiciens trouvent :

    • < 5 ms : parfaitement naturel

    • 5–10 ms : confortable

    • 10–15 ms : gênant selon le contexte

    • > 15 ms : désagréable, voire ingérable en situation live


3. Comparaison avec les situations naturelles

Un musicien dans un orchestre peut être à 10–20 mètres d’un autre. Or, le son se déplace à ~340 m/s → soit une latence naturelle de 30–60 ms ! Pourtant, ils jouent ensemble sans problème.

Alors pourquoi cette tolérance dans un cas, et pas dans l’autre ?

Effet Haas & anticipation :

  • L’effet Haas (ou de précédence) fait que si deux sons arrivent à moins de 25 ms l’un de l’autre, le cerveau les perçoit comme un seul.

  • Mais dans le jeu en live ou en studio, le cerveau anticipe le retour auditif comme un retour sur soi-même : il détecte un décalage même faible entre le geste et le son.

Ainsi, la latence entre deux musiciens est souvent tolérée, mais la latence entre soi et son propre son est beaucoup moins supportée.


4. Enregistrement, monitoring et latence acceptable

Enregistrement en home-studio :

  • Les interfaces audio visent des latences inférieures à 10 ms (aller-retour) pour garantir une sensation “temps réel”.

  • Les musiciens rapportent qu’à partir de 12–15 ms, ils commencent à perdre la sensation de jeu fluide, particulièrement sur des instruments rythmiques.

Monitoring live :

  • Sur scène, les systèmes intra-auriculaires doivent rester en dessous de 10 ms pour éviter la gêne, selon des retours de professionnels.

  • En monitoring logiciel (DAW), on recommande un buffer entre 64 et 128 samples, soit environ 3–6 ms de latence sur des interfaces modernes.


5. Musique en ligne : latence réseau

Le jeu à distance (jam en ligne) introduit une nouvelle contrainte : la latence réseau.

  • Les plateformes visent une latence aller-retour ≤ 20 ms pour rester musicalement jouable.

  • Cela implique :

    • une connexion fibre ou très faible ping,

    • un système bien optimisé (ASIO, buffers faibles, etc.),

    • une distance géographique réduite (la lumière dans la fibre = 5 ms / 1000 km).

Certains musiciens peuvent tolérer jusqu’à 30 ms, mais au-delà la synchronisation devient difficile, surtout sur des morceaux rapides ou rythmiquement complexes.


Recommandations pratiques

ContexteLatence cible
Monitoring studio (instruments live)≤ 5 ms (idéal)
Monitoring voix≤ 10 ms
Jam session locale via réseau≤ 15 ms aller-retour
Jam session distante≤ 20 ms aller-retour max
Lecture audio sans interaction≤ 50 ms (tolérable)


Conclusion

La latence audio est un facteur critique dans toute performance musicale. Même si certaines latences “naturelles” sont bien tolérées, dès que l’interaction est personnelle (monitoring, jeu en ligne), la tolérance chute drastiquement. Pour assurer une expérience fluide :

  • Restez sous les 10 ms pour le jeu solo/monitoring.

  • Sous 20 ms aller-retour pour jouer en ligne.

  • Optimisez aussi le jitter, car un son instable est souvent pire qu’un léger décalage constant.

En musique, le timing n’est pas une question de perfection, mais de cohérence perceptive.





Aucun commentaire:

Enregistrer un commentaire

Retour de vacances... et retour au code !

Après quelques jours de pause bien méritée, je suis de retour aux manettes du projet MusiCall . Ces vacances ont été l’occasion de couper u...