Optimisation et performance
Guide pour optimiser la latence, la qualité et la gestion des reconnexions avec le SDK React.
Optimisation avec le SDK
Paramètres recommandés par usage
| Usage | interimStreaming | model | reformatPresetId | Latence perçue |
|---|---|---|---|---|
| Consultation rapide | false | default | — | Minimale |
| Dictée radiologie | true | vox | medical_fr | Moyenne |
| Compte-rendu final | false | vox | medical_fr | Plus élevée |
Qualité audio
Le SDK gère automatiquement :
- Sample rate : 16000 Hz (fixé par le SDK)
- Format : PCM 16 bits mono (conversion automatique depuis le microphone)
- Normalisation : normalisation de crête appliquée avant l’envoi (
AUDIO_NORMALIZATION_CONFIG)
Assurez-vous simplement que :
- Le microphone est de qualité
- L’environnement est relativement calme
- Le niveau sonore est suffisant
Latence perçue
Le SDK optimise automatiquement la latence via :
- Buffer audio : l’audio est mis en buffer tant que le WebSocket n’est pas prêt, puis réinjecté
- VAD côté serveur : découpage intelligent des segments
- Options de streaming :
interimStreamingpour choisir entre brouillons temps réel ou final d’abord
Une coupure des tout premiers instants peut venir du VAD côté serveur (délai de détection, pré-buffer), pas seulement du client.
Approche avancée (sans TranscriptionButton)
Pour un contrôle total, utilisez useStreamingV2 et gérez vous-même l’état. Voir Référence SDK.
Intégration directe WebSocket (API bas niveau)
Documentation API directe — Coming Soon
Cette fonctionnalité est en cours de développement et sera prochainement disponible. Pour l'instant, seul le SDK React @ephia/transcribe-sdk est accessible pour l'installation et les tests.
Les guides de gestion des reconnexions manuelles, des paramètres audio bruts et du monitoring avancé via WebSocket vanilla seront disponibles prochainement. Pour l’instant, le SDK React @ephia/transcribe-sdk est la méthode recommandée et supportée.