Optimisation et performance

Guide pour optimiser la latence, la qualité et la gestion des reconnexions avec le SDK React.

Optimisation avec le SDK

Paramètres recommandés par usage

Usage	`interimStreaming`	`model`	`reformatPresetId`	Latence perçue
Consultation rapide	`false`	`default`	—	Minimale
Dictée radiologie	`true`	`vox`	`medical_fr`	Moyenne
Compte-rendu final	`false`	`vox`	`medical_fr`	Plus élevée

Qualité audio

Le SDK gère automatiquement :

Sample rate : 16000 Hz (fixé par le SDK)
Format : PCM 16 bits mono (conversion automatique depuis le microphone)
Normalisation : normalisation de crête appliquée avant l’envoi (AUDIO_NORMALIZATION_CONFIG)

Assurez-vous simplement que :

Le microphone est de qualité
L’environnement est relativement calme
Le niveau sonore est suffisant

Latence perçue

Le SDK optimise automatiquement la latence via :

Buffer audio : l’audio est mis en buffer tant que le WebSocket n’est pas prêt, puis réinjecté
VAD côté serveur : découpage intelligent des segments
Options de streaming : interimStreaming pour choisir entre brouillons temps réel ou final d’abord

⚠️

Une coupure des tout premiers instants peut venir du VAD côté serveur (délai de détection, pré-buffer), pas seulement du client.

Approche avancée (sans `TranscriptionButton`)

Pour un contrôle total, utilisez useStreamingV2 et gérez vous-même l’état. Voir Référence SDK.

Intégration directe WebSocket (API bas niveau)

🚧

Documentation API directe — Coming Soon

Cette fonctionnalité est en cours de développement et sera prochainement disponible. Pour l'instant, seul le SDK React @ephia/transcribe-sdk est accessible pour l'installation et les tests.

Les guides de gestion des reconnexions manuelles, des paramètres audio bruts et du monitoring avancé via WebSocket vanilla seront disponibles prochainement. Pour l’instant, le SDK React @ephia/transcribe-sdk est la méthode recommandée et supportée.

Index Index