 
        
        Contexte 
 
Novaia (callbots IA) industrialise des flux voix temps réel à gros volume (STT/TTS, LLM, AMD) sur une infra scalable (Kubernetes + GPU) pour des campagnes téléphoniques massives. Nous cherchons un profil hybride MLOps/DevOps/Data Engineer pour fiabiliser, accélérer et réduire les coûts de bout en bout. 
 
Mission 
 
Concevoir, déployer et opérer une plateforme MLOps/Data temps réel (sub-300 ms) : ingestion audio STT NLP/LLM orchestration TTS, avec observabilité, CI/CD, sécurité et contrôle des coûts. 
 
Responsabilités clés 
 
- Infra & Ops 
 
Concevoir l'infra Kubernetes (prod/staging), autoscaling CPU/GPU, réseau, stockage. 
 
Mettre en place CI/CD (build, tests, canary/blue-green, rollback). 
 
Observabilité end-to-end : logs, métriques, traces, alerting (SLO/SLI). 
 
Sécurité : IAM, secrets, durcissement, sauvegardes, PRA. 
 
- MLOps 
 
Registry/traçabilité des modèles (MLflow/DVC/W&B), packaging (ONNX/TensorRT), serving (vLLM/Triton/TorchServe/FastAPI). 
 
Déploiements progressifs (shadow/canary), AB-tests, surveillance de dérive. 
 
Optimisation latence/coût : quantization, distillation, KV-cache, batch, pinning GPU. 
 
- Data Engineering 
 
Pipelines batch & streaming (Airflow, dbt, Kafka/Redpanda) pour logs audio/intent/succès d'appels. 
 
Qualité des données, schémas, GDPR (pseudonymisation, rétention). 
 
Exposition de datasets/metrics pour les Data Scientists et les équipes métier. 
 
Téléphonie/Voix (plus) 
 
Intégration Asterisk/FreeSWITCH/Jambonz/Drachtio, routage SIP, AMD. 
 
Intégration STT (Whisper/Vosk/ASR cloud) et TTS (Coqui/ElevenLabs/Azure), budgets de latence. 
 
- FinOps 
 
Suivi coût/minute & coût/inférence, dashboards, right-sizing GPU, réservations/spot. 
Stack cible (idéalement vous en maîtrisez une bonne partie) 
 
Infra : Kubernetes, Docker, Terraform, Ansible, Helm; OVH/Scaleway/AWS/GCP; MinIO/S3; Ceph. 
 
CI/CD : GitHub Actions / GitLab CI; ArgoCD/Flux; Trivy/Grype. 
 
Obs : Prometheus, Grafana, Loki/ELK, OpenTelemetry, Sentry. 
 
Data : Airflow, dbt, PostgreSQL/MySQL, Kafka/Redpanda, Redis, Parquet. 
 
MLOps/Serving : MLflow, DVC, W&B; vLLM, Triton, TorchServe, FastAPI; ONNX/TensorRT. 
 
Langages : Python (pydantic/pytest), Bash; Go (plus); SQL. 
 
Voix/Téléphonie : Asterisk, FreeSWITCH, Jambonz, SIP; Whisper/Vosk; Coqui/ElevenLabs/Azure TTS.
      
 
    En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.