* Collaborer avec l’équipe de recherche sur les modèles fondamentaux afin d’optimiser l’inférence pour des architectures de modèles de pointe.
* Travailler en étroite collaboration avec les équipes produit pour développer des solutions de production et lancer des modèles en temps réel pour des millions de clients.
* Développer des outils permettant de comprendre les goulots d’étranglement de l’inférence pour différents matériels et cas d’utilisation.
* Encadrer et guider les ingénieurs de l’organisation.
* Expérience avérée dans la conduite de projets complexes et ambigus.
* Expérience avec les services à haut débit, notamment à l’échelle des supercalculateurs.
* Maîtrise de l’exécution d’applications sur le cloud (AWS, Azure ou équivalent) avec Kubernetes et Docker.
* Maîtrise des concepts de programmation GPU avec CUDA et des frameworks de machine learning populaires comme PyTorch ou TensorFlow.
* Maîtrise de la conception et de la maintenance de systèmes écrits en langages modernes (par exemple, Go, Python).
* Familiarité avec les architectures fondamentales d’apprentissage profond, telles que les modèles Transformer et les modèles encodeur/décodeur.
* Maîtrise de NVIDIA TensorRT-LLM, vLLM, DeepSpeed et NVIDIA Triton Inference Server.
* Expérience en écriture de noyaux CUDA personnalisés avec CUDA ou OpenAI Triton.
Vous avez le sentiment de penser différemment, vous avez envie de bousculer le statu quo, vous êtes audacieux et ambitieux, vous n’avez pas peur de prendre des risques et vous êtes passionné par le développement des meilleures technologies. Si oui, quel meilleur endroit pour cela qu’Apple ?
Chez Apple, « nous pensons différemment, nous repoussons les limites de l’informatique et de l’intelligence. Nous créons des produits qui font sourire les gens ».
L’équipe Infrastructure des Modèles Fondamentaux, au sein de l’organisation Technologies des Plateformes d’Apprentissage Automatique, est le cœur d’Apple Intelligence. Elle développe les frameworks, services et outils qui alimentent les plus grands modèles fondamentaux d’Apple sur serveurs.
Notre infrastructure alimente une large gamme de services chez Apple, notamment Apple Search, Apple Music, Apple TV, l’App Store, iMessage, Photos et Appareil photo, Spotlight, Safari, Siri et les futurs produits Apple toujours prometteurs, qui traitent des millions de requêtes chaque jour avec des latences incroyablement faibles, exploitant chaque once de puissance de calcul de notre matériel.
En rejoignant ce groupe, vous aurez l’opportunité d’apporter l’Intelligence à des milliards d’utilisateurs à travers le monde. Vous aurez l’opportunité d’améliorer la vie des gens. Vous aurez l’opportunité de travailler à l’optimisation de milliards de modèles de langage, de vision et de parole paramétrés, grâce à des technologies de pointe, et de les déployer à l’échelle d’Apple.
En cliquant sur "JE DÉPOSE MON CV", vous acceptez nos CGU et déclarez avoir pris connaissance de la politique de protection des données du site jobijoba.com.