DASSAULT SYSTEMES

STAGE - Clustering multimodal à large échelle (F/H)

Description

Au sein de la R&D Netvibes, l'équipe Sourcing & Standardization est en charge du développement de composants pour l'acquisition, le traitement, le stockage et l'exploitation de données à très large échelle.
Le stage se déroulera dans le cadre du service PartSupply de la 3DEXPERIENCE Marketplace, offrant un accès unique à un riche catalogue de composants mécaniques, électriques et électroniques, mis à disposition par des milliers de fournisseurs à travers le monde.

La similarité entre composants est au cœur de l'expérience PartSupply, aussi bien pour la recherche d'objets similaires, la classification de pièces et d'assemblages, que pour la standardisation de catalogues clients.
Les composants sont organisés dans un graphe de similarité 3D, puis exploités par des algorithmes d'apprentissage statistique.

L'objectif de ce stage est d'explorer des approches multimodales, notamment textuelles, en exploitant les embeddings de titres, paramètres, descriptions, documentations, etc., afin d'améliorer la structuration et le regroupement des composants.

Une deuxième partie du stage sera consacrée à l'exploration de l'usage des LLMs, notamment pour la description automatique, la classification et la normalisation des données.



Vos missions :
- Réaliser un état de l'art sur le clustering, les embeddings, les mesures de similarité et les approches associées.
- Calculer et évaluer des embeddings pour le calcul de similarité.
- Intégrer ces embeddings dans le graphe et mesurer leur impact sur le clustering.
- Explorer l'usage de LLMs pour la standardisation et la classification des composants.

Profil recherché

Vos qualifications :
Etudiant.e en cursus BAC+5, en école d'ingénieurs ou formation Universitaire spécialité Data Science / Big Data / Machine Learning, vous êtes à la recherche d'un de 6 mois à partir de janvier 2026.
Connaissances solides en algorithmique et structures de données.
Bonne maîtrise des technologies d'apprentissage statistique et d'analyse de données.
Maîtrise des langages Java et Python.
Connaissance des architectures scalables et distribuées.
Bonne maîtrise de l'anglais à l'oral et à l'écrit pour la rédaction de documentation.


Des connaissances des frameworks de Machine/Deep Learning est un plus.
Des connaissances en moteurs de recherche et bases de données sont un plus.



Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans.

Principaux avantages et bénéfices :
Environnement multiculturel
Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie…)
Engagement en faveur de la diversité et de l'inclusion
Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc

Informations complémentaires

Informations complémentaires
Contrat : Stage
Lieu de la mission : Yvelines Vélizy-villacoublay
Niveau d'étude : Ecoles d'ingénieurs
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Début de la mission : Dès que possible
Secteur : Informatique, Télécommunications

Découvrez DASSAULT SYSTEMES

Dassault Systèmes contribue à améliorer la vie réelle grâce aux mondes virtuels.

Grâce à nos solutions scientifiques, nous offrons des expériences de jumeaux virtuels à tous, y compris à vous ! Nous sommes fiers d'être une entreprise durable qui aide les particuliers et les entreprises à donner vie à de nouvelles idées de manière durable.

Nous sommes un catalyseur de progrès humains durables et révolutionnaires.

Notre aventure a débuté en 1981 avec 20 ingénieurs au service de l' industrie aéronautique à travers une seule marque : CATIA . Aujourd'hui, plus de 23 800 collaborateurs sont animés par une passion commune : prouver comment le monde virtuel peut améliorer la vie réelle.

Nous ne sommes pas seulement une société de logiciels. Nous sommes un fournisseur de solutions scientifiques et technologiques qui se concentre sur l'amélioration de l'expérience humaine. Nos 13 marques proposent des services de conception 3D, de maquette numérique (DMU), de gestion du cycle de vie des produits (PLM) et bien plus encore pour accompagner les acteurs du monde entier dans le développement de nouvelles approches en matière de logistique verte, de durabilité des produits, de réduction des déchets et bien plus encore.

Depuis 2020, nous avons étendu notre impact dans le secteur des sciences de la vie et de la santé avec des expériences de jumeaux virtuels du corps humain basées sur la science pour aider nos clients à améliorer les décisions médicales et à améliorer le parcours des patients.

Partager cette offre

Si cette annonce ne vous correspond pas ? Pensez à vos amis en leur partageant le lien.

Offres Similaires