• Internship
  • Paris

Rakuten France

Rakuten Institute of Technology (RIT) est le département de recherche et d’innovation de Rakuten, avec des équipes à Tokyo, Paris, Boston, San Mateo, Bangalore et Singapour. Le RIT est un environnement unique pour la recherche scientifique et les innovations dans le domaine des interactions homme-machine, de la vision par ordinateur, du traitement du langage naturel et de l’apprentissage automatique en général.
RIT Paris collabore principalement avec les marketplaces Rakuten en France et au Japon, ainsi qu’avec d’autres filiales et partenaires du groupe, comme Viber, le FC Barcelone, Rakuten Viki, sur plusieurs sujets de science des données, dont l’extraction d’informations à partir de textes et d’images, l’analyse comportementale, et les systèmes de recommandation.
Dans ce contexte, la ou le stagiaire travaillera avec notre équipe de data scientists dont la mission est de comprendre les besoins de l’entreprise et de proposer des solutions basées sur des techniques de machine learning de pointe exploitant de grandes quantités de données.

Le but de ce stage est d’utiliser les données non annotées de la marketplace japonaise Ichiba. Il ‘agit d’analyser plusieurs millions de lignes de titres, descriptions, ainsi que les images et d’autres modalités associées aux produits afin de créer des partitionnements d’attributs qui décrivent le plus précisément chaque produit. Deux co-tuteurs vous accompagneront durant votre stage.

Ce stage se concentrera sur l’extraction de données structurées à partir des produits de la marketplace Rakuten Ichiba à l’aide d’approches non supervisées et faiblement supervisées. Chaque produit du catalogue est associé à plusieurs images, descriptions et titres, ainsi que d’autres attributs tels que la taille, la marque, la couleur, etc. Des modèles de base ont été mises en place par l’équipe pour extraire certains de ces attributs à l’aide de méthodes de deep learning supervisées.

À présent, en combinant les modalités existantes (texte, images, variables catégorielles) non annotées, nous voulons utiliser une approche non supervisée pour trouver quels attributs sont les meilleurs descripteurs des produits de la plateforme, dans chacune des catégories disponibles.

Vos missions seront notamment les suivantes : 

  • Compréhension des problèmes et investigation des techniques de pointe
  • Collecte d’une bibliographie scientifique pertinente
  • Collecte de données à partir de sources internes
  • Analyse et visualisation des données
  • Conception d’expériences et planification de l’évaluation des modèles
  • Évaluation des performances

 

De formation bac +5 (Ecole d’Ingénieur, Université), vous avez des notions de base sur la vision par ordinateur, vous maitrisez les techniques de Deep Learning et les principes de base du machine learning.

Vous maîtrisé les techniques d’apprentissage non supervisé et vous avez des notions de base sur le traitement automatique du langage naturel (NLP)

Vous savez utiliser Pytorch.

Vous êtes motivé, autonome, curieux.

To apply for this job please visit rakutenfrance.recruitee.com.