Synapse Développement

Contexte

Spécialiste de l’Intelligence Artificielle appliquée au traitement du langage, Synapse Développement est une société innovante d’une dizaine de personnes travaillant pour le grand public et les grands comptes comme Microsoft ou Amazon.

En pleine croissance, la société place l’expertise technique et l’excellence R&D au cœur de son activité. Nous participons régulièrement à des projets innovants avec les meilleures universités européennes et construisons des solutions opérationnelles pour nos clients. Nous offrons des challenges épanouissants, des solutions technologiques innovantes, des opportunités de réalisation et une ambiance de travail jeune et créative.

Ordyslexie est un projet R&D mené par Synapse en collaboration avec Microsoft, Air France et l’association Ordyslexie ; il a pour objectif le Développement d’un assistant langage au cœur d’un cartable numérique adapté aux enfants « DYS ». Dans le cadre de ce projet, Synapse recherche un ingénieur R&D pour un stage dont le principal objectif est l’exploration des modèles neuronaux pour la correction orthographique.

Votre Mission

L’idée est d’exploiter de grandes masses de texte pour apprendre de manière non-supervisée à corriger des fautes d’orthographe. On se basera notamment sur des modèles de langue. Un modèle de langue est un estimateur permettant de prédire comment compléter un fragment de phrase (utilisé par exemple dans les claviers de smartphone). Les réseaux de neurones récurrents sont les techniques les plus efficaces pour cette estimation. Le problème peut également être modélisé comme une traduction du français incorrect en français correct .

Plusieurs pistes sont envisageables selon les envies et le profil du candidat :

  • apprentissage multi-vues (caractères, phonèmes, morphèmes, mots)
  • modèles de bruit pour l’apprentissage non supervisé de corrections
  • explication des corrections et des suggestions
  • modèles d’attention adaptés à la correction
  • utilisation de ressources linguistiques externes (e.g wordnet)
  • correction des erreurs spécifiques à la dyslexie
  • supervision distante

On s’évaluera sur des jeux de données standards (CoNLL-2014 Shared Task), sur des jeux de données construits par notre équipe utilisant les historiques de corrections d’erreur sur Wikipédia ou par les partenaires du projet.

Intégré à l’équipe R&D, vous porterez ces thématiques de recherche en tirant parti des technologies et savoir-faire de Synapse. Un article scientifique sera rédigé avec l’équipe R&D et soumis en atelier ou en conférence selon l’avancement des travaux.

 

Votre profil

Vous recherchez un stage de fin d’étude pour clôturer votre Master 2 ou votre école d’Ingénieur (bac+5).

Vous disposez d’une expérience sur des projets de Machine Learning ou de Deep Learning.

Vous justifiez d’un bon niveau de programmation et d’une capacité à travailler en autonomie.

Les compétences suivantes sont considérées comme un plus :

  • Traitement automatique des langues
  • Connaissances de Python/Tensorflow/Keras
  • Curiosité et ouverture d’esprit.



Durée : 6 mois

Rémunération de stage : Rémunération légale + prime + tickets restaurants

 

Envoyez-nous votre candidature !

83e36f1554116f00f853a237040bab67*******************************