Marwa MAHFOUD: « Dans le futur, nous aurons encore besoin de data scientist et ce besoin ne fera que croître»

Après un master en Mathématiques, ingénierie statistique et financière, à l’Université Paris Dauphine, Marwa MAHFOUD travaille depuis plus de 5 ans en tant que conseillère en Data science, dans un cabinet international de conseil en stratégie. 

À quelle fréquence l’intelligence artificielle intervient-elle dans votre quotidien?   

Contrairement aux idées reçues ,les data scientist ne passent pas 100% de leur temps à travailler sur la modélisation et l’intelligence artificielle. Par modélisation, je parle du fait de créer des algorithmes. Cette partie du travail succède certaines étapes.  Le data scientiste a la responsabilité de gérer des données. Autrement dit les clients nous fournissent des données, et grâce aux compétences acquises lors de nos études nous  allons  être en capacité, de nettoyer ces données, de les rassembler, de les mettre en forme, de les trier, les explorer ainsi que de les analyser. Nous allons  avant tout comprendre le besoin du client afin de créer un modèle qui résout  son, problème. C’est à partir de là que l’IA intervient. Je dirai que partie l’intelligence artificielle partie représente entre 20 et 30% de mon travail. Par exemple, sur un projet de 2 mois, l’étape modélisation prendra 2 à 3 semaines.

Qu’apporte l’IA à la science des données?

La collecte de données, est l’étape qui vient avant l’application de l’algorithme, autrement dit , nous devons avant tout collecter les données afin de les introduire dans l’algorithme. Je peux dire que dans mon métier, l’IA intervient lors la modélisation. Ceci nous permettra de créer cet algorithme mathématique qui va nous donner un résultat. L’IA va reproduire un comportement humain qui va aider à prendre une décision. Il fournit des résultats qui aideront les entreprises à prendre des décisions fondées sur les données . 

Selon vous comment la data science va-t-elle évaluer dans le futur?

Honnêtement je pense qu’il y aura toujours de la demande de spécialistes en data science. Il est vrai que certains ont tendance à dire que  plus tard l’intelligence artificielle va prendre tellement d’ampleur que nous n’aurons plus besoin de gens. Mais je suis persuadée que nous ne sommes pas du tout arrivés au stade où les machines vont prendre le contrôle. Nous sommes encore loin de cela et nous avons beaucoup à apprendre et beaucoup à faire. C’est un métier qui est relativement récent, ça fait une décennie, pas plus, que ça existe et c’est un métier prometteur. D’ici trente, quarante, ou cinquante ans on aura encore besoin de data scientiste et ce besoin ne fera que croitre , le métier changera peut-être, les algorithmes utilisés évolueront certainement pour répondre à la tendance. Je pense que la data science  et plus généralement  l’intelligence artificielle seront toujours utiles pour résoudre les problèmes des humains, qui auront sûrement eux aussi changer. Mais je suis certaine que le besoin ne s’effacera pas, c’est comme ça que je vois les choses. 

Qu’est ce qui singularise le métier de data scientist ?

Un data scientist est littéralement un scientifique des données, il doit savoir nettoyer les données, créer les modèles et les appliquer dans des cas concrets . On doit donc explorer les données et réussir à les visualiser . Pour moi c’est ça le rôle d’un data scientist. Je suis plus précisément consultante en data Science. C’est un métier qui ne se limite pas à un seul secteur d’activité, on peut avoir des projets avec des banques, des magasins de luxe, des enseignes de grande distribution, ou des hôpitaux. La data science s’applique absolument partout. Par définition nous ne pouvons pas travailler seul, c’est un travail collectif. Je travaille avec un chef de projet qui nous présente les missions .Il y a aussi le data ingénieur qui va collecter les données et puis le data analyst va créer des dashboard, des visuels. En tant que consultante, je dois parler avec des clients, faire des interviews avec eux pour comprendre leurs besoins.

Quelles sont les qualités requises pour être un bon data scientist ?

Il faut avoir un bon l’esprit d’équipe et être à l’aise dans la communication. En effet, aujourd’hui je dois communiquer sur mon travail, c’est à dire, parler avec des gens qui n’ont aucune connaissance sur le domaine. Il faut être capable d’expliquer des choses complexes et techniques avec des mots faciles. Parfois nous pouvons faire la rencontre de clients qui n’ont jamais fait de mathématiques ou qui ne savent pas manipuler un ordinateur. Il faut aussi beaucoup de rigueur. En codant nous pouvons nous tromper dans un petit chiffre ou  mettre une mauvaise formule et ceci fausse tout le modèle et donc tout ton projet. C’est vraiment ça les 3 qualités premières, parce que après le reste, tout ce qui est connaître les algorithmes mathématiques, savoir coder,  c’est des choses que tu sais faire après ton master. Mais il ne faut pas s’inquiéter car c’est un métier où tu développes beaucoup de tes connaissances une fois que l’on rentre en entreprise. Par exemple, c’est pendant mon stage de fin d’étude en entreprise que j’ai appris à coder en python, en cours je ne savais utiliser que le langage java et C++. 

Quel est votre parcours depuis Dauphine ?

J’ai fait mes deux premières années d’études supérieures ,à l’Université de  Paris, en mathématiques. En troisième année, en L3, j’ai fait la licence Mathématiques Informatique (MIDO) de Dauphine. Suite à cela  j’ai intégré le master  mathématiques appliquées en M1 et en  M2, j’ai fait le master Math ISF, ingénierie statistique et financière. En dernière année j’avais le choix entre la  finance et la science des données. Je me suis donc orientée vers la data science. Je débute dans le monde professionnel avec un stage de fin d’études non rémunéré à Sydney en data science dans une startup de marketing digitale. En février 2018, je commence un emploi chez EY en tant que Consultante Data. L’année suivante, je travaille chez OCTO Technology, toujours en tant que Consultante Data Scientist, pendant 3 ans. Je me forme sur les bonnes pratiques de code, l’utilisation des services du Cloud, la méthode agile etc. En quête de nouvelles missions en 2021, je rejoint McKinsey en tant que Senior Data Scientist. Je pense que ce qui m’a permis d’avoir McKinsey, c’est mon profil alliant le conseil à de solides compétences techniques, et surtout une bonne préparation à la longue phase d’entretiens.

(c)pixel2013

L’utilisation de l’IA dans la collecte de données soulève de nombreux problèmes d’éthique, que pensez-vous de ce sujet qui divise de nombreux spécialistes?

Je pense que ça dépend vraiment du secteur. En effet, parfois c’est utilisé pour de mauvaises raisons. Cependant il est difficile de condamner totalement  l’utilisation des données, si on se  focalise sur son utilisation à bon escient nous pouvons vraiment faire  de belles choses avec et en même temps il faut combattre une utilisation néfaste.Je suis totalement contre la mauvaise utilisation des donnés. Typiquement si demain j’ai un projet ou il faut utiliser des algorithmes pour des choses qui ne sont pas compatibles avec mes valeurs et si  le projet en question, est  contre mon éthique professionnelle et personnelle, je refuserai. Je pense sincèrement que dans ce type de circonstance c’est une responsabilité individuelle d’accepter ou pas de travailler sur des problématiques qui sont contre l’éthique.

Qu’est que vous considérez comme une mauvaise utilisation des données?

C’est légèrement difficile de catégoriser une certaine utilisation. Concrètement  si tu crées un algorithme qui va classifier des CV, d’ailleurs il y a eu un gros scandale  par rapport à ça il me semble c’était une grande société qui avait créé un outil qui classifie les CV . L’algorithme a appris sur les CV de personnes qui  étaient déjà embauchés et la plupart étaient des hommes blancs  et donc quand il y avait un CV qui ne rentrait pas dans ces critères là,  automatiquement l’outil  le refusé,  ce n’était donc pas fondé sur les compétences de la personne , l’algorithme était biaisé. Quand ils se sont rendu compte du problème, ils ont dû rapidement le modifier. C’est à peu près le même problème, dans justice aux États-Unis, ou un algorithme à été créé pour juger certains individus .L’utilisation des données personnels, est protégées par loi RGPD qui s’applique en Europe. Elle interdit l’utilisation des données privées pour leurs commercialisation ou pour la création d’algorithmes.

Propos recueillis par BOURAS Kaoutar et KONE KANTE Ouleymatou.