Home

L'Association Yahad In Unum travaille depuis plusieurs années pour la transmission de l'histoire de la Shoah et d'autres génocides. Ils ont recueilli plus de 2047 témoignages de témoins qui ont été stockés dans un document Excel. L'objectif de ce projet était de nettoyer les données de ces témoignages et de les formater pour une utilisation future dans un projet plus important.

J'ai été recruté par l'association pour mettre en place un script en Python qui analyse les données d'un document Excel contenant les témoignages de témoins de la Shoah et d'autres génocides.
Mon travail consistait à nettoyer et à organiser ces données pour une utilisation ultérieure.
Mon script a réussi à nettoyer et à formater les témoignages de temoins. Après avoir créer le script j'ai procédé à l'importation des témoignages valides dans une base de données SQL. Cette étape était cruciale pour permettre une utilisation future plus facile et efficace de ces données, en permettant une recherche et une analyse plus poussées.
Cependant, mon stage arrivait à son terme avant que je ne puisse terminer l'insertion de toutes les données valides dans la base de données. Bien que cela ait été une déception, j'ai transmis tous les résultats de mon travail à mon superviseur pour que l'association puisse poursuivre le projet permettant à l'association de poursuivre sa mission importante de transmettre l'histoire des génocides aux générations futures.
Travailler sur ce projet a été une expérience enrichissante et m'a permis de développer mes compétences en Python et en data.

un exemple du fonctionnement du script: Le projet sur Github


Le fichier Excel chargé en tant que dictionnaire JSON avec la bibliothèque openpyxl

Mon fichier fonction, on va voir l'exemple de la fonction date of record


Exécution de cette fonction

En cas de ligne d'érreur

Autres projets