L'exploration de données avec l'IA : le code jetable est votre ami
17 octobre 2025
L'exploration de données avec l'IA : le code jetable est votre ami
Retour d'expérience 2/11 après 15 ans de software et 1 an intensif de Cursor
Une des disciplines dans laquelle votre assistant de code excelle est l'exploration de données. Vous savez, ces scripts de chargement de données que vous avez codé des centaines de fois, toujours légèrement différents, peu intéressants à stocker ou réemployer.
La bonne nouvelle, c'est qu'il en existe des millions sur internet, donc les IA les connaissent très bien.
Exemples de prompts qui marchent
Assemblage de données
"Fais un script en Python 3.9 typé pour lire les fichiers CSV de ce dossier, récupère la structure de colonnes pour chacun d'entre eux et assemble les données dans un seul fichier CSV qui aura toutes les colonnes et données. Laisse les cases pour lesquelles tu n'as pas de données vides."
Extraction d'images depuis du JSON
"Fais un script qui va charger les fichiers .json de ce dossier. Certaines clés contiennent des URL d'image, trouve-les et ajoute la procédure pour télécharger ces images sous un nom de fichier qui correspondra au path de cette clé JSON."
Tester un nouveau framework
"OpenCV est utilisé dans ce projet. Adapte le projet pour utiliser Pillow à la place. Il faut qu'il n'y ait plus de trace d'OpenCV quand c'est terminé."
Traitement vidéo
"Écris un script Python pour extraire les images de cette vidéo [...] dans le dossier [...] entre les temps 21s et 121s et redimensionne-les en 480x230 en ignorant le ratio original. Le module OpenCV est déjà installé."
De plus, la plupart de ces scripts fonctionnent du premier coup avec les IA récentes (Gemini 2.5 Pro, Claude 4, etc.).
Le côté lourd : l'IA génère trop
Par défaut, l'IA générative génère... Il vous arrivera souvent en faisant une simple requête de vous retrouver avec un nouveau bash, un fichier de test, un .md, etc. en plus de ce que vous vouliez.
Pour l'exploration, ce n'est pas gênant — ces scripts ont au final peu de valeur vu la facilité avec laquelle ils peuvent être refaits. Mais il va falloir être prêt à nettoyer à chaque intervention de l'IA pour ne conserver que ce qui vous intéresse vraiment.
Ou alors, mettez dès le début dans vos fichiers de règles Cursor :
"Ne rajoute pas de fonctionnalités ou fichiers que je n'aurais pas explicitement demandés. Tu peux cependant les proposer si c'est important."
"Utilise des solutions simples et élégantes pour avoir le moins de code possible."
En résumé
- L'exploration avec l'IA est un bonheur — données, techno, frameworks
- Le code est JETABLE — ne conservez que le strict nécessaire dans le repo (git est votre ami)
- Nettoyez en continu
Initialement publié sur LinkedIn.
