Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :
Sujets que vous pourriez aussi aimer :Compter les répétitions
Compter le
nombre de fois que sont
répétés des éléments dans une
colonne d'un tableau Excel grâce à la
méthode Python value_counts, c'est ce que nous allons entreprendre ici.
Classeur Excel à télécharger
Nous suggérons d'appuyer cette nouvelle étude sur une
base de données existante.

Nous découvrons un tableau Excel des activités de sorties entre les colonnes A et E. Forcément de nombreuses activités sont recensées dans un même département. Donc les départements se répètent à de nombreuses reprises dans la colonne C ("Département"). L'enjeu ici est de compter le nombre de répétitions pour chacun, donc de savoir quels sont les départements les plus fournis, les mieux représentés. Cette
base de données, nous l'avons nommée
bdd. Vous pouvez le constater en déployant la
zone Nom en haut à gauche de la feuille Excel.
Le DataFrame
Comme toujours, avant de manipuler les données par des
formules Python, nous devons les encapsuler dans un
DataFrame sur lequel nous pourrons ensuite déployer la
méthode adéquate.
- Cliquer sur la cellule G3 pour la sélectionner,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Débuter la syntaxe comme suit : base=,
base est le nom que nous souhaitons attribuer au tableau représentant les activités de sorties.
- Dès lors, sélectionner toutes les données du tableau, ce qui donne : base=xl("bdd",headers=True),
En effet et comme nous l'avons déjà annoncé,
bdd est le nom que nous avons attribué à cette petite base de données.
- Valider par CTRL + Entrée,
La méthode value_counts
Désormais, sur ce
DataFrame et plus précisément sur la
colonne des départements, nous allons pouvoir appliquer la
méthode value_counts afin de de connaître le
nombre de départements le plus représenté dans cette
base de données.
- Cliquer sur la cellule G5 pour la sélectionner,
- Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
- Dès lors, construire la syntaxe suivante : base['Département'].value_counts(),
- Valider la formule par le raccourci clavier CTRL + Entrée,
- A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
- Dans les propositions, choisir Valeur Excel,

Comme vous le constatez, nous obtenons une synthèse particulièrement efficace grâce à cette
méthode Python value_counts embarquée dans une syntaxe triviale. Nous apprenons ainsi que le département du Var est le plus représenté (190 fois). Il aurait été bien difficile de se faire une idée aussi nette à la simple lecture du tableau. Au passage, vous notez que le décompte des répétitions pour chaque département, est naturellement trié dans l'
ordre décroissant, pour une lecture plus évidente.