formateur informatique

Compter les fréquences de répétitions par formule Python

Accueil  >  Bureautique  >  Excel  >  Excel Avancé  >  Compter les fréquences de répétitions par formule Python
Livres à télécharger


Pour partager cette vidéo sur les réseaux sociaux ou sur un site, voici son url :


Inscription Newsletter    Abonner à Youtube    Vidéos astuces Instagram
Sujets que vous pourriez aussi aimer :


Compter les répétitions

Compter le nombre de fois que sont répétés des éléments dans une colonne d'un tableau Excel grâce à la méthode Python value_counts, c'est ce que nous allons entreprendre ici.

Classeur Excel à télécharger
Nous suggérons d'appuyer cette nouvelle étude sur une base de données existante. Base de données Excel pour compter les fréquences

Nous découvrons un tableau Excel des activités de sorties entre les colonnes A et E. Forcément de nombreuses activités sont recensées dans un même département. Donc les départements se répètent à de nombreuses reprises dans la colonne C ("Département"). L'enjeu ici est de compter le nombre de répétitions pour chacun, donc de savoir quels sont les départements les plus fournis, les mieux représentés. Cette base de données, nous l'avons nommée bdd. Vous pouvez le constater en déployant la zone Nom en haut à gauche de la feuille Excel.

Le DataFrame
Comme toujours, avant de manipuler les données par des formules Python, nous devons les encapsuler dans un DataFrame sur lequel nous pourrons ensuite déployer la méthode adéquate.
  • Cliquer sur la cellule G3 pour la sélectionner,
  • Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
  • Débuter la syntaxe comme suit : base=,
base est le nom que nous souhaitons attribuer au tableau représentant les activités de sorties.
  • Dès lors, sélectionner toutes les données du tableau, ce qui donne : base=xl("bdd",headers=True),
En effet et comme nous l'avons déjà annoncé, bdd est le nom que nous avons attribué à cette petite base de données.
  • Valider par CTRL + Entrée,
La méthode value_counts
Désormais, sur ce DataFrame et plus précisément sur la colonne des départements, nous allons pouvoir appliquer la méthode value_counts afin de de connaître le nombre de départements le plus représenté dans cette base de données.
  • Cliquer sur la cellule G5 pour la sélectionner,
  • Réaliser le raccourci clavier CTRL + ALT + MAJ + P pour activer Python,
  • Dès lors, construire la syntaxe suivante : base['Département'].value_counts(),
  • Valider la formule par le raccourci clavier CTRL + Entrée,
  • A gauche de la barre de formule, cliquer sur la flèche orientée vers le bas,
  • Dans les propositions, choisir Valeur Excel,
Compter les répétitions par formule Python dans Excel

Comme vous le constatez, nous obtenons une synthèse particulièrement efficace grâce à cette méthode Python value_counts embarquée dans une syntaxe triviale. Nous apprenons ainsi que le département du Var est le plus représenté (190 fois). Il aurait été bien difficile de se faire une idée aussi nette à la simple lecture du tableau. Au passage, vous notez que le décompte des répétitions pour chaque département, est naturellement trié dans l'ordre décroissant, pour une lecture plus évidente.

 
Sur Facebook
Sur Youtube
Les livres
Contact
Mentions légales



Abonnement à la chaîne Youtube
Partager la formation
Partager sur Facebook
Partager sur Twitter
Partager sur LinkedIn