Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Anomalie dans le fichier des municipales 2020, tour 1 #4

Open
briatte opened this issue Mar 23, 2020 · 4 comments
Open

Anomalie dans le fichier des municipales 2020, tour 1 #4

briatte opened this issue Mar 23, 2020 · 4 comments

Comments

@briatte
Copy link

briatte commented Mar 23, 2020

Hello,

C'est un détail, mais pour le fichier du premier tour des municipales 2020, il faut retirer la colonne 37 pour que le fichier soit vraiment régulier dans les noms de colonnes.

La colonne 37 correspond au nombre de sièges par secteur (pour Paris, Lyon et Marseille). Contrairement aux autres colonnes "candidat(e)", elle n'est pas répétée plus loin dans le fichier.

Je n'ai pas testé le package sur ce fichier, je signale juste l'anomalie.

@joelgombin
Copy link
Owner

joelgombin commented Mar 23, 2020 via email

@briatte
Copy link
Author

briatte commented Mar 23, 2020

Certes ; j'ai codé pareil en quelques lignes avec purrr::map_dfr, mais ne suis pas allé jusqu'à rendre ça flexible au niveau des colonnes sélectionnées, ce que tu as fait pour ce package.

@briatte
Copy link
Author

briatte commented Mar 23, 2020

Exemple de code pour lire le T1 de 2020 :

d <- "2020-03-16-resultats-communes-de-1-000-et-plus.xlsx"
d <- readxl::read_excel(d, guess_max = 10^5)

# remove extra column (sièges secteur) that breaks regularity of column names
d <- d[ -37 ]

col_names <- c(
  "Département", "Code postal", "Commune",
  "Inscrits", "Votants", "Exprimés",
  "Liste", "% Exprimés"
)
purrr::map_dfr(seq(20, 186, by = 11), function(x) {
  d[, c(1, 3, 4:5, 8, 16, x, x + 9) ] %>% 
    purrr::set_names(col_names)
})

@briatte
Copy link
Author

briatte commented Mar 23, 2020

En revanche ça ne fonctionne pas quand il y a des soucis comme ceux indiqués en #5, ou quand il manques les noms de colonnes comme dans les données des municipales 2014.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants