-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Anomalie dans le fichier des municipales 2020, tour 1 #4
Comments
de toute façon il faudrait que je refactorise ce package...
*Joël Gombin* | +33 (0)6 61 55 22 41 | @joelgombin
<https://twitter.com/joelgombin>
co-founder and principal datactivist.coop <http://www.datactivist.coop/> |
@datactivi_st <http://twitter.com/datactivi.st>
we open data, we make them useful
…On Mon, Mar 23, 2020 at 10:51 AM François Briatte ***@***.***> wrote:
Hello,
C'est un détail, mais pour le fichier du premier tour des municipales 2020
<https://www.data.gouv.fr/fr/datasets/elections-municipales-2020-resultats/>,
il faut retirer la colonne 37 pour que le fichier soit vraiment régulier
dans les noms de colonnes.
La colonne 37 correspond au nombre de sièges par secteur (pour Paris, Lyon
et Marseille). Contrairement aux autres colonnes "candidat(e)", elle n'est
pas répétée plus loin dans le fichier.
Je n'ai pas testé le package sur ce fichier, je signale juste l'anomalie.
—
You are receiving this because you are subscribed to this thread.
Reply to this email directly, view it on GitHub
<#4>, or unsubscribe
<https://github.com/notifications/unsubscribe-auth/AAOUODZZPNG5NDCG66QL5B3RI4WLRANCNFSM4LRXPVYQ>
.
|
Certes ; j'ai codé pareil en quelques lignes avec |
Exemple de code pour lire le T1 de 2020 : d <- "2020-03-16-resultats-communes-de-1-000-et-plus.xlsx"
d <- readxl::read_excel(d, guess_max = 10^5)
# remove extra column (sièges secteur) that breaks regularity of column names
d <- d[ -37 ]
col_names <- c(
"Département", "Code postal", "Commune",
"Inscrits", "Votants", "Exprimés",
"Liste", "% Exprimés"
)
purrr::map_dfr(seq(20, 186, by = 11), function(x) {
d[, c(1, 3, 4:5, 8, 16, x, x + 9) ] %>%
purrr::set_names(col_names)
}) |
En revanche ça ne fonctionne pas quand il y a des soucis comme ceux indiqués en #5, ou quand il manques les noms de colonnes comme dans les données des municipales 2014. |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Hello,
C'est un détail, mais pour le fichier du premier tour des municipales 2020, il faut retirer la colonne 37 pour que le fichier soit vraiment régulier dans les noms de colonnes.
La colonne 37 correspond au nombre de sièges par secteur (pour Paris, Lyon et Marseille). Contrairement aux autres colonnes "candidat(e)", elle n'est pas répétée plus loin dans le fichier.
Je n'ai pas testé le package sur ce fichier, je signale juste l'anomalie.
The text was updated successfully, but these errors were encountered: