Anomalie dans le fichier des municipales 2020, tour 1 #4

briatte · 2020-03-23T09:51:37Z

Hello,

C'est un détail, mais pour le fichier du premier tour des municipales 2020, il faut retirer la colonne 37 pour que le fichier soit vraiment régulier dans les noms de colonnes.

La colonne 37 correspond au nombre de sièges par secteur (pour Paris, Lyon et Marseille). Contrairement aux autres colonnes "candidat(e)", elle n'est pas répétée plus loin dans le fichier.

Je n'ai pas testé le package sur ce fichier, je signale juste l'anomalie.

joelgombin · 2020-03-23T09:59:31Z

de toute façon il faudrait que je refactorise ce package... *Joël Gombin* | +33 (0)6 61 55 22 41 | @joelgombin <https://twitter.com/joelgombin> co-founder and principal datactivist.coop <http://www.datactivist.coop/> | @datactivi_st <http://twitter.com/datactivi.st> we open data, we make them useful

…

On Mon, Mar 23, 2020 at 10:51 AM François Briatte ***@***.***> wrote: Hello, C'est un détail, mais pour le fichier du premier tour des municipales 2020 <https://www.data.gouv.fr/fr/datasets/elections-municipales-2020-resultats/>, il faut retirer la colonne 37 pour que le fichier soit vraiment régulier dans les noms de colonnes. La colonne 37 correspond au nombre de sièges par secteur (pour Paris, Lyon et Marseille). Contrairement aux autres colonnes "candidat(e)", elle n'est pas répétée plus loin dans le fichier. Je n'ai pas testé le package sur ce fichier, je signale juste l'anomalie. — You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub <#4>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AAOUODZZPNG5NDCG66QL5B3RI4WLRANCNFSM4LRXPVYQ> .

briatte · 2020-03-23T11:38:22Z

Certes ; j'ai codé pareil en quelques lignes avec purrr::map_dfr, mais ne suis pas allé jusqu'à rendre ça flexible au niveau des colonnes sélectionnées, ce que tu as fait pour ce package.

briatte · 2020-03-23T11:39:48Z

Exemple de code pour lire le T1 de 2020 :

d <- "2020-03-16-resultats-communes-de-1-000-et-plus.xlsx"
d <- readxl::read_excel(d, guess_max = 10^5)

# remove extra column (sièges secteur) that breaks regularity of column names
d <- d[ -37 ]

col_names <- c(
  "Département", "Code postal", "Commune",
  "Inscrits", "Votants", "Exprimés",
  "Liste", "% Exprimés"
)
purrr::map_dfr(seq(20, 186, by = 11), function(x) {
  d[, c(1, 3, 4:5, 8, 16, x, x + 9) ] %>% 
    purrr::set_names(col_names)
})

briatte · 2020-03-23T11:40:59Z

En revanche ça ne fonctionne pas quand il y a des soucis comme ceux indiqués en #5, ou quand il manques les noms de colonnes comme dans les données des municipales 2014.

briatte mentioned this issue Mar 23, 2020

Anomalies dans le fichier des municipales 2008 #5

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Anomalie dans le fichier des municipales 2020, tour 1 #4

Anomalie dans le fichier des municipales 2020, tour 1 #4

briatte commented Mar 23, 2020

joelgombin commented Mar 23, 2020 via email

briatte commented Mar 23, 2020

briatte commented Mar 23, 2020

briatte commented Mar 23, 2020

Anomalie dans le fichier des municipales 2020, tour 1 #4

Anomalie dans le fichier des municipales 2020, tour 1 #4

Comments

briatte commented Mar 23, 2020

joelgombin commented Mar 23, 2020 via email

briatte commented Mar 23, 2020

briatte commented Mar 23, 2020

briatte commented Mar 23, 2020