[Projet communautaire] Statistique FFA

Aller tout en bas au dernier message - Répondre au message - Retour au forum sur la course à pied

[Projet communautaire] Statistique FFA par Johndoef (membre) (93.26.213.xxx) le 27/05/20 à 12:18:28


Bonjour à tous,

Je viens vous présenter un projet qui pourrait beaucoup intéresser les passionnés de la course à pied et j’aurais besoin de votre contribution. Pour le moment voici ce que je souhaite faire (et que j’ai déjà commencé):



1/ Présentation



Je souhaite recueillir toute les chronos sur le site de la FFA pour les distances du 10km/Semi-marathon/Marathon sur toutes les années qui sont disponible (donc de 2004 à 2019). Je les trie et je les mets en forme en fonction de l’année des résultats et de l’âge des participants.

J’obtiens un tableau qui pourra me donner des données intéressantes et détaillées qui permettra d’étayer les débats et les questions récurrentes sur les progressions possible, le potentiel que l’on peut atteindre, si oui ou non on courrait mieux avant, sur l'engouement dans la course à pied et j’en passe.

Les données collectés seront dans un Excel, je programmerai une macro afin de donner automatiquement les données qui vous intéresse.

J’ai déjà trouvé des idées de graphiques qui pourraient nous permettre de montrer certaines choses, n’hésitez pas à me faire savoir si vous vous posez d’autres questions, je pourrais inclure vos propositions.

Voici la liste des données que je proposerai d’ores et déja, vous avez entre crochet le paramètre que l’utilisateur pourra modifier avec:

[Âge] = l’âge qui nous intéresse d’étudier
[Génération] = L’année de naissance que nous souhaitons étudier, la différence avec l’âge va nous permettre de comprendre l’évolution de la pratique en couse à pied.
[Chrono] = Le temps réalisé
[Classement] = Le classement du temps réalisé classé par âge
[Année] = l’année de réalisation de la performance

- A [âge] ans, nombre de personne sous les [chronos]
Graphiquement => en abscisse: la génération, en ordonnée: le classement

- A [âge] ans, pourcentage de personne sous les [chronos]
Graphiquement => en abscisse: la génération, en ordonnée: le classement divisé par le nombre de personne

- Evolution du top [Classement] en fonction de la génération.
Graphiquement => en abscisse: la génération, en ordonnée: le chrono

- Pour la génération [Génération] montrer le nombre de personne sous les [Chrono] au fil des années
Graphiquement => en abscisse: les années, en ordonnée: le classement

- Pour la génération [Génération] montrer le pourcentage de personne sous les [Chrono] au fil des années
Graphiquement => en abscisse: les années, en ordonnée: le classement divisé par le nombre de personnes.

- Pour la génération [Génération] montrer le chrono du top [Classement] au fil des années
Graphiquement => en abscisse: les années, en ordonnée: le chrono

- Pour la génération [Génération], évolution du nombre de participants en fonction des années
Graphiquement => en abscisse: nombre de participants, en ordonnée: les années

- Pour l’année [Année], évolution du nombre de participants en fonction de la génération
Graphiquement => en abscisse: nombre de participants, en ordonnée: les générations


Pour vous montrer les possibilités de tout ça, voici un exemple que j’avais fourni sur ce sujet:
http://www.courseapied.net/forum/msg/134947.htm

https://ibb.co/nkBpwS3

C’est ici le 3ème point que j’ai mis en avant.

Je m’engage à partager gratuitement et sans contrepartie le fichier final



2/ Aide



Comme vous avez pu le voir, l’exemple que j’ai montré corresponds à l’année 2004, pour le 10km, homme.
J’ai fait seul l’année 2004 et 2005, mais le travail est très long puisqu’il faut refaire ça pour les femmes et les 2 autres distances et cela jusqu’à 2019! Ce qui corresponds actuellement à 1/46eme du travail réalisé, sans compter qu’en 2004, il y avait moins de coureurs qu’actuellement.

J’en appelle donc au pouvoir de recherche collective:
Pour m’aider, il suffit d’aller sur le bilan de la FFA ici:

https://bases.athle.fr/asp.net/accueil.aspx?frmbase=bilans&frmmode=1&frmespace=0

Selectionner:
- L’année
- L’épreuve (Attention, on prends le 10km, pas le 10000m)
- Le sexe
- L’année minimale et l’année maximale (qui doivent être les mêmes).

Concernant la sélection, je vous indiquerai régulièrement les données que je souhaite avoir et les données que j’ai déjà reçu dans un tableau. Vous pourrez prendre n’importe quelle donnée que vous souhaitez dans ce tableau. Je conseille même de ne pas forcément suivre l’ordre afin d’éviter les doublons que je risque de recevoir.
=> Référez vous au dernier tableau disponible dans le sujet <=

Une fois que vous avez la page de résultat, vous copiez/collez les résultats dans une feuille Excel, jusqu’à la dernière page de résultat. Bien sûr, il faut coller les pages dans Excel les uns à la suite des autres afin de n’avoir que les quelques colonnes (Classement, temps, sexe, nom, club, region ,departement, categorie, age, date et lieu).

Je tiens à préciser que lorsque je traiterai les donnée, je ne garderai que la position et le temps. Tout sera anonymisé (même si de toute façon, tout est déjà sur le site...)

Si vous avez envie d’en faire plus, vous pouvez aussi faire plusieurs générations à la suite mais il faut au moins que vous m’indiquiez que l’année de naissance change.

Une fois que c’est fait, je souhaiterais que vous nommiez expressément votre fichier avec: la distance, le sexe, l’année de performance et la génération. Pour pouvoir s’y retrouver.
Par exemple pour ce jeu de donnée:

https://bases.athle.fr/asp.net/liste.aspx?frmpostback=true&frmbase=bilans&frmmode=1&frmespace=0&frmannee=2004&frmepreuve=261&frmcategorie=&frmsexe=M&frmnationalite=&frmamini=1980&frmamaxi=1980&frmligue=&frmdepartement=&frmclub=&frmvent=&frmathlerama=&frmfcompetition=&frmfepreuve=&frmplaces=

On pourra appeler le fichier: 10km-h-2004-1980
Puis vous envoyez le tout à cette adresse crée pour l’occasion: cap.data@outlook.com


3/ Données recherchée de ce jour:


Voici donc le premier tableau, qui sera mis à jour régulièrement:


__________
Année: 2005
Epreuve: 10 km Route
Sexe: M

Année Naissance Mini/Maxi:

1964
1963
1962
1961
1960
1959
1958
1957
1956
1955
1954
1953
1952
1951
1950
1949
1948
1947
1946
1945
1944
1943
1942
1941
1940
1939
1938
1937
1936
1935
1934
1933
1932
__________

Année: 2006
Epreuve: 10 km Route
Sexe: M

Année Naissance Mini/Maxi:

1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
1979
1978
1977
1976
1975
1974
1973
1972
1971
1970
1969
1968
1967
1966
1965
1964
1963
1962
1961
1960
1959
1958
1957
1956
1955
1954
1953
1952
1951
1950
1949
1948
1947
1946
1945
1944
1943
1942
1941
1940
1939
1938
1937
1936
1935
1934



J'espère que ce projet vous intéressera et que vous allez m'aider un peu.
Ce qui est amusant, c'est que les plus expérimentés d'entre nous pourraient déjà surligner leur propre performance d'il y a 15 ans.

[Projet communautaire] Statistique FFA par Johncaffe (invité) (95.128.151.xxx) le 27/05/20 à 12:31:16

Chouette projet qui nécessite en effet beaucoup d'heures de boulot !
Petite question : Souhaites-tu intégrer dans tes données les athlètes d'origine étrangère ? (qui apparaissent aussi parfois le site de la FFFA si licenciés en France)
Il serait bien que les contributeurs notent sur ce fil les données qu'ils s'engagent à traiter pour éviter les doublons.

[Projet communautaire] Statistique FFA par Johndoef (membre) (93.26.213.xxx) le 27/05/20 à 12:37:56

Oui bien sûr, je prends aussi ceux qui sont étrangers. J'ai aussi pris les résultats qui sont favorables, parfois il y a donc des doublons c'est vrai, mais je ne pense pas que ce soit très perturbant pour mettre en évidence les choses que l'on souhaite montrer

[Projet communautaire] Statistique FFA par (invité) (81.249.128.xxx) le 27/05/20 à 13:38:48

On a le droit de récupérer les données de la base FFA?

[Projet communautaire] Statistique FFA par Gab (invité) (87.89.26.xxx) le 27/05/20 à 14:54:35

Initiative intéressante
J’ai pa lu jusqu’à la fin, je me suis arrêté quand j’ai compris que la collecte des données était fait « manuellement » (ou presque). Peut-être serait-il plus pertinent de :
1/ soit passer par une API web pour scripter qq chose qui récupère les données et les tris dans un fichier. Je ne sais pas à quel point un site web peut verrouiller ou laisser libre les données qu’il contient, mais je suis quasi certain que si des lignes de caractères sont visibles sur une page, tu peux les récupérer avec un script (Python ou autre).
2/ soit demander à la FFA l’accès à leur base de données : je suis peut être naïf, mais je ne vois pas la valeur ajouté qu’ils pourraient en tirer et donc pourquoi ils refuseraient

[Projet communautaire] Statistique FFA par (invité) (81.249.128.xxx) le 27/05/20 à 15:03:12

Naïf.

https://www.athle.fr/asp.net/main.html/html.aspx?htmlid=1510

Toute mise en réseau, toute rediffusion, sous quelque forme, même partielle, est donc interdite.
Ce droit est personnel, il est réservé à l'usage exclusif et non collectif du licencié. Il n'est transmissible en aucune manière.
Tout autre usage est soumis à autorisation préalable et expresse.

1. Cadre d’utilisation :

1.1 Les contenus du Site, identifiés www.athle.fr et sous-domaines associés, peuvent être téléchargés, visionnés, écoutés, imprimés et enregistrés sur votre disque dur et utilisés à titre privé mais ne sauraient faire en aucune façon et d’aucune manière l’objet d’outils ou de produits de commercialisation au sens le plus général.
En toute bonne foi, vous ne devez faire qu'une utilisation personnelle des contenus du Site. Tout autre type d'utilisation devra faire l'objet d'un accord obligatoirement écrit et préalable de la FFA

[Projet communautaire] Statistique FFA par (invité) (79.81.62.xxx) le 27/05/20 à 15:22:32

Renseigne toi bien au niveau du droit et des protections des données. Et plus si ton projet a un but lucratif ou si il va générer des fonds, même publicitaire ! Tu devrais contacter la FFA avant et déterminer ton projet, et ça t'évitera des ennuis.

[Projet communautaire] Statistique FFA par Johndoef (membre) (93.26.213.xxx) le 27/05/20 à 15:43:35

Merci pour vos retours, effectivement je ne souhaite pas d'ennui.

Je me suis renseigné sur le site de la CNIL et j'y ai trouvé cela:

https://www.cnil.fr/fr/publication-en-ligne-et-reutilisation-des-donnees-publiques-open-data

https://www.cnil.fr/fr/comment-reutiliser-les-donnees-diffusees

Maintenant, les conditions présente sur le site de la FFA comme indiqué plus haut (merci pour le lien) semble ne pas permettre ce projet.

A noté qu'il n'y a aucun but lucratif et le document sera en libre partage


je vais demander directement à la FFA en espérant obtenir une réponse.

[Projet communautaire] Statistique FFA par Gab (invité) (87.89.26.xxx) le 27/05/20 à 23:16:15

« Tout autre usage est soumis à autorisation préalable et expresse » -> donc oui, leur demander semble la 1ère chose à faire.
Je réitère : je ne vois pas la valeur ajouté qu’ils pourraient tirer de cet base de données, et donc pourquoi ils refuseraient

Répondre au message - Retour au forum sur la course à pied

Forum sur la course à pied géré par Serge