Aller au contenu principal

Méthodologie

Transparence totale sur le calcul des scores. Chaque score est reproductible à partir des sources publiques citées.

Important : Ces scores mesurent la cohérence des données publiques. Ils ne constituent ni une accusation, ni un jugement de valeur, ni une imputation de comportement illégal. Le citoyen tire ses propres conclusions.

Score de cohérence patrimoine (0-100)

Version : coherence-v2

Ce qu'il mesure : La complétude des déclarations HATVP et la proximité entre intérêts déclarés et marchés publics.

Méthode :

  • Vérifie la présence de déclarations d'intérêts (DI) et de patrimoine (DP) — -30 pts chacun si absent
  • Vérifie la disponibilité des données XML ouvertes — -20 pts max
  • Vérifie la fraîcheur des déclarations — -10 pts si antérieures à 2025
  • (v2) Ratio participations déclarées / identifiées SIRENE — -5 à -10 pts si faible
  • (v2) Participations dans des entreprises attributaires de marchés dans le département — -5 pts par entreprise (max -20)

100 = déclarations complètes, aucune proximité détectée entre intérêts et marchés.

Confiance : basée sur la qualité moyenne du matching fuzzy (score SIRENE).

Source : HATVP Open Data (déclarations + XML participations)

Score de concentration marchés (0-100)

Version : concentration-v1

Ce qu'il mesure : La diversité des attributaires de marchés publics dans un département.

Méthode :

  • Calcule l'indice de Herfindahl-Hirschman (HHI) sur les montants par attributaire
  • HHI = somme des parts de marché au carré
  • Score = (1 - HHI) × 100
  • Filtre les montants aberrants (> 1 milliard €)

100 = concurrence parfaite, aucun attributaire ne domine.

Source : DECP (data.gouv.fr)

Score réseau (0-100)

Version : network-v1

Ce qu'il mesure : La densité des liens entre un élu et les entreprises attributaires de marchés dans son département.

Méthode :

  • Construit un graphe de relations (élu ↔ marchés ↔ entreprises)
  • Calcule le degré du noeud élu (nombre de connexions)
  • Score = 100 × e(-degré/50)

100 = aucun lien détecté.

Source : Croisement HATVP + DECP + SIRENE

Score de transparence (0-100)

Version : transparence-v1

Ce qu'il mesure : Le niveau de transparence globale d'un élu (déclarations, lobbys, données ouvertes).

Méthode :

  • Présence de déclarations d'intérêts et de patrimoine
  • Disponibilité des données en open data XML
  • Bonus si inscrits au registre des lobbys

Score composite (0-100)

Version : composite-v2

Ce qu'il mesure : Moyenne pondérée de tous les scores.

Pondérations :

  • Cohérence patrimoine : 30%
  • Concentration marchés : 25%
  • Réseau : 25%
  • Transparence : 20%

Extraction des participations (HATVP XML)

Méthode :

  • Téléchargement du fichier XML mergé HATVP (143 MB, 12 756 déclarations)
  • Parsing mémoire-efficace (iterparse)
  • Extraction des 4 types : participations financières, dirigeant, SCI, valeurs non cotées
  • Matching par nom + prénom vers les élus en base
  • Fuzzy matching (rapidfuzz, seuil 80%) des noms de sociétés vers SIRENE

Source : HATVP merged XML

Sources de données

SourceDonnéesLicence
HATVPDéclarations patrimoine, intérêts, participationsEtalab
DECPMarchés publicsLicence Ouverte
INSEE SIRENERépertoire national des entreprisesLicence Ouverte
Journal OfficielNominations et décretsDonnées publiques
CNCCFPComptes de campagne et financement partisDonnées publiques
Ces données sont issues exclusivement de sources publiques. Les scores mesurent la cohérence des données, pas l'intégrité des personnes. Le citoyen tire ses conclusions.