Rapport sur les Données

Les données publiques françaises sont éparpillées dans des dizaines de portails, dans des formats incompatibles, avec des erreurs que personne ne détecte.

AiFR.AI agrège, croise et vérifie ces données. Quand nous trouvons des incohérences — un domaine de noix à 1.68 milliard, un fonctionnaire à 16 millions — nous les signalons publiquement. C'est la mission de l'IA au service de la transparence.

Vue d'ensemble

24.4M

Entités françaises

663K

Subventions

800K

Comptes publics

10K

Déclarations HATVP

7 sources de données • 26M+ enregistrements • 100% données publiques ouvertes

🏛️ Entités INSEE SIRENE

Explorer

Enregistrements

24 377 820

Source

INSEE

Période

Mise à jour continue

Couverture

Toutes les entités françaises immatriculées

Champs disponibles

SIREN, nom, catégorie juridique, code NAF, effectifs, siège social, date de création

Qualité & limites

24.4M entités importées depuis le fichier SIRENE complet
5.8M entités indexées pour la recherche (searchName)
10 catégories, 19 sous-types classifiés
18.6M entités privées non indexées pour la recherche par nom (recherche par SIREN fonctionne)
Pas de code postal ni département pour la majorité des entités (champ absent du CSV importé)

💰 Subventions aux Associations

Explorer

Enregistrements

568 816

Période

2010–2025 (13 ans)

Couverture

Subventions accordées par les ministères aux associations

Champs disponibles

Bénéficiaire (SIREN), montant, objectif, année, programme budgétaire, ville

Qualité & limites

568K subventions importées depuis 8 fichiers CSV/Excel
Montant total : 112.8 Md€
Objectifs normalisés (purposeNorm) pour le matching
9 vues matérialisées pour requêtes instantanées
Données 2013, 2014, 2016 partielles (fichiers PLF manquants)
Caractères NBSP dans certains objectifs (nettoyés côté application)

💼 Aides d'État aux Entreprises (UE)

Explorer

Enregistrements

94 403

Période

2014–2025

Couverture

Aides publiques accordées aux entreprises privées françaises

Champs disponibles

Bénéficiaire (SIREN), montant, objectif, année

Qualité & limites

94K aides importées
Montant total : 66 Md€
Vue matérialisée dédiée (mv_top_beneficiaries_stateaid)

🏦 Finances Publiques DGFiP

Explorer

Enregistrements

799 508

Période

2000–2024 (25 ans)

Couverture

Comptes individuels des communes, départements, régions

Champs disponibles

Recettes, dépenses, personnel, CAF, dette, investissement, impôts, DGF, population

Qualité & limites

799K exercices comptables importés via CSV bulk (26 datasets)
36 823 communes couvertes
101 départements + 14 régions
649K enregistrements liés au SIREN (81%)
6 index composites pour les classements instantanés
Valeurs en k€ (milliers d'euros) — converties en euros dans l'API
Noms DGFiP utilisent des tirets (BOUC-BEL-AIR) vs espaces dans SIRENE — matching normalisé
EPCI : 0 enregistrements importés (champs incompatibles avec le parser)

👤 Responsables Publics HATVP

Explorer

Enregistrements

11 951 / 6 148 uniques

Période

2014–2025

Couverture

Déclarations d'intérêts et de patrimoine des élus et hauts fonctionnaires

Champs disponibles

Nom, prénom, mandat, département, date de publication, URL dossier, photo

Qualité & limites

11 951 déclarations pour 6 148 personnes uniques
2 202 députés, 1 413 sénateurs, 4 040 élus EPCI
Photos des députés depuis l'Assemblée Nationale
Matching par slug normalisé (accents, tirets, espaces) — 3 niveaux de fallback

📊 Déclarations Financières HATVP

Explorer

Enregistrements

10 207 / 6 610 avec revenus

Période

2014–2025

Couverture

Revenus, activités professionnelles, mandats électifs, patrimoine

Champs disponibles

Revenus (5 ans), employeur, description poste, indemnités électives, biens immobiliers, véhicules, valeurs mobilières

Qualité & limites

10 207 déclarations parsées depuis XML (115 MB)
6 610 avec données de revenus, 3 865 personnes uniques
Revenu moyen déclaré : 239 925 €
Revenus max : 61.5 M€ (Nathalie Goulet)
Seules 47 déclarations patrimoniales (immeubleDto) vs 10 166 déclarations d'intérêts
Montants au format français avec espaces (46 775) — parsés correctement
Certains champs marqués [Données non publiées]

🤝 Répertoire des Lobbyistes

Explorer

Enregistrements

3 926 / 3 604 liés

Période

2017–2025

Couverture

Organisations enregistrées comme représentants d'intérêts en France

Champs disponibles

Nom, SIREN, catégorie, dirigeants, collaborateurs, clients, site web

Qualité & limites

3 926 organisations importées depuis JSON (130 MB)
3 604 liées à des entités via SIREN (92%)
1 221 groupes professionnels, 1 134 entreprises, 782 ONG
Dates au format DD/MM/YYYY — parsées avec fonction dédiée

⚙️ Infrastructure technique

Base de données

PostgreSQL 16 (Cloud SQL)

db-g1-small, 1.7 GB RAM, europe-west1

Hébergement

Firebase Hosting + Cloud Functions v2

SSR, CDN mondial, 80 concurrency

Frontend

React 18 + Vite SSR

Server-side rendering, hydration client

ORM

Prisma + SQL natif

6 modèles, 30+ index composites

Cache

CDN Firebase + in-memory

s-maxage 5min-24h, TTL 5-60min

Recherche

pg_trgm + unaccent + btree

Autocomplete <200ms sur 5M entités

CI/CD

GitHub Actions

Lint → Test → Build (SSR+client) → Deploy

SEO

SSR + sitemaps dynamiques

10K+ URLs, JSON-LD, OG dynamiques

Anomalies détectées dans les données source

Ces erreurs proviennent des données officielles, pas de notre traitement. Nous les documentons ici par transparence.

HATVP — Revenus anormalement élevés

Certaines déclarations HATVP présentent des montants incohérents, probablement dus à des erreurs de saisie ou à une confusion entre montants cumulés et annuels dans le XML source.

  • Nathalie GOULET — 61.5 M€ déclarés comme revenus « SENATEUR au SENAT ». Un sénateur gagne ~7 000€/mois. Il s'agit vraisemblablement du cumul de toutes les indemnités sur la carrière, incorrectement agrégé.
  • Teddy FOULE — 16.8 M€ comme « Adjoint administratif » dans une Maison Départementale de l'Enfance. Montant incohérent pour ce type de poste.

EU Transparency — Montants aberrants

Certaines aides d'État dans la base EU Transparency présentent des montants manifestement erronés, possiblement dus à une confusion centimes/euros dans la déclaration à la Commission.

  • DOMAINE DU NOYER (SAS agricole, 0 salarié) — 1.68 Md€ d'aide en 2024. Un domaine de noix ne reçoit pas 1.68 milliard d'euros. Erreur probable : 16 825€ saisi comme 1 682 516 825€.
  • COMPAGNIE ELECTRIQUE DE BRETAGNE — 793 M€ en 2021. Montant à vérifier.
  • FIBRE EXCELLENCE SAINT-GAUDENS — 523 M€ en 2020. Montant à vérifier.

EU Transparency — Doublons détectés

Plusieurs aides d'État apparaissent en doublon (même bénéficiaire, même année, même montant).

  • • Éoliennes flottantes (Groix, Provence, Lion) — doublons 2019
  • • ELECTRO REFINING — 15.3 M€ en quadruplé (2024)
  • • MAG REESOURCE — 15.2 M€ en triplé (2023)

Notre approche

AiFR.AI affiche les données telles qu'elles sont publiées par les organismes officiels (HATVP, Commission Européenne, DGFiP, INSEE). Nous ne modifions pas les montants même lorsqu'ils paraissent erronés, mais nous les documentons ici. Si vous détectez d'autres anomalies, contactez-nous.

100% Données Publiques Ouvertes

Toutes les données proviennent de sources publiques officielles (INSEE, DGFiP, HATVP, Commission Européenne) et sont redistribuées sous licence ouverte. AiFR.AI ne crée pas de données — nous les agrégeons, nettoyons et rendons accessibles.