La santé numérique est rendue possible par la "datafication " massive des patients individuels et d’autres réalités liées au soin. Ces données sont très différentes en nature (des données des capteurs portables au séquençage génomique, des bases de données administratives comme le SNIIRAM aux enquêtes épidémiologiques massives comme Epicov, etc.), au regard des réglementations auxquelles elles sont soumises (concernant le consentement, la protection, l'anonymisation), en ce qui concerne le niveau de quantification qu'elles ont atteint (enquêtes épidémiologiques quantitatives, textes), etc. Pourtant, elles ont besoin d'être articulées dans des infrastructures afin de pouvoir être comparées, associées, croisées, et de permettre ainsi la production de connaissances. Cette articulation soulève certes des problèmes techniques, mais aussi et inséparablement juridiques, sociaux et économiques importants. Elle présuppose en particulier des jugements de valeur sur la question de savoir comment bien assembler les éléments constituant le tout. Quelles sont les qualités souhaitables à la fois pour les données constituantes et des infrastructures produites lorsqu’on assemble des données de santé ? Nous étudierons cette question selon trois dimensions complémentaires. Premièrement, nous prendrons l’exemple de l’enquête Epicov, qui a été mise en place pendant la pandémie de Covid et qui est restée une source robuste d’informations sur cette pandémie. Deuxièmement, nous étudierons les données d’une autre nature, les scores et les échelles des produits alimentaires, produites non à destination des médecins et décideurs mais à destination des consommateurs. Enfin, nous étudierons les comités d’éthique du numérique qui eux aussi produisent des évaluations sur les données. En synthétisant les résultats de ces trois enquêtes partielles, nous pourrons finalement identifier et produire des bonnes pratiques susceptibles d’inspirer la construction de futures infrastructures de données.