Linking anonymous databases for national and international multicenter epidemiological studies: A cryptographic algorithm - École Nationale Supérieure de Biologie Appliquée à la Nutrition et à l'Alimentation ENSBANA
Article Dans Une Revue Epidemiology and Public Health = Revue d'Epidémiologie et de Santé Publique Année : 2009

Linking anonymous databases for national and international multicenter epidemiological studies: A cryptographic algorithm

Chaînage de bases de données anonymisées pour les études épidémiologiques multicentriques nationales et internationales : proposition d'un algorithme cryptographique

Résumé

Background: Compiling individual records coming from different sources is very important for multicenter epidemiological studies; however, European directives and other national legislation concerning nominal data processing must be respected. These legal aspects can be satisfied by implementing mechanisms that allow anonymization of patient data (such as hashing techniques). Moreover, for security reasons, official recommendations suggest using different cryptographic keys in combination with a cryptographic hash function for each study. Unfortunately, this type of anonymization procedure is in contradiction with common requirements in public health and biomedical research because it becomes almost impossible to link records from separate data collections where the same entity is not referenced in the same way. Solving this paradox using a methodology based on the combination of hashing and enciphering techniques is the main aim of this article. Methods: The method relies on one of the best-known hashing functions (the Secure Hash Algorithm) to ensure the anonymity of personal information while providing greater resistance to dictionary attacks, combined with encryption techniques. The originality of the method lies in how the hashing and enciphering techniques are combined: as in asymmetric encryption, two keys are used but the private key depends on the patient's identity. Results: The combination of hashing and enciphering techniques greatly improves the overall security of the proposed scheme. Conclusion: This methodology makes the stored data available for use in the field of public health for the benefit of patients, while respecting legal and security requirements.
Position du problème: Pour conduire des études épidémiologiques multicentriques nationales ou internationales, il est souvent nécessaire de rapprocher des informations d’un même patient, provenant de plusieurs sources. En Europe, le chaînage des fichiers nominatifs, dans le cadre de la recherche médicale, est soumis à la directive européenne du 24 octobre 1995, qui requiert que l’information soit rendue anonyme avant son utilisation à des fins de chaînage. La méthodologie du hachage permet de résoudre le problème de l’anonymisation des données, notamment en santé. Par ailleurs, pour des raisons de sécurité, il est recommandé d’utiliser des clés différentes pour chaque étude. Malheureusement, cette recommandation est en contradiction avec les besoins de chaînage. L’objectif de cet article est de proposer une méthodologie innovante pour répondre à la fois aux exigences en matière de sécurité des informations médicales, tout en permettant le chaînage des données relatives à un même patient et leur exploitation statistique. Méthodes: La méthode repose sur l’utilisation, pour le hachage, de la fonction Secure Hash Algorithm (SHA), qui permet d’assurer l’anonymat des données personnelles, qui est combinée avec des techniques de chiffrement. L’originalité de la méthode réside dans la manière dont le hachage et le chiffrement sont combinés : comme dans les méthodes de chiffrement asymétrique, nous proposons l’utilisation de deux clés, mais avec une différence fondamentale, puisqu’une des deux clés va dépendre de l’identité du patient. Résultats: La combinaison du hachage et des techniques cryptographiques assure une amélioration importante dans la sécurité des données, tout en permettant le chaînage des données multicentriques. Conclusion: Cette méthode rend disponibles les informations rendues anonymes et stockées dans des bases de données multicentriques nationales et internationales, pour une exploitation à des fins épidémiologiques et de recherche clinique. Cela, en respectant les exigences de sécurité imposées par les lois nationales et européennes
Fichier principal
Vignette du fichier
quantin2009.pdf (338.61 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00472976 , version 1 (20-09-2022)

Licence

Identifiants

Citer

Catherine Quantin, Maniane Fassa, Gouenou Coatrieux, Benoît Riandey, Gilles Trouessin, et al.. Linking anonymous databases for national and international multicenter epidemiological studies: A cryptographic algorithm. Epidemiology and Public Health = Revue d'Epidémiologie et de Santé Publique, 2009, 57 (1), pp.e1-e6. ⟨10.1016/j.respe.2008.11.002⟩. ⟨hal-00472976⟩
145 Consultations
67 Téléchargements

Altmetric

Partager

More