# interhop.org
interhop@riseup.net
@interhop@mstdn.io
framagit.org/interhop
----
## interHop.org
- Pour des communs numériques en santé
- Pour un partage libre et décentralisé des savoirs en informatique médicale.
- Pour la garantie des droits à la protection de la vie privée et la préservation du secret médical (Serment d'Hippocrate)
----
## interHop.org
Regroupe des défenseurs des logiciels libres et d’une utilisation auto-gérée des données de santé à l’échelle locale.
<br>
Professionnel.le.s de santé, ingénieur.e.s, datascientists, juriste, DPO
----
## Framasoft
Changer le monde, un octet à la fois
Un numérique émancipateur par actions concrètes
<img data-src="https://framapiaf.s3.framasoft.org/framapiaf/accounts/avatars/000/000/399/original/aa56a445efb72803.jpg" width=30%>
---
## Autonomie numérique
La souveraineté numérique renvoie à la Nation et à sa capacité d'agir dans le Cyberespace de l'impacter et de le réguler.
Le terme d'autonomie numérique est plus global, multidimensionnel. C'est la capacité d'autodétermination dans l'environnement Cyber.
---
# Open data -> Interopérabilité (portabilité)
----
## Peu d'open data en santé
- Sauf si anonymisé (difficile)
- Pseudonymisation
- [La Cnil approuve WeData pour l’anonymisation des données de santé](https://www.usine-digitale.fr/article/la-cnil-approuve-wedata-pour-l-anonymisation-des-donnees-de-sante.N1024644)
----
## Interopérabilité
- 2019 : [Pour l’interopérabilité des géants du Web : lettre commune de 75 organisations](https://www.laquadrature.net/2019/05/21/pour-linteroperabilite-des-geants-du-web-lettre-commune-de-45-organisations/)
- "excessivement agressif pour le modèle économique des grandes plateformes"
----
## Sémantique
> [Les terminologies ou les ontologies utilisées par les administrations doivent être strictement opensources. En effet celles-ci sont capitales pour permettre l'interopérabilité sémantique des systèmes d'information.](https://www.mission-open-data.fr/processes/politique-publique-donnee/f/2/proposals/140)
----
## Sémantique
- Web Sémantique: dialogue humain/machine (SOLID, schema.org)
- Susana : outils opensource d'alignement terminologique développement par InterHop, financement en attente d'EDHEN
----
## Syntaxique
- [ActivityPub](https://framalibre.org/tags/activitypub) : Peertube, Mastodon, Mobilizon
- [Pods / projet SOLID](https://solid.mit.edu/) : plate-forme décentralisées et entièrement sous le contrôle des utilisateurs plutôt que contrôlé par d'autres entités
- FHIR / OMOP: API (10%) != Base de données
----
### Volonté politique de favoriser des standards ouverts d’interopérabilité
---
# Open code source
# -> open plateforme d'analyse
----
## Plateforme bigdata APHP
Entrepôt de Données de Santé (EDS) : https://eds.aphp.fr
----
### EDS : Projets en cours
- [124 en cours](https://eds.aphp.fr/recherches-en-cours)
- [58 liés au Covid](https://eds.aphp.fr/recherches-en-cours/recherches-en-cours-covid-19)
![](https://i.ibb.co/wRcTfw9/Screenshot-2020-11-17-at-07-57-33.png)
----
### EDS : Architecture
- La [plateforme Big-Data](https://eds.aphp.fr/nos-services/plateforme-outils) : 4 briques principales
- La récupération et la modélisation des données (ETLs),
- Le stockage des données (SQL, Hadoop),
- L’exposition des données et algorithmes (APIs),
- Les différents portails et outils web d’accès aux ressources et données : i2b2, jupyter, cohort360.
----
### EDS : Architecture
![](https://eds.aphp.fr/sites/default/files/inline-images/plateforme_4_0.png)
----
### EDS : Architecture
- logiciel libre exclusivement
![](https://eds.aphp.fr/sites/default/files/inline-images/plateforme_3.png =800x450)
----
### EDS : Prix première version
- 100 000 euros
- 2 ingénieurs pour l'installation
- [Datathon réalisé par l'APHP](https://www.aphp.fr/contenu/datathon-dat-icu-intensive-care-unit-4-projets-innovants-selectionnes-lissue-de-48h-danalyse) :
- 160 participants (Iqvia, Hitachi, Google) du datathon.
- 15 000 requêtes exécutées avec une durée maximale d'une minute
----
### EDS : capacité Actuelle
- ~2 Po (2.000 To) d'espace disque
- ~800 coeurs (1600 Threads) CPU
- ~9 To de RAM
- 24 GPU (Nvidia P40)
#### ~ 30% des données françaises
----
## Proposition
> Développement centralisé plateforme ubiquitaire de bigdata
- Nationale, Franco-Allemande, voire Européenne
- Plateforme pensée sur un modèle décentralisé : approche fédérée
- Compatible aspects environnementaux et réglementaires (RGPD)
---
# Décentralisation
- Technique
- != gouvernance, développement de code source
----
### Possible techniquement
- Mastodon, Matrix, Pleroma, Peertube, Mobilizon
- https://www.substra.ai/fr/accueil
- https://www.openmined.org/
- Réseau interHop : Lille
<br>
#### Grâce à l'interopérabilité !
----
![](https://framagit.org/interhop/wiki/-/wikis/application-type.png)
----
![](https://i.ibb.co/42pSSD7/federation.png)
----
### Propriété logiciels fédérés
- Simplicité: principes du KISS (Keep It Simple Stupid)
- Efficience: problématiques “big-data” minimisées
- Sécurité/Robustesse: cloisonnement
- Spécialisé: adaptations locales
- Agilité: échelle humaine (<=8 personnes)
----
### Application technique du RGPD
- Principe de minimisation
- Portabilité des données
----
> Concernant le HDH, la [CNIL](https://www.legifrance.gouv.fr/cnil/id/CNILTEXT000038142154/) appelle dès maintenant l’attention sur la problématique majeure du respect, en pratique, des principes de limitation des finalités et de minimisation des données par ces nouveaux traitements, évoluant dans un contexte d’accumulation de données pour alimenter les algorithmes d’intelligence artificielle.
----
### Sécurité et qualité des données
- [60% of all attacks were carried out by insiders](https://hbr.org/2016/09/the-biggest-cybersecurity-threats-are-inside-your-company) Ex: NSA/Snowden
- [80% du temps ingénieur](https://pubmed.ncbi.nlm.nih.gov/28495345/) est utilisé pour qualifier les données
----
### Proposition : Compagnons de la données
> [Les administrations publiques collectent de nombreuses informations qui sont sous utilisées. Pour être menée efficacement, cette démarche doit être réalisée de manière locale en impliquant les administrations locales accompagnées par des “compagnons de la donnée”](https://www.mission-open-data.fr/processes/politique-publique-donnee/f/2/proposals/139)
---
# Intérêt général
- [Concept imprécis](https://www.indsante.fr/sites/default/files/Documents_publics/rapport_dexpertise_juridique_sur_l_evaluation_de_linteret_public.pdf)
- [Consentement non nécessaire](https://theconversation.com/fichiers-sanitaires-un-destin-trace-vers-la-surveillance-generalisee-141894)
- Information transparente et claire
- Droit d'opposition
----
> [Les citoyens doivent également être rassurés sur le fait qu’après avoir donné leur consentement à ce que leurs données soient partagées, les systèmes de soins de santé utilisent ces données d’une manière éthique et garantissent la possibilité de retirer à tout moment le consentement donné.](https://la-rem.eu/wp-content/uploads/2020/07/communication-european-strategy-data-19feb2020_fr.pdf)
---
# Conclusion
Pour une nation de la donnée:
- Fédération
- InterHopérabilité
<br>
> _à échelle humaine_ mais “géant du numérique” quand même
{"type":"slide","tags":"interhop, ppt, bothorel","slideOptions":{"transition":"slide"}}