Appliquons les principes du logiciel libre à l’ADN !

De plus en plus de développeurs informatiques et d’entreprises reconnaissent les qualités de l’open-source, et plus généralement du logiciel libre, et se mettent à partager leurs codes. L’exemple le plus flagrant étant bien sur Microsoft qui se met à ouvrir des logiciels qui ont été fermés pendant des années.

En parallèle, les services de séquençage individuels du génome se répandent. La hype gagne lentement la population, tandis que de nombreux articles méfiants mettent en garde contre les dérives potentielles des usages que les clients comme les entreprises de séquençage pourraient avoir de ces données génétiques.

L’ADN est donc surtout vu comme une donnée (privée) à haute valeur ajoutée. Ici, nous allons ré-insister sur le fait que l’ADN est à la fois donnée et programme.

Les séquences biologiques sont des programmes

Code source. En effet, on peut considérer la séquence d’ADN comme le code source d’un être vivant: elle en définit le fonctionnement, un grand nombre de particularités physiques et mentales, ainsi que de différences avec les autres individus. Elle est, avec l’environnement de l’individu (on dira le background culturel, l’éducation, et le passé pour un être humain), ce qui vous définit vous par rapport à votre voisin.

Performances. Et tout comme un programme, l’ADN peut être efficace, ou bugué. Une mutation dans la séquence au mauvais endroit et hop, c’est la maladie génétique: votre métabolisme devient moins efficace, vos membres disproportionnés, ou vos cheveux bizarres (je vous vois, les roux qui me lisent). Dans d’autres cas, plusieurs versions différentes peuvent très bien donner le même résultat à la fin.

Évolution. Tout comme un programme aussi, la séquence d’ADN s’améliore de façon incrémentale, guidée par la mutation, la recombinaison, la dérive génétique et la sélection. Le développeur informatique en train de coder, lui aussi, essaie des choses jusqu’à ce que ça marche. Parfois il avance, parfois il casse tout son algorithme avec sa modification et doit revenir en arrière. Finalement, c’est une sélection (non pas naturelle, mais artificielle, certes) qui lui fait conserver uniquement le programme qui fonctionne.

Rappels de terminologie sur les logiciels libres

L’open-source et le logiciel libre sont deux choses différentes. On qualifie un logiciel, programme, ou code source de libre si les utilisateurs ont la possibilité, légalement, techniquement, et gratuitement:

  • d’utiliser le programme,
  • d’étudier le fonctionnement du programme,
  • de modifier le programme pour l’adapter à son besoin ou l’améliorer,
  • de reproduire et partager le programme avec d’autres, avec ou sans modification, y compris commercialement.

Ainsi, le fait de partager le code source d’un logiciel concerne surtout les deuxième et troisième points. Le « libre » garantit plus de droits que l’open-source, comme la liberté d’utilisation et de partage. Il existe donc des licences open-source mais non libres, comme certaines licences de libre diffusion (LLD) qui retirent le troisième et/ou dernier point (pas le droit de modifier, ou pas le droit d’en faire une utilisation commerciale).

Certaines licences, dites copyleft, exigent la redistribution du programme sous la même licence. Cela peut s’appliquer à des licences libres comme non-libres.

Les séquences biologiques sont des programmes, libres

Détail intéressant, la séquence biologique est jusqu’ici considérée (dans l’opinion publique et dans les la plupart des législations) comme conçue par la nature et donc non brevetable en tant que tel. Par exemple l’European Patent Office nous dit, je cite:

Une simple séquence d’ADN sans indication d’une fonction ne saurait constituer une invention brevetable (directive de l’UE 98/44/CE, considérant 23)

Directives relatives à l’examen pratiqué, Partie G: Brevetabilité, European Patent Office

Vous ne pouvez donc pas breveter un gène, mais vous pouvez breveter votre application d’un gène pour résoudre un problème industriel. Par exemple, on peut breveter le fait de prendre le gène d’une espèce de pomme A pour le mettre dans une espèce de pomme B, si l’OGM ainsi formé s’oxyde moins à l’air, et se vend mieux.

Ainsi, on ne peut pas protéger une séquence d’ADN fraîchement séquencée par un brevet pour empêcher quelqu’un de l’utiliser avant de lui avoir trouvé une utilité. Et même si vous lui trouviez une utilité, quelqu’un pourrait l’utiliser pour autre chose que votre utilité brevetée sans problème.

Les séquences biologiques connues dans des bases de données publiques sont donc des programmes libres : il est en effet autorisé à tous de produire, synthétiser, étudier, utiliser ces séquences d’ADN ou de protéines, mais aussi de les vendre ou les redistribuer. Certains peuvent considérer que c’est le service et pas la séquence qui est vendue, mais la différence est faible: l’éditeur de logiciels vend-il le service de programmation ou l’exécutable final ? Le peintre vend-il son temps de travail ou le tableau ?

La loi et l’ADN humain

Malheureusement pour les entreprises de séquençage, la connaissance de la séquence d’une personne, directement après le séquençage, ne donne pas accès à une application brevetable et donc rentable.

Tout d’abord parce que des lois éthiques existent souvent dans les états pour empêcher la production d’humains modifiés. Mais dans un contexte de montée en puissance des courants transhumanistes et de remise en question systématique des principes éthiques par les courants progressistes, ces lois tendront, dans dix ou vingt ans, à disparaître. Elles sont déjà bafouées aujourd’hui par la Chine et les États-Unis qui ont passé le cap des embryons génétiquement modifiés. L’humanité essaiera forcément, avant éventuellement de se rendre compte que c’était une mauvaise idée. L’envie est évidemment trop forte.

Les séquences biologiques sont donc aussi des données précieuses

Naturellement, la seule façon de tirer un avantage commercial de quelque chose qui ne peut pas être protégé par le brevet est de le protéger par le secret.

L’ADN, en particulier l’ADN humain, puisqu’il est nécessairement libre si considéré en tant que programme, devient alors une donnée, stockée jalousement par les compagnies pharmaceutiques ou biotechnologiques dans l’attente qu’on lui trouve une application brevetable (par exemple qu’on développe une thérapie génique), dans l’attente aussi que les législations éthiques sur l’humain se relaxent bien sur, ou tout simplement en tant qu’objet d’étude scientifique.

L’eugénisme, c’est mal, m’voyez

Lorsque les humains se mettent à vouloir sélectionner les caractéristiques d’une population sur des bases génétiques, ont dit qu’ils font de l’eugénisme. En termes biologiques, ils appliquent une sélection artificielle supplémentaire à la sélection naturelle à leur propre espèce.

Il y a deux façons de faire . Première façon, empêcher les « non-aptes » de vivre: exécution des juifs, des noirs, des homosexuels (GODWIN),… mais aussi avortement ou euthanasie des trisomiques et autres handicaps génétiques, ou plus malicieusement, sélection lors de l’accès au soins de certaines populations, restriction des naissances dans certaines communautés, etc… Deuxième façon, choisir les gènes de ceux qui naissent, pour qu’ils fassent partie des « aptes ». Il s’agit ici des scénarios de conception rationalisée d’embryons.

Les deux façons posent des problèmes éthiques: le droit à la vie est remis en question par l’élimination des « non-aptes », et des problèmes d’égalité d’accès à la conception rationalisée se posent puisqu’en général le service serait payant, et seuls les plus riches pourraient se permettre de choisir les caractéristiques génétiques de leurs descendants.

Il s’installe donc des inégalités lorsque des entreprises possèdent les droits sur certaines séquences d’ADN jugées utiles, qui pourraient, par exemple, être utilisées pour faire de la conception rationnelle d’embryons. Le client, par analogie l’utilisateur, pourrait même se voir vendre l’enfant (le programme) sans récupérer aussi sa séquence d’ADN (le code source).

Lutter contre les inégalités avec le libre

Comment lutter contre ces inégalités ? En ré-appliquant aux données génétiques les principes du libre ! On fait ça depuis des années avec les programmes et ça fonctionne bien. Pourquoi ne pas essayer avec l’ADN ?

Par exemple, dans une approche « biologie de synthèse », la registry iGEM propose des « briques » génétiques pouvant être utilisées pour une tâche précise, et dont l’objectif est d’être combinées entre elles pour programmer soi-même des cellules à effectuer une tâche précise.

C’est un exemple, mais qui concerne les applications de biologie industrielle et biotechnologies. Il faudrait qu’une plateforme similaire voie le jour pour les génomes humains: une base de données publique des codes génétiques humains.

La meilleure façon de détruire l’avantage compétitif d’un code propriétaire, c’est de maintenir en vie des codes libres qui font la même chose. C’était vrai pour le logiciel, ce sera vrai pour l’ADN. La meilleure façon de détruire le caractère personnel et commercial de vos données génétiques, c’est de les publier publiquement et d’en autoriser l’utilisation, l’étude, la modification et le partage. C’est un avantage de moins pour les sociétés privées qui commercialiseraient ces données.

A lire aussi pour aller plus loin…

Sur la question plus spécifique du séquençage personnel de son ADN, une question fascinante pour les bioinformaticiens qui malgré les limites éthiques évidentes me démange depuis des années, je vous propose de lire / regarder :

23 raisons de ne pas dévoiler votre ADN… →
Veritasium – Your DNA is already in a database →

Catalogue de fiches – CPGE TB

Boite et jaquette du CD-ROM de fiches TB lors de sa vente en 2015.En 2015, je préparais le concours A TB pour entrer en école d’agronomie/vétérinaire/de biotechnologies. Et en une semaine, je me rendais compte que la collection de fiches soigneusement réalisée pendant deux ans allait se retrouver dans un carton et ne plus jamais servir.

Pour éviter cela, j’ai édité un CD-ROM de fiches TB, que j’ai vendu à la promo suivante, avec 100% de retours positifs (les non-satisfaits n’ayant pas donné de retour, probablement).
Depuis, ils se le sont refilés entre eux, et je ne prends plus la peine de le vendre, alors appliquons un peu les beaux principes d’open-science qui me sont chers:

https://fichestb.becquey.info

Je publie une révision mineure du CD-ROM de fiches, qui sera accessible en ligne à l’adresse ci-dessus !

Contenu du site :

    • Des fiches pour chaque cours de chaque matière (voir la liste des fiches) englobant l’intégralité du programme pour le concours A-TB 2015, à l’exception des chapitres suivants que je n’ai pas eu le temps de faire:
      • Echanges membranaires
      • Potentiels de membrane
      • La Cellule bactérienne

      Certains peuvent également être incomplets (Les cellules, des unités structurales et fonctionnelles) ou pas assez à votre goût, et je m’en excuse.

    • Un moteur de recherche par mot-clé qui vous permettra de retrouver rapidement la définition ou les différentes occurrences d’un terme dans les différentes matières.
    • Un lexique moléculaire des substances du vivant:
    • Il vous permettra de retrouver la définition et le(s) rôle(s) d’une molécule dont vous ne vous souvenez plus.
    • Une rubrique d’aide pour vous aider à comprendre mes notes, avec notamment les abréviations écrites que j’utilise.

Ces fiches contiennent TOUT. Ou en tout cas, le maximum de détails que j’ai pu y mettre. Quand il y avait besoin de gagner de la place, j’ai plutôt sacrifié les choses évidentes dont on sait se souvenir même sans fiches.
Vous ne trouverez donc pas dans les fiches des rappels des choses simples, ou peu.

L’objectif était d’avoir une vue d’ensemble de chaque chapitre (plan très apparent), et le maximum de détails techniques, qui vous distingueront de la masse.

Ce pack de fiches ne peut pas remplacer vos cours, mais il peut:

  • Vous donner des plans tout prêts pour préparer une kholle,
  • Vous permettre de survoler un cours en dix minutes pour réviser l’essentiel,
  • Vous permettre de retrouver dans quel(s) cours on parle de tel ou tel mot avec grâce au moteur de recherche
  • Retrouver la définition d’un terme de vocabulaire grâce au GROS lexique
  • Vous permettre de connaître l’intégralité quasi-exclusive du programme de prépa avant même que les profs commencent le cours, et donc de prendre de l’avance sur les autres

Les scans et photographies de fiches sont en Full-HD zoomables à lisibilité améliorée sur PC, tablettes, et smartphones (et TI-Nspire).
Comprend le programme de cours de Maths, Physique, Chimie, Informatique, SVT, Biotechno, Géographie, et certains TP.

Il y a aussi certains des PDF réalisés pour la classe entière et dont je ne suis pas (toujours) l’auteur.

Faites en bon usage & enjoy,

Persalteas