Dernier post

Algorithme d'Espérance-Maximisation

Nous allons voir dans ce billet l'algorithme d'espérance-maximisation ou algorithme EM (Expectation-maximisation) qui va nous permettre d'identifier les paramètres de deux lois normales depuis une seule distribution mixte ou mélange gaussien ou GMM (Gaussian Mixture model). Comme d'habitude, je vais faire au plus simple. Ce billet fait directement suite …

Euler et l'assemblage des génomes

Imaginez une pile de journaux identiques que vous faites sauter avec des pétards pour en faire une pluie de fragments de texte aléatoire. Comment feriez-vous, à partir de ces milliers de morceaux de papier, pour reconstruire un exemplaire complet du journal ? La même question se pose lorsque l'on désire reconstruire …

Le théorème de Bayes en image

J'ai longtemps galéré avec les probabilités...
C'est assez tard que j'ai compris qu'il s'agissait juste d'un problème de dénombrement. Par exemple, si vous cherchez à savoir la probabilité pour que la somme de deux dés lancés soit égale 8, il suffit de dessiner un tableau 6x6 contenant toutes les combinaisons …

Le maximum de vraisemblance

Je continue ma lancée avec ce billet traitant d'un sujet important aussi bien en statistique qu'en intelligence artificielle: Le maximum de vraisemblance. Je rappelle que je ne suis ni statisticien ni mathématicien et que j'essaie d'expliquer ces concepts avec un simple regard naïf de programmeur. (C'est à dire sans formule …

La distribution de χ2

Si vous avez touché un tant soit peu les statistiques, vous connaissez certainement le test de χ². Et comme moi, vous avez certainement du jongler avec des formules ou des notions comme le "degré de liberté" sans vraiment comprendre d'où ça venait. Ce soir, par un élan de motivation sans …

Convertir HPO en base de données Sqlite

Pour mon projet cutevariant, j'ai été amené à devoir convertir l'ontologie HPO (disponible au format obo) en base de données SQLite. Pour ceux qui ne connaissent pas, HPO (Human Phenotype Ontology) est une ontologie décrivant des signes cliniques. C'est-à-dire un vocabulaire standardisé et hiérarchisé afin d'aider les ordinateurs à comprendre …

Les TADs et l'organisation spatiale du génome

Lors de la mitose, l'ADN des cellules eucaryotes s'organise en chromosomes condensés et bien délimités. C'est l'image que nous avons tous d'un chromosome. Mais le reste du temps, pendant l'interphase, ces chromosomes ressemblent davantage à une boule de spaghetti emmêlée dans tous les sens : ce que l'on appelle la …

ADN et jeu du chaos

Vous connaissez le jeu du chaos? Il s'agit d'une construction géométrique très simple permettant de faire apparaitre des fractales. La construction la plus connue est le triangle de Sierpinski que vous pouvez dessiner vous-même avec un papier et un crayon:

  • Dessiner un triangle en numérotant les trois sommets A,B …

Les algorithmes avec la STL

J'utilise de plus en plus dans mon code C++, les algorithmes de la librairie standard. Couplés avec les lambdas expression, j'évite d'écrire des tas de boucles for, et mon code est plus lisible. Sans oublier que cette programmation générique est compatible avec les containers Qt. Donc forcément, j'adore.
Voici donc …

Changer l'humanité avec le « gene drive »

C'est le 2 août 1939 qu'Albert Einstein publie une lettre au Président Roosevelt pour le prévenir du risque de voir apparaître une bombe atomique après la découverte de la réaction en chaîne. Six ans plus tard, quasiment jour pour jour, la bombe atomique tombe sur Hiroshima. Pourquoi je vous …