Posts in 'informatique'

Algorithme d'Espérance-Maximisation

Nous allons voir dans ce billet l'algorithme d'espérance-maximisation ou algorithme EM (Expectation-maximisation) qui va nous permettre d'identifier les paramètres de deux lois normales depuis une seule distribution mixte ou mélange gaussien ou GMM (Gaussian Mixture model). Comme d'habitude, je vais faire au plus simple. Ce billet fait directement suite …

Le maximum de vraisemblance

Je continue ma lancée avec ce billet traitant d'un sujet important aussi bien en statistique qu'en intelligence artificielle: Le maximum de vraisemblance. Je rappelle que je ne suis ni statisticien ni mathématicien et que j'essaie d'expliquer ces concepts avec un simple regard naïf de programmeur. (C'est à dire sans formule …

La distribution de χ2

Si vous avez touché un tant soit peu les statistiques, vous connaissez certainement le test de χ². Et comme moi, vous avez certainement du jongler avec des formules ou des notions comme le "degré de liberté" sans vraiment comprendre d'où ça venait. Ce soir, par un élan de motivation sans …

Convertir HPO en base de données Sqlite

Pour mon projet cutevariant, j'ai été amené à devoir convertir l'ontologie HPO (disponible au format obo) en base de données SQLite. Pour ceux qui ne connaissent pas, HPO (Human Phenotype Ontology) est une ontologie décrivant des signes cliniques. C'est-à-dire un vocabulaire standardisé et hiérarchisé afin d'aider les ordinateurs à comprendre …

Les algorithmes avec la STL

J'utilise de plus en plus dans mon code C++, les algorithmes de la librairie standard. Couplés avec les lambdas expression, j'évite d'écrire des tas de boucles for, et mon code est plus lisible. Sans oublier que cette programmation générique est compatible avec les containers Qt. Donc forcément, j'adore.
Voici donc …

Raccourci git sous zsh

Raccourci pour utiliser git sous zsh

Un hook git pour mon blog

Vous l'avez sûrement remarqué, j'écris mon blog avec pelican. Lorsque je suis prêt à publier, je commit mon blog sur github, puis dans un second temps je synchronise mon dossier html généré sur mon serveur web. Et comme je suis fainéant, je veux que ces deux étapes se fassent en …

Répartition des variants sur le génome entre J.Watson et C.Venter

Nous avions vu dans un précédent post que le génome de James Watson comptait un peu plus de 2 millions de variants par rapport au génome de référence; et qu'environ la moitié de ces variants étaient partagés avec Craig Venter.
Aujourd'hui, j'ai cherché à savoir si les densités des mutations …

Transition et transversion dans le génome humain

Aujourd'hui, J'ai eu une soudaine envie de calculer les fréquences des différents types de substitutions dans le génome de James Watson.
A partir d'un fichier contenant des variations par rapport au génome de référence, je me suis amusé à compter le nombre et le type de substitutions nucléotidiques. Et le …

Le filtre de bloom

Un filtre de bloom est un algorithme permettant de savoir si un élément est présent ou non dans une liste. C'est un algorithme très efficace d'un point de vue mémoire lorsque vous travaillez avec de grande liste. En python, l'utilisation d'un filtre de Bloom peut s'écrire :

L = ["mario","zelda","daisy …