Bonjour
J'essaie d'écrire un script qui compare les positions d'une sequence spécifique face aux positions des genes du genome humain pour savoir entre autre si mes sequences d'intérêt se situent a l'interieur ou a l'exterieur des genes. La position de depart et de fin de chaque sequence et gene se trouve dans une liste.
Mon idee était donc d'utiliser le position de depart de ma sequence d'intérêt et de la comparer a la position de depart et de fin de chaque gene via un test logique (avec bien sur d'autre tests pour savoir si la sequence est entièrement a l'interieur du gene ou a cheval) sur le principe suivant:
if Start_Genes[i] < Start_Seq[j] < End_Genes[i]:
Seq_in_genes += 1
Mon problème est que j'obtiens certes quelques matchs (une vingtaine) mais largement inferieur au nombre attendu (au moins plusieurs centaines). Je n'arrive pas a comprendre ce qui cloche
Merci d'avance
(Je n'ai pas insérer le code parce qu'il est sur un autre ordinateur mais je peux le rajouter si besoin).