Este módulo tem duas funções:
md5
: retorna uma hash da string passada como argumentoget_tags_and_proteins
: dado um dicionário com locus_tag como chaves e dicionários como valores (em que uma das chaves desses dicionários é translation), retorna uma lista de pares (locus_tag, translation)def get_tags_and_proteins(dictionary):
"""
Esta função retorna uma lista de pares
em que a primeira componente é a tag
e a segunda a sequência de aminoácidos.
"""
tags_and_proteins = []
for tag in dictionary:
if dictionary[tag]["type"] == "mRNA":
# se for do tipo "mRNA" estamos na presença de uma proteína
protein = dictionary[tag]["translation"]
both = (tag, protein)
tags_and_proteins.append(both)
return sorted(tags_and_proteins, key=lambda tp : tp[0])