Cathepsin L/Tetrain
BLASTp Hit to Protein of Known or Suspected Function:
Organism: Tetrahymena pyriformis
GI Number: 3273233
E-value: 2e-133
Protein and Coding Sequences:
TGD ID Number: 125.m00080
Evidence: TIGR Preliminary Gene Prediction 08/2004: predicted gene structure is fully supported by ESTs.
Coding Sequence:
ATGAAATTAACTTATTTCCTTGTTGGCTTAGCTTTAATCGGTGCTGCCACTGTTTACTTA
ATTACAAGAAACCCCAACGGTGATGGTCATCTTGATATGTATTCATTCTTAAAATTCAAG
AGATCTTTCAATGTTTAATATCACAATGAATCTGAGGAATCTTACAGACTTTCTGTCTTC
TTAGAAAACTTAAAGATGATTGAAAAGCACAATGCTGATTCAACTAGAACCTATGACCAA
GAAGTCAACTAATTCGCTGATTTAACTATTGAAGAATTCGAATCTAGATATCTTATGAAG
TCTCTTCCTTCCTAATTAAACAAGAACCTCGCCGTCTTAAACTTAAATGAGACTGCTAGT
CAACCTATCGACTGGACTACTAAGAATGTTTTACCCGGTGTTAAAAACTAATAATAATGC
GGTTCCTGCTGGGCTTTCTCTACTGCTGGTTTACTTGAATCTGTTTACAACATCCACAAC
AAACCTAATACTCCTATTTCTTTCTCTGAATAATAGCTTGTTGATTGCTGTGGTGCTGAA
GGTTTCGGATGTGAAGGTTGTGGTGGTGCCTGGCCTACTGATGCTGTTGCCTACACTTAA
AAATTCGGTATTGTCTAAGAGAGTTAATATGCTTACACTGCTAAGGATGGCAAATGCAAC
AAAACTCTTGAAGGTGTTGGTTACAAGCCTTCTTAATAATTCTAAGTTACTGCTAGTGAT
GCTGCCCTTCAAGCCGCTCTCTAGAATTAACCTATCTCTATCTGCGTTGATGCCTCCTAA
TGGTCTTCTTATGCTTCGGGTGTTTTCCCTTAAAGCAAGTGCAGTTCTGATCCCAACGCA
GCTGATCATGCTGTTTTACTTGTTGGTTACAATGCTAATGGTACTTGGAAGGTTAGAAAC
TCTTGGGGTACTTCTTGGGGTGTAGGTGGTTACATCACACTTGCTGCTGGTAATACTTGC
GGTCTTGAAAACTATGCAATTTATGCCACATATTGA
Protein Sequence:
MKLTYFLVGLALIGAATVYLITRNPNGDGHLDMYSFLKFKRSFNVQYHNESEESYRLSVF
LENLKMIEKHNADSTRTYDQEVNQFADLTIEEFESRYLMKSLPSQLNKNLAVLNLNETAS
QPIDWTTKNVLPGVKNQQQCGSCWAFSTAGLLESVYNIHNKPNTPISFSEQQLVDCCGAE
GFGCEGCGGAWPTDAVAYTQKFGIVQESQYAYTAKDGKCNKTLEGVGYKPSQQFQVTASD
AALQAALQNQPISICVDASQWSSYASGVFPQSKCSSDPNAADHAVLLVGYNANGTWKVRN
SWGTSWGVGGYITLAAGNTCGLENYAIYATY*
ATTACAAGAAACCCCAACGGTGATGGTCATCTTGATATGTATTCATTCTTAAAATTCAAG
AGATCTTTCAATGTTTAATATCACAATGAATCTGAGGAATCTTACAGACTTTCTGTCTTC
TTAGAAAACTTAAAGATGATTGAAAAGCACAATGCTGATTCAACTAGAACCTATGACCAA
GAAGTCAACTAATTCGCTGATTTAACTATTGAAGAATTCGAATCTAGATATCTTATGAAG
TCTCTTCCTTCCTAATTAAACAAGAACCTCGCCGTCTTAAACTTAAATGAGACTGCTAGT
CAACCTATCGACTGGACTACTAAGAATGTTTTACCCGGTGTTAAAAACTAATAATAATGC
GGTTCCTGCTGGGCTTTCTCTACTGCTGGTTTACTTGAATCTGTTTACAACATCCACAAC
AAACCTAATACTCCTATTTCTTTCTCTGAATAATAGCTTGTTGATTGCTGTGGTGCTGAA
GGTTTCGGATGTGAAGGTTGTGGTGGTGCCTGGCCTACTGATGCTGTTGCCTACACTTAA
AAATTCGGTATTGTCTAAGAGAGTTAATATGCTTACACTGCTAAGGATGGCAAATGCAAC
AAAACTCTTGAAGGTGTTGGTTACAAGCCTTCTTAATAATTCTAAGTTACTGCTAGTGAT
GCTGCCCTTCAAGCCGCTCTCTAGAATTAACCTATCTCTATCTGCGTTGATGCCTCCTAA
TGGTCTTCTTATGCTTCGGGTGTTTTCCCTTAAAGCAAGTGCAGTTCTGATCCCAACGCA
GCTGATCATGCTGTTTTACTTGTTGGTTACAATGCTAATGGTACTTGGAAGGTTAGAAAC
TCTTGGGGTACTTCTTGGGGTGTAGGTGGTTACATCACACTTGCTGCTGGTAATACTTGC
GGTCTTGAAAACTATGCAATTTATGCCACATATTGA
LENLKMIEKHNADSTRTYDQEVNQFADLTIEEFESRYLMKSLPSQLNKNLAVLNLNETAS
QPIDWTTKNVLPGVKNQQQCGSCWAFSTAGLLESVYNIHNKPNTPISFSEQQLVDCCGAE
GFGCEGCGGAWPTDAVAYTQKFGIVQESQYAYTAKDGKCNKTLEGVGYKPSQQFQVTASD
AALQAALQNQPISICVDASQWSSYASGVFPQSKCSSDPNAADHAVLLVGYNANGTWKVRN
SWGTSWGVGGYITLAAGNTCGLENYAIYATY*
