UCHC Logo Web Site Logo

Squalene-hopene Cyclase/Terpenesynthase

BLASTp Hit to Protein of Known or Suspected Function:
Organism: Geobacter sulfurreducens
GI Number: 39982558
E-value: 4e-46
Protein and Coding Sequences:
TGD ID Number: 194.m00023

Evidence: TIGR Preliminary Gene Prediction 08/2004: predicted gene structure is partially supported by ESTs.

Coding Sequence:
ATGAAGAAGATACTCATAGGCTTAATTATAGGTCTCTTTTTATTCTCAAGCGTTAATGCC
AGCGTTAATCTCACTGAAGTCTAAAATGCCATCTCTATCTAGCAAGGCATTAATTGGGCA
GAAGTACACAACAATACTTGGTACTATCCTCCTTACTTAGGCGAAATGTTTATCAGTGAA
TACTACTTCGAGTTACTCGTCTTGAATTGGACTCATAAATCTGCTTTCAACGCTACATAC
TTTACAGAACGTCTCCTCTAGACTTAATTCGAAGATGGTTCATGGGAGCAAGTCAGAGAA
CAAAATCTTGAAACTGGTTAGTTAGATGCTACTGTCTTTAACTACTGGTACTTAAAGTCT
ATTAACAACAATCCTAAAATTGAAGCTGCTCTATAAAAGGCTAGAAAATGGATAGTTGCT
TAGGGTGGTATTGAAGCAACTCAAACAATGACCAAGTTTAAGTTAGCAGCCTTCGGTTAA
TACAGTTGGGAAGATTTATGGTATGTCCCATTGTTCATCTTCAAGTAGAATGGAATTTTC
AAATATACCTACGTTAAGGATATTGTTGCATAATGGGTCTATCCACATTTAACTGCCTTA
GCTTATTTGCGTTACTAAAGAACTGTTTTCAATGTTCCTGTTGCTGATTTGAGAGAGCTC
TGGATCAATTACCCTAAGAACGGTATTAAAATCAGTCCAAGAGAATACTCTACACTTAAT
CCTGATAGCGATCTCTTGATCTTAATGGACGAAATCTTCAAACTTAAACAACCTCTTGGA
AGTTTCGGTGCCTACACTATTTCAACCCTCTTGACTTTAATGTCCTTCAAAGACTTTTAG
TCAAAGCACCCTCATCTATACCAAAACGAAATACAAAAGGCTTACGAAGACGGATACTAT
TTCGTTGAGTTTAACTACTTTAACTTTAGAGAAGCTTATCACGGCTCTTTGGATGATGGT
AGATGGTGGGATACCATTCTTATTAGTTGGGCTATGCTTGAAAGTGGCTAAGATAAAGAA
AGAATCTTCCCTATCGTATAAAATATGGTCAAAGAAGGTCTTTAACCTAAAAAAGGTATA
GGTTATGGATATGATTTCGAATATGCTCCTGACACTGATGACACTGGATTACTTCTCGTT
GTTATGAGTTACTACAAAGAAGCCTTCTAAAAGTAAATCCCTGAAACTATTGAATGGCTT
TTCTCTATGCAAAATGACGATGGTGGCTATCCAGCTTTTGACAAAGGTAAAAATGAAGAC
AATTTATTGTTCAAGTTTGCCTTCAATATGGCTGGTATTGCTAACTCAGCTGAAATCTTC
GATCCCTCATGTCCTGATATTACTGGTCACATCATGGAAGGATTGGGTGAGTTTGGATAT
CAAGCTAATCATCCTTAGATTTAAAATATGATTAAATATCAAAGAAAGACTTAGAACAAG
TGGGGATCTTGGTAAGCTAGATGGGGTGTAAATTACATTATGGCTGTTGGAGCTGTTGTA
CCAGGTTTAGCAAGAGTCAATTACGACTTAAATGAACAGTGGGTACAAAATAGTATAAAT
TATTTGCTTAATAAATAAAATAAAGATGGTGGCTTTGGTGAATGTGTCCTTTCTTATAAT
GATCCTGAAAAGTGGAATGGTATAGGTAAATCTACTGTCACTCAAACCTCATGGGGACTA
TTAGCTCTTTTAGAAGTTTATAATTAAAATGAACAAATTAAGCATGCTGCAGATAGAGCT
GCTTAGTATTTATTAGATTAATTCAAAAGAGACGATAATACCTTCTATGATCACTCCACA
ATAGGAACAGGTCACAGAGGATTACTCTATTTATAGTACCCCTCATATGCACAATCATTC
CCATTAGTAGCTTTAAATAGATACTAAAAAATATCTCAAGGTTAATATCACTTCTCCAAA
AATTTGTACAATGTTAGTTAGTTACAAAATATGGATAGTTAGCAACAAATCGGAGATTTA
TTAACTCATTACGAAGCTGAGCATTTAATAGAAAAGTTATAAATCGTTAACATAGAAGAA
TATGGTAGTTAAATCTGGTTCAAGCAAGACGAAATTCTTCAAAGACTCAATATGCAAGCA
CATGTCAATGCAATGGTAAAAAGTGATGAGTTCATTATGGATTCTTTAGTGACTTTTGAT
AAAGTGAAGATTTTGATTTACGATTTAATAGAAACAGAAATTTGGAAATAGAAGGTATTG
CCTTTACTAAAAAATCACATGCTTAAAATAAACACATATAGAAGCTATATTGCTGTTTAT
CACGAAGCTGTAGTCTGTAATTTGCTAGAAGTCATTATGTTCCATAGAACCGCTGTCGAC
TCAGCTGATGAATTCCTTATAGAATTAATTGATTACTGCTATAGAAAGCTTGTGCATTTA
ACAAAATTCCCTTAAACAAAGAAAGTAACCAAAAAGACAGTCGAAGACGTCTTAAAAAAG
ACAAGAATTGAAGAGTATTAGGAATAAATAGATGATATTGAATTTAAAATCTGTATGATG
TGTGTTTCTATTATTAGATTTATTTCTGACTATGTAAAGCATTTGCCAGTTAGTGTTGTT
CATCATTTACTTGAAGTCAATGATATCCTTTGCATTTTAGTTCCATTAATTGAAGATAAA
CCTTGGCTACGTTAAACATCAGAAGGTGAAAGAGAAAAATATGAAAATAGCAAATGGTAA
ATAGTTGAAAAATCTGAATACAGCAAAATTGTAAAGCTTGAAGCTAATGTTTGGATTACA
ATTTATAATTTATTTATGGATCCTGAATGTCGCAAAAAATACGAATTAAATGAGTTTAGA
AAATCTAACTTATTAAGATTAAGAAAATACATGAATGAAATTTTGTTAGATTAGATTCCC
AATTTATCTCATATGCTCAGAACACTTGAAGAGCTTTCAATTATGAATGTATAGAGTGTT
CCAAAGTCTAACCCTTTTATAGTGCAGTAAATTCCTGAAATTAGGGAAAATATTATCAAA
GGCAAGAATTGGAATGATATAGCAGAAAAATAAAAAAATGAGTACTTTGTAAATGATAAA
GAGACAGCTAAGTAAGATATGTAGAGATTAGCTGATTTATATGGTTAGAATATTATTGAT
GGATTAATGGAAGGATTTAAATGTGAACTTTGTAAAAAAGAAGCAACTAAAAGATGTTCT
TAATGTAAGACTGTTTGGTACTGCACAAGAGAATGTCAAGTAGCTCATTGGAAGGATCAC
AAGATTGCTTGCAAAAAAATTGTTGAAGAAAATAAAGAAAAAGAATAAAGAAAAAAAGAA
ATGATAAGTGATTTAGGAAAAGAAAATGTACCAGTTGATAATTTATTAAATAATAATACT
GAAAAGCAAATTTTAGTAACTGAAATTGAATAAAAACCTTAATTCAAATAAAATGATGCT
CAATTAGAATAGTTTTAGAGATTAGCACAATTAACTAACGTAAAACCTAATTCTGATGCA
TCTTCTGGTCCTATAAAGTTGAGTTCAAAATTTTAAAGTTTGGGACATTTTTATAAGGCA
GTACATAAAGCTGAAGCACCAATTGATTTAATTTAGTTACCACTTTTAATTATGAAAAAA
TCTCTTAGATCAACATTAATTAACCAAAAATAAGACAGACAGACACTCACATCTATTAAA
TATTTACTTGCTTCTTATGATAATCGTTTAAATTTTAAAAATAAATTATCATACTGTAAT
CCAAGAGCCAAATTTTTAATTTTTTTCAAAGATGAAAGTTAAAATTCAACAGGATATAAA
AAAAAGTTTAAGAAATTAGTTATACGTGAGGTCTAAATCTAAGTTAGAGAGATTGGCACA
GTTAGAAAATGA

Protein Sequence:
MKKILIGLIIGLFLFSSVNASVNLTEVQNAISIQQGINWAEVHNNTWYYPPYLGEMFISE
YYFELLVLNWTHKSAFNATYFTERLLQTQFEDGSWEQVREQNLETGQLDATVFNYWYLKS
INNNPKIEAALQKARKWIVAQGGIEATQTMTKFKLAAFGQYSWEDLWYVPLFIFKQNGIF
KYTYVKDIVAQWVYPHLTALAYLRYQRTVFNVPVADLRELWINYPKNGIKISPREYSTLN
PDSDLLILMDEIFKLKQPLGSFGAYTISTLLTLMSFKDFQSKHPHLYQNEIQKAYEDGYY
FVEFNYFNFREAYHGSLDDGRWWDTILISWAMLESGQDKERIFPIVQNMVKEGLQPKKGI
GYGYDFEYAPDTDDTGLLLVVMSYYKEAFQKQIPETIEWLFSMQNDDGGYPAFDKGKNED
NLLFKFAFNMAGIANSAEIFDPSCPDITGHIMEGLGEFGYQANHPQIQNMIKYQRKTQNK
WGSWQARWGVNYIMAVGAVVPGLARVNYDLNEQWVQNSINYLLNKQNKDGGFGECVLSYN
DPEKWNGIGKSTVTQTSWGLLALLEVYNQNEQIKHAADRAAQYLLDQFKRDDNTFYDHST
IGTGHRGLLYLQYPSYAQSFPLVALNRYQKISQGQYHFSKNLYNVSQLQNMDSQQQIGDL
LTHYEAEHLIEKLQIVNIEEYGSQIWFKQDEILQRLNMQAHVNAMVKSDEFIMDSLVTFD
KVKILIYDLIETEIWKQKVLPLLKNHMLKINTYRSYIAVYHEAVVCNLLEVIMFHRTAVD
SADEFLIELIDYCYRKLVHLTKFPQTKKVTKKTVEDVLKKTRIEEYQEQIDDIEFKICMM
CVSIIRFISDYVKHLPVSVVHHLLEVNDILCILVPLIEDKPWLRQTSEGEREKYENSKWQ
IVEKSEYSKIVKLEANVWITIYNLFMDPECRKKYELNEFRKSNLLRLRKYMNEILLDQIP
NLSHMLRTLEELSIMNVQSVPKSNPFIVQQIPEIRENIIKGKNWNDIAEKQKNEYFVNDK
ETAKQDMQRLADLYGQNIIDGLMEGFKCELCKKEATKRCSQCKTVWYCTRECQVAHWKDH
KIACKKIVEENKEKEQRKKEMISDLGKENVPVDNLLNNNTEKQILVTEIEQKPQFKQNDA
QLEQFQRLAQLTNVKPNSDASSGPIKLSSKFQSLGHFYKAVHKAEAPIDLIQLPLLIMKK
SLRSTLINQKQDRQTLTSIKYLLASYDNRLNFKNKLSYCNPRAKFLIFFKDESQNSTGYK
KKFKKLVIREVQIQVREIGTVRK*

Peptides Identified in Mass Spectrometry Analysis: 5
LLQTQFEDGSWEQVR
TVFNVPVADLR
ELWINYPK
IFPIVQNMVK
AAQYLLDQFK
Number of Independent Analyses from which Peptide Data was Obtained: 2
Relevant Tetrahymena References:
 
Presence in Phagosome Proteomes of Other Organisms: