Ngày nhận bài: 06-10-2014
Ngày duyệt đăng: 20-12-2014
DOI:
Lượt xem
Download
Cách trích dẫn:
PHÂN LOẠI GENE MÃ HÓA PROTEIN VẬN CHUYỂN SỬ DỤNG CÁC GENE HÀNG XÓM
Từ khóa
Protein vận chuyển, gene hàng xóm, Gene Ontology
Tóm tắt
Cũng giống như sự đa dạng sinh học, trong tự nhiên có quá nhiều loại protein để chúng ta có thể miêu tả chức năng của chúng (anotate) bằng các thí nghiệm khoa học. Do đó các phương pháp để dự đoán chức năng của các protein trở nên cần thiết. Trong bài báo này chúng tôi đề xuất một phương pháp sử dụng dữ liệu sinh học để phân lớp các protein vận chuyển trên màng tế bào dựa vào cơ chất mà chúng vận chuyển. Dựa trên ý tưởng của các Operon, chúng tôi sử dụng dữ liệu biểu hiện gene và các GO terms của các gene hàng xóm để tạo dữ liệu đầu vào cho máy vector hỗ trợ. Để nhanh chóng thu được kết quả, chúng tôi tích hợp LIBSVM (A Library for Support Vector Machines) vào công cụ xử lý dữ liệu và sử dụng công cụ này để huấn luyện cũng như kiểm tra các bộ phân loại. Với công cụ này, người dùng có thể phân loại các protein vận chuyển và cả các loại protein khác; cho phép người dùng thêm dữ liệu của các sinh vật mới ngoài các sinh vật được sử dụng để thử nghiệm.
Tài liệu tham khảo
Apweiler, R.; T. K. Attwood; A. Bairoch; A. Bateman; E. Birney; M. Biswas; P. Bucher; L. Cerutti; F. Corpet; M. D. Croning, et al. (2000). "Interpro--an Integrated Documentation Resource for Protein Families, Domains and Functional Sites." Bioinformatics, 16(12): 1145-50.
Ashburner, M.; C. A. Ball; J. A. Blake; D. Botstein; H. Butler; J. M. Cherry; A. P. Davis; K. Dolinski; S. S. Dwight; J. T. Eppig, et al. (2000). "Gene Ontology: Tool for the Unification of Biology. The Gene Ontology Consortium." Nat Genet, 25(1): 25-9.
Attwood, T. K.; D. R. Flower; A. P. Lewis; J. E. Mabey; S. R. Morgan; P. Scordis; J. N. Selley and W. Wright. (1999). "Prints Prepares for the New Millennium." Nucleic Acids Res, 27(1): 220-5.
Barghash, A. and V. Helms (2013). "Transferring Functional Annotations of Membrane Transporters on the Basis of Sequence Similarity and Sequence Motifs." BMC Bioinformatics, 14: 343.
Black, D. L. (2003). "Mechanisms of Alternative Pre-Messenger Rna Splicing." Annu Rev Biochem., 72: 291-336.
Brem, R. B.; G. Yvert; R. Clinton and L. Kruglyak (2002). "Genetic Dissection of Transcriptional Regulation in Budding Yeast." Science, 296(5568). 752-5.
Chang, C. C. and C. J. Lin (2011). "Libsvm: A Library for Support Vector Machines." Acm Transactions on Intelligent Systems and Technology, 2(3)1-27.
Domka, J.; J. Lee; T. Bansal and T. K. Wood (2007). "Temporal Gene-Expression in Escherichia Coli K-12 Biofilms." Environ Microbiol., 9(2): 332-46.
Eisenberg, D.; E. M. Marcotte; I. Xenarios and T. O. Yeates (2000). "Protein Function in the Post-Genomic Era." Nature, 405(6788): 823-6.
Henikoff, J. G. and S. Henikoff (1996). "Blocks Database and Its Applications." Methods Enzymol, 266: 88-105.
Hofmann, K.; P. Bucher; L. Falquet and A. Bairoch (1999). "The Prosite Database, Its Status in 1999." Nucleic Acids Res, 27(1): 215-9.
Jacob, F.; D. Perrin; C. Sanchez and J. Monod (1960). "[Operon: A Group of Genes with the Expression Coordinated by an Operator]." C R Hebd Seances Acad Sci., 250: 1727-9.
Punta, M. and Y. Ofran. 2008. "The Rough Guide to in Silico Function Prediction, or How to Use Sequence and Structure Information to Predict Protein Function." PLoS Comput Biol., 4(10), e1000160.
Puntervoll, P.; R. Linding; C. Gemund; S. Chabanis-Davidson; M. Mattingsdal; S. Cameron; D. M. Martin; G. Ausiello; B. Brannetti; A. Costantini, et al. (2003). "Elm Server: A New Resource for Investigating Short Functional Sites in Modular Eukaryotic Proteins. "Nucleic Acids Res., 31(13): 3625-30.
Sharan, R.; I. Ulitsky and R. Shamir (2007). "Network-Based Prediction of Protein Function." Mol Syst Biol., 3: 88.
Sleator, R. D. and P. Walsh (2010). "An Overview of in Silico Protein Function Prediction." Arch Microbiol., 192(3): 151-5.
Whisstock, J. C. and A. M. Lesk (2003). "Prediction of Protein Function from Protein Sequence and Structure." Q Rev Biophys., 36(3): 307-40.