PHÂN LOẠI GENE MÃ HÓA PROTEIN VẬN CHUYỂN SỬ DỤNG CÁC GENE HÀNG XÓM

Ngày nhận bài: 06-10-2014

Ngày duyệt đăng: 20-12-2014

DOI:

Lượt xem

0

Download

0

Chuyên mục:

KỸ THUẬT VÀ CÔNG NGHỆ

Cách trích dẫn:

Hà, T., Dũng, P., Thảo, N., & Hà, Đoàn. (2024). PHÂN LOẠI GENE MÃ HÓA PROTEIN VẬN CHUYỂN SỬ DỤNG CÁC GENE HÀNG XÓM. Tạp Chí Khoa học Nông nghiệp Việt Nam, 13(2), 291–300. http://testtapchi.vnua.edu.vn/index.php/vjasvn/article/view/163

PHÂN LOẠI GENE MÃ HÓA PROTEIN VẬN CHUYỂN SỬ DỤNG CÁC GENE HÀNG XÓM

Trần Vũ Hà (*) 1 , Phạm Quang Dũng 1 , Nguyễn Thị Thảo 1 , Đoàn Thị Thu Hà 1

  • 1 Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam
  • Từ khóa

    Protein vận chuyển, gene hàng xóm, Gene Ontology

    Tóm tắt


    Cũng giống như sự đa dạng sinh học, trong tự nhiên có quá nhiều loại protein để chúng ta có thể miêu tả chức năng của chúng (anotate) bằng các thí nghiệm khoa học. Do đó các phương pháp để dự đoán chức năng của các protein trở nên cần thiết. Trong bài báo này chúng tôi đề xuất một phương pháp sử dụng dữ liệu sinh học để phân lớp các protein vận chuyển trên màng tế bào dựa vào cơ chất mà chúng vận chuyển. Dựa trên ý tưởng của các Operon, chúng tôi sử dụng dữ liệu biểu hiện gene và các GO terms của các gene hàng xóm để tạo dữ liệu đầu vào cho máy vector hỗ trợ. Để nhanh chóng thu được kết quả, chúng tôi tích hợp LIBSVM (A Library for Support Vector Machines) vào công cụ xử lý dữ liệu và sử dụng công cụ này để huấn luyện cũng như kiểm tra các bộ phân loại. Với công cụ này, người dùng có thể phân loại các protein vận chuyển và cả các loại protein khác; cho phép người dùng thêm dữ liệu của các sinh vật mới ngoài các sinh vật được sử dụng để thử nghiệm.

    Tài liệu tham khảo

    Apweiler, R.; T. K. Attwood; A. Bairoch; A. Bateman; E. Birney; M. Biswas; P. Bucher; L. Cerutti; F. Corpet; M. D. Croning, et al. (2000). "Interpro--an Integrated Documentation Resource for Protein Families, Domains and Functional Sites." Bioinformatics, 16(12): 1145-50.

    Ashburner, M.; C. A. Ball; J. A. Blake; D. Botstein; H. Butler; J. M. Cherry; A. P. Davis; K. Dolinski; S. S. Dwight; J. T. Eppig, et al. (2000). "Gene Ontology: Tool for the Unification of Biology. The Gene Ontology Consortium." Nat Genet, 25(1): 25-9.

    Attwood, T. K.; D. R. Flower; A. P. Lewis; J. E. Mabey; S. R. Morgan; P. Scordis; J. N. Selley and W. Wright. (1999). "Prints Prepares for the New Millennium." Nucleic Acids Res, 27(1): 220-5.

    Barghash, A. and V. Helms (2013). "Transferring Functional Annotations of Membrane Transporters on the Basis of Sequence Similarity and Sequence Motifs." BMC Bioinformatics, 14: 343.

    Black, D. L. (2003). "Mechanisms of Alternative Pre-Messenger Rna Splicing." Annu Rev Biochem., 72: 291-336.

    Brem, R. B.; G. Yvert; R. Clinton and L. Kruglyak (2002). "Genetic Dissection of Transcriptional Regulation in Budding Yeast." Science, 296(5568). 752-5.

    Chang, C. C. and C. J. Lin (2011). "Libsvm: A Library for Support Vector Machines." Acm Transactions on Intelligent Systems and Technology, 2(3)1-27.

    Domka, J.; J. Lee; T. Bansal and T. K. Wood (2007). "Temporal Gene-Expression in Escherichia Coli K-12 Biofilms." Environ Microbiol., 9(2): 332-46.

    Eisenberg, D.; E. M. Marcotte; I. Xenarios and T. O. Yeates (2000). "Protein Function in the Post-Genomic Era." Nature, 405(6788): 823-6.

    Henikoff, J. G. and S. Henikoff (1996). "Blocks Database and Its Applications." Methods Enzymol, 266: 88-105.

    Hofmann, K.; P. Bucher; L. Falquet and A. Bairoch (1999). "The Prosite Database, Its Status in 1999." Nucleic Acids Res, 27(1): 215-9.

    Jacob, F.; D. Perrin; C. Sanchez and J. Monod (1960). "[Operon: A Group of Genes with the Expression Coordinated by an Operator]." C R Hebd Seances Acad Sci., 250: 1727-9.

    Punta, M. and Y. Ofran. 2008. "The Rough Guide to in Silico Function Prediction, or How to Use Sequence and Structure Information to Predict Protein Function." PLoS Comput Biol., 4(10), e1000160.

    Puntervoll, P.; R. Linding; C. Gemund; S. Chabanis-Davidson; M. Mattingsdal; S. Cameron; D. M. Martin; G. Ausiello; B. Brannetti; A. Costantini, et al. (2003). "Elm Server: A New Resource for Investigating Short Functional Sites in Modular Eukaryotic Proteins. "Nucleic Acids Res., 31(13): 3625-30.

    Sharan, R.; I. Ulitsky and R. Shamir (2007). "Network-Based Prediction of Protein Function." Mol Syst Biol., 3: 88.

    Sleator, R. D. and P. Walsh (2010). "An Overview of in Silico Protein Function Prediction." Arch Microbiol., 192(3): 151-5.

    Whisstock, J. C. and A. M. Lesk (2003). "Prediction of Protein Function from Protein Sequence and Structure." Q Rev Biophys., 36(3): 307-40.