NGHIÊN CỨU PHƯƠNG PHÁP DỰA TRÊN MẠNG SINH HỌC ĐỂ DỰ ĐOÁN CÁC GENE GÂY BỆNH

Ngày nhận bài: 21-12-2016

Ngày duyệt đăng: 23-02-2017

DOI:

Lượt xem

0

Download

0

Chuyên mục:

KỸ THUẬT VÀ CÔNG NGHỆ

Cách trích dẫn:

Lưu, V., Huyền, T., Hoàng, N., Huyền, N., & Hậu, L. (2024). NGHIÊN CỨU PHƯƠNG PHÁP DỰA TRÊN MẠNG SINH HỌC ĐỂ DỰ ĐOÁN CÁC GENE GÂY BỆNH. Tạp Chí Khoa học Nông nghiệp Việt Nam, 15(1), 73–84. http://testtapchi.vnua.edu.vn/index.php/vjasvn/article/view/338

NGHIÊN CỨU PHƯƠNG PHÁP DỰA TRÊN MẠNG SINH HỌC ĐỂ DỰ ĐOÁN CÁC GENE GÂY BỆNH

Vũ Thị Lưu (*) 1 , Trần Thị Thu Huyền 1 , Nguyễn Văn Hoàng 1 , Nguyễn Thị Huyền 1 , Lê Đức Hậu 2

  • 1 Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam
  • 2 Khoa Công nghệ thông tin, Đại học Thủy lợi
  • Từ khóa

    Gene bệnh, mạng tín hiệu sinh học, Boolean động, phương pháp dựa trên mạng, thuật toán ngẫu nhiên

    Tóm tắt


    Dự đoán gene gây bệnh là một trong những mục tiêu quan trọng trong nghiên cứu y sinh. Hiện nay có khá nhiều phương pháp được xây dựng để dự đoán các gene liên quan đến một số bệnh cụ thể. Tuy nhiên, do mối quan hệ phức tạp giữa các gene và bệnh nên rất nhiều các gene là nguyên nhân gây ra một số bệnh di truyền hiện vẫn chưa được phát hiện ra. Bài toán phân hạng gene để tìm ra các gene bệnh là một trong bài toán được nhiều nhà khoa học quan tâm nghiên cứu. Để tìm ra một phương pháp tốt với mục tiêu là dự đoán được các gene gây bệnh với hiệu suất cao, chúng tôi đã tiến hành khảo sát một số phương pháp phân hạng gene đã có dựa trên mạng sinh học, sau đó đề xuất một phương pháp dự đoán sử dụng mô hình mạng Boolean Network. Trong mạng sinh học các khuyết tật do đột biến về gene/protein có thể gây ra một bệnh nào đó ở người. Cũng chính vì thế, những đột biến của gene/protein này có thể ảnh hưởng đến gene/protein khác thông qua cấu trúc của các mạng sinh học. Phương pháp mới sử dụng mô hình Boolean này đánh giá sự phù hợp của những gene ứng viên đối với một bệnh nào đó quan tâm bằng cách đo mức độ ảnh hưởng đột biến từ gene gây bệnh đã biết tới các gene ứng viên. Dựa trên giá trị này để sắp xếp các gene ứng viên sao cho các gene có khả năng liên quan tớibệnh được nhận thứ hạng cao hơn. Sau khi phân hạng, một nhóm nhỏ các gene với thứ hạng cao sẽ được lựa chọn để kiểm nghiệm bằng thực nghiệm để xác định có liên quan đến bệnh. Các kết quả giả lập trên một bộ dữ lieu gene - bệnh đã cho thấy rằng phương pháp đề xuất của chúng tôi tốt hơn phương pháp dựa trên giải thuật ngẫu nhiên - Random Walk Restart. Sử dụng phương pháp đề xuất, kết quả thử nghiệm đã xác định được 27 gene có liên quan đến bệnh ung thưvú.

    Tài liệu tham khảo

    Adie E., R. A. (2005). Speeding disease gene discovery by sequence based candidate. BMC Bioinformatics, 6: 55.

    Aerts S., D. L. (2006). Gene prioritization through genomic data fusion. Nature Biotechnology, 24: 537-544.

    Albert, R. (2004). Boolean Modeling of Genetic Regulatory Networks. Lecture Notes in Physics.,650: 459-481.

    Albert, R. (2004). Boolean Modeling of Genetic Regulatory Networks. Lect. Notes Phys., 650: 459-481.

    Amberger J., C. A. (2009). McKusick's Online Mendelian Inheritance in Man (OMIM®). Nucleic Acids Research, 37: D793-D796.

    Calvo S., M. J. (2006). Systematic identification of human. Nat Genet, 38: 576-582.

    Cui Q., E. P. (2009). Protein evolution on a human. BMC Systems Biology, 3: 21.

    Đặng Vũ Tùng, D. A. (2015). Phân hạng gen gây bệnh sử dụng học tăng kết hợp với xác suất tiền nghiệm. Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT, Tập V-1, Số13 (33).

    Duc-Hau Le, Y.-K. K. (2012). A Cytoscape plug-in for random walk-based gene prioritization and biomedical evidence collection. Computational Biology and Chemistry, pp. 17-23.

    Faure A., A. N. (2006). Dynamical analysis of a generic Boolean model for the control of the mammalian cell cycle. Bioinformatics, 22: e124-131.

    Hanley JA, M. B. (1982). The meaning and use of the area under the Receiver Operating Characteristic (ROC) curve. Radiology, 143: 29-36.

    Kann, M. G. (2010). Advances in translational bioinformatics: computational approaches for the hunting of disease genes. Briefings in Bioinformatics, 11: 96-110.

    Kauffman S., C. P. (2003). Random Boolean network models and the yeast transcriptional. Proceedings of the National Academy of Sciences, 100: 14796-14799.

    Keerthikumar S., S. B. (2009). Prediction of candidate primary immunodeficiency disease genes using a support vector machine learning approach. DNA Research, 16: 345-351.

    Kwon, D.-H. L.-K. (2011). The effects of feedback loops on disease comorbidity in human signaling networks. Bioinformatics, 27: 1113-1120.

    Kwon, D.-H. L.-K. (2013). A coherent feedforward loop design principle to sustain robustness of biological networks. Bioinformatics, 29: 630-637.

    Kwon, D.-H. Le and Y.-K. (2011). NetDS: a Cytoscape plugin to analyze the robustness of dynamics and feedforward/feedback loop structures of biological networks. Bioinformatics, 27: 2767-2768.

    Li, J. X. (2006). Discovering disease-genes by topological features in human protein-protein interaction network. Bioinformatics, 22: 2800-2805.

    LOVASZ, L. (1996). Random walks on graphs: A survey. Combinatorics, Paul Erdos is Eighty, 2: 353-398.

    Sun J., J. C. (2009). Functional link artificial neural. In Neural Networks.

    Trần Thị Bích Phương, N. V. (2013). Một phương pháp phân tích mạng tương tác protein để dự đoán gen gây bệnh ung thư. journalof science of hnue, 58: 38-46.

    Trinh H.-C., D.-H. L.-K. (2014). PANET: A GPU-Based Tool for Fast Parallel Analysis of Robustness Dynamics and Feed-Forward/Feedback Loop Structures in Large-Scale Biologica lNetworks. PLoS ONE, 9: e103010.

    Vali derhami, E. K. (2013). Applying reinforcement learning for web pages ranking algorithms. Applied Soft Computing, 13: 1686-1692.

    Vanunu O, M. O. (2010). Associating genes and protein complexes with disease via network propagation. PLoSComput Biol, 6: e1000641.

    Wang X., N. G. (2011). Network-based methods for human disease gene prediction. Briefings in Functional, 10: 280-293.