CÔNG CỤ X.ENT CHO TRÍCH XUẤT DỮ LIỆU THỰC THỂ, QUAN HỆ GIỮA THỰC THỂ VÀ HỖ TRỢ PHÂN TÍCH DỮ LIỆU TRONG CÁC TẠP CHÍ VỀ PHÒNG CHỐNG DỊCH BỆNH TRONG NÔNG NGHIỆP CỦA PHÁP

Ngày nhận bài: 22-07-2015

Ngày duyệt đăng: 03-09-2015

DOI:

Lượt xem

2

Download

0

Chuyên mục:

KỸ THUẬT VÀ CÔNG NGHỆ

Cách trích dẫn:

Tiến, P., & Thắng, N. (2024). CÔNG CỤ X.ENT CHO TRÍCH XUẤT DỮ LIỆU THỰC THỂ, QUAN HỆ GIỮA THỰC THỂ VÀ HỖ TRỢ PHÂN TÍCH DỮ LIỆU TRONG CÁC TẠP CHÍ VỀ PHÒNG CHỐNG DỊCH BỆNH TRONG NÔNG NGHIỆP CỦA PHÁP. Tạp Chí Khoa học Nông nghiệp Việt Nam, 13(6), 976–988. http://testtapchi.vnua.edu.vn/index.php/vjasvn/article/view/1531

CÔNG CỤ X.ENT CHO TRÍCH XUẤT DỮ LIỆU THỰC THỂ, QUAN HỆ GIỮA THỰC THỂ VÀ HỖ TRỢ PHÂN TÍCH DỮ LIỆU TRONG CÁC TẠP CHÍ VỀ PHÒNG CHỐNG DỊCH BỆNH TRONG NÔNG NGHIỆP CỦA PHÁP

Phan Trọng Tiến (*) 1 , Ngô Công Thắng 1

  • 1 Khoa Công nghệ Thông tin, Học viện Nông nghiệp Việt Nam
  • Tóm tắt


    Trích xuất thực thể là công việc trích xuất thông tin và phân loại thông tin trong văn bản theo những loại xác định trước như tên người, tổ chức, địa điểm, thời gian,… và một bước cao hơn là tìm mỗi quan hệ giữa các thực thể ví dụ như mỗi quan hệ giữa tên người với tên tổ chức. Công cụ x.ent được xây dựng để làm công việc như vậy, công cụ sử dụng các từ điển cho thực thể và các luật để trích xuất. Trong trích xuất quan hệ giữa các thực thể chúng tôi áp dụng hai phương pháp: phân tích cấu trúc của văn bản và sử dụng mô hình học không giám sát đó là phân tích tần suất xuất hiện của các thực thể. Công cụ x.ent có sẵn trên trang chủ R theo đường dẫn: http: //cran.r - project.org/web/packages/x.ent/index.html.

    Tài liệu tham khảo

    Abacha A.B., Zweigenbaum P. etMax A. (2012). Extraction d’information automatique en domaine médical par projection inter - langue: vers unpassage à l’échelle (Automatic Information Extraction in the Medical Domain by Cross - Lingual Projection) [in French]. La conférence JEP - TALN - RECITAL 2012, volume 2: TALN, p. 15 - 28.

    Carpenter B. (2007). LingPipe for 99.99% Recall of Gene Mentions. Proceedings of the 2nd BioCreative workshop, Valencia, Spain.

    Constant M., Tellier I., Duchier D., Dupont Y., Sigogne A. et Billot S. (2011). Intégrer des connaissances linguistiques dans unCRF: application à l’apprentissage d’un segmenteur - étiqueteur du français. TALN. Montpellier, p. 1 - 12.

    Faure C., Delprat S., Mille A. etBoulicaut J. - F. (2006). Utilisation des réseaux bayésiens dans le cadre de l’extraction de règles d’association. Actes 6ème Journées Francophones Extraction etGestion de Connaissances EGC’06, p. 569 - 580.

    Finkel J.R., Grenager T. and Manning C. (2005). Incorporating Non - local Information into Information Extraction Systems by Gibbs Sampling. Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics (Stroudsburg, PA, USA, 2005), p. 363 - 370.

    http1Stackoverflow (2014). http: //stackoverflow.com.

    http2Manuel d’Utilisateur « Writing R Extentions » (2014). http://cran.r-project.org/doc/manuals/R-exts.html.

    http3O beautiful code, « How R Searches and Finds Stuff » (2014). http://obeautifulcode.com/R/How-R-Searches-And-Finds-Stuff/.

    http4Précision et rappel (2007). http://benhur.teluq.ca/SPIP/inf6104/article.php3?id_article = 98&id_rubrique =10&sem = Semaine%208.

    http5Wilkipedia (2014). http://fr.wikipedia.org.

    http6Les Résaux Bayésiens (2014). http://w3.jouy.inra.fr/unites/miaj/public/matrisq/Contacts/abari.07_ 03_12. expo2.pdf

    http7Traitement Automatique du Langage Naturel (2014). http://lipn.univ-paris13.fr/~audibert/pages/enseignement /TAL_ITCN.pdf.

    http8Stanford Named Entity Recognizer (2014).http://nlp.stanford.edu/software/CRF-NER.shtml.

    http9LingPipe (2014)http://alias-i.com/lingpipe/.

    http10Information Extraction And Named Entity Recognition (2014). https://web.stanford.edu/class/cs124/lec/ Information_Extraction_and_Named_Entity_Recognition.pdf.

    http11Les Réseaux Bayésienes. http://www.bayesia.com/fr/technologie/reseaux-bayesiens.php.

    Lafferty J., McCallum A. etPereira F. C. N. (2001). Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. Dep. Pap. CIS.

    Moncla L. (2013). Automatic Annotation of Motion Expressions and Place Named Entities. 2nd Unitex/GramLab.

    Paumier S. etMartineau C. (2006). Manuel d’Utilisateur Unitex 3.1 Beta. Université Paris - EstMarne - la - Vallée. version1.2.

    Sutton C. etMcCallum A. (2010). An Introduction to Conditional Random Fields for Relational Learning. 1011.4088 [stat], p. 5 - 32.

    R Development Core Team, R (2015). A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, ISBN 3 - 900051 - 07 - 0 (2015). URL http: //www.R - project.org/

    Tannier X. (2012). Traitement Automatique des Langue. Université Paris - Sud.

    Turenne N. (2013). Knowledge Needs and Information Extraction. Wiley - ISTE.

    Zettlemoyer L. (2012). Relation Extraction. University of Washington.