Ngày nhận bài: 20-07-2020
Ngày duyệt đăng: 02-09-2020
DOI:
Lượt xem
Download
Cách trích dẫn:
TÌM KIẾM ẢNHTHEO NỘI DUNG DỰA TRÊN MẠNG NƠRON TÍCH CHẬP VÀPHƯƠNG PHÁP SINH MÃ NHỊ PHÂN
Từ khóa
Tìm kiếm ảnh theo nội dung, mạng nơron tích chập, sinh mã nhị phân
Tóm tắt
Tìm kiếm ảnh theo nội dung làhướng nghiên cứu đang được quan tâm trong những năm gần đây vì phương pháp tìm kiếm này có thể khắc phục nhược điểm của phương pháp tìm kiếm dựa trên văn bản mô tả làkhông bị ảnh hưởng bởi sự thiếu hoặc sai của văn bản kèm theo ảnh. Bên cạnh đó, các phương pháp học sâu như mạng nơron tích chập đã chứng minh được khả năng xử lý dữ liệu lớn đặc biệt trong lĩnh vực thị giác máy tính vàxử lý ảnh. Mục tiêu của nghiên cứu này làgiải bài toán tìm kiếm ảnh theo nội dung vàphương pháp để giảm thời gian truy vấn ảnh sử dụng mạng nơtron tích chập. Đồng thời, chúng tôi kết hợp phương pháp này với phương pháp sinh mã nhị phân để cải thiện thời gian truy vấn ảnh. Kết quả thực nghiệm trên hai bộ dữ liệu cifar-10 vàmnist cho thấy việc sử dụng mạng nơron tích chập kết hợp phương pháp sinh mã nhị phân trong tìm kiếm ảnh đạt độ chính xác xấp xỉ 89% và98% vàcải thiện đáng kể thời gian truy vấn ảnh.
Tài liệu tham khảo
Babenko A., Slesarev A., Chigorin A. & Lempitsky V. (2014). Neural codes for image retrieval. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 8689 LNCS(PART 1). pp.584-599.
Cheng Z., Yang Q. & Sheng B. (2015). Deep Colorization. Proceedings of the IEEE International Conference on Computer Vision. pp.415-423.
Ciressan D., Meier U.& Schmidhuber J. (2012). Multi-column Deep Neural Networks for Image Classification. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.
Jia Y., Shelhamer E., Donahue J., Karayev S., Long J., Girshick R., Guadarame S. & Darrell T. (2014). Caffe: Convolutional Architecture for Fast Feature Embedding. UC Berkeley EECS, Berkeley, CA 94702.
Krizhevsky A., Nair V. & Hinton G. (2009). CIFAR-10 and CIFAR-100 dataset.Retrieved from https://www.cs.toronto.edu/~kriz/cifar.htmlon May 12, 2018.
Krizhevsky A., Sutskever I. & E. Hinton G. (2012). ImageNet Classification with Deep Convolutional Neural Networks. In Proc. NIPS.
Lecun Y., Cortes C. &Burges C. (1998). MNIST handwritten digit database. Retrieved from http://yann.lecun.com/exdb/mnist/on May 12, 2018.
Lecun Y., Bottou L., Bengio Y. & Haffner P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE.
Li H., Lin Z., Shen X., Brandt J. & Hua G. (2015). A Convolutional Neural Network Cascade for Face Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. pp. 5325-5334.
Luo P., Tian, Y., Wang X. & Tang X. (2014). Switchable Deep Network for Pedestrian Detection Ping. Computer Vision Fundation.
Lê Minh Phúc & Trần Công Án (2017). Tìm kiếm ảnh theo nội dung vàngữ nghĩa. Tạp chí Khoahọc,Trường Đại học Cần Thơ. Số chuyên đề: Công nghệthông tin. tr.58-64.
Photoindustrie-Verband e.V. (2016). Photo and imaging market: Trend report. p.63.
Văn Thế Thành (2017). Tìm kiếm ảnh dựa trên đồ thị chữ ký nhị phân. Luận án Tiến sĩ khoa học máy tính. Đại học Huế.
Văn Thế Thành & Lê Mạnh Thạnh (2016). Một số cải tiến cho hệ truy vấn ảnh dựa trên cây S-Tree. Kỷ yếu hội nghị khoa học quốc gia lần thứIX - Nghiên cứu cơ bản vàứng dụng công nghệ thông tin (FAIR’9).