Nghiên cứu cải tiến một số phương pháp tra cứu ảnh sử dụng đặc trưng ảnh

Giới thiệu tổng quan về trích rút đặc trưng và tra cứu ảnh dựa vào đặc trưng thị giác, đưa ra một số kết luận và định hướng cho nghiên cứu. Trình bày kỹ thuật tra cứu ảnh dựa vào lược đồ màu khối HG và phương pháp cải tiến của nó là IHG. Nghiên cứu kỹ thuật tra cứu ảnh CSI dựa vào đặc trưng màu và thông tin không gian, đồng thời đề xuất kỹ thuật trích rút màu CCS và các cụm màu thuần nhất để phục vụ quá trình tra cứu. Tiến hành thiết kế hệ thống tra cứu ảnh dựa vào đặc trưng thị giác có tên là LVFIR và thực hiện hệ thống thực nghiệm (đã trình bày ở chương 2 và 3). Đánh giá các kết quả thu được và đưa ra một số hướng nghiên cứu tiếp cho tương lai như: kết hợp đặc trưng kết cấu và đặc trưng hình vào quá trình tra cứu; xây dựng cơ chế đánh chỉ số CSDL ảnh để tăng tốc độ quá trình tra cứu ảnh; thực nghiệm trên CSDL ảnh có kích thước lớn hơn và đa dạng hơn

Tính cấp thiết của luận án

Những năm gần đây, chúng ta đã chứng kiến sự tăng nhanh kích cỡ của các tập hợp ảnh số cùng với sự phát triển bùng nổ của các ứng dụng Internet. Hàng ngày, việc sử dụng các thiết bị thu nhận ảnh sinh ra nhiều giga-bytes dữ liệu ảnh. Một lượng lớn thông tin ảnh, khoảng hàng trăm triệu ảnh, đã được đưa lên Internet. Tuy nhiên, không thể truy cập hoặc sử dụng thông tin trong các tập ảnh khổng lồ này, nếu chúng không được tổ chức để tra cứu hiệu quả trên toàn bộ dữ liệu ảnh. Quản trị cơ sở dữ liệu (CSDL) và thị giác máy là hai cộng đồng có đóng góp chính cho lĩnh vực tra cứu ảnh. Hai cộng đồng này tiếp cận tra cứu ảnh từ hai góc độ khác nhau, dựa vào văn bản mô tả ảnh và dựa vào đặc trưng thị giác của bản thân ảnh.

Sử dụng các kỹ thuật dựa vào văn bản mô tả ảnh hoặc từ khoá mô tả ảnh để quản lý CSDL ảnh là cách đơn giản thường được sử dụng. Các từ khoá mô tả ảnh cung cấp thông tin nội dung mô tả ảnh trong một CSDL ảnh đã cho, nhưng để mô tả các ảnh đủ chi tiết, cần một tập từ khoá rất lớn và phức tạp. Một hạn chế nữa của cách tiếp cận này là cần nhân lực được đào tạo kỹ lưỡng để xây dựng các từ khoá đối với mỗi ảnh và chọn các từ khoá phù hợp cho tra cứu các ảnh hiệu quả. Công việc mô tả nội dung ảnh thủ công này tốn nhiều thời gian, chi phí cao và phụ thuộc vào cảm nhận chủ quan của chuyên viên kỹ thuật theo nghĩa cùng một nội dung ảnh, những người khác nhau có thể đưa ra cảm nhận về ảnh khác nhau. Cảm nhận chủ quan và mô tả nội dung ảnh không chính xác là nguyên nhân làm cho so sánh sai trong lúc tra cứu. Hơn nữa, hệ thống dựa vào từ khoá rất khó thay đổi về sau. Do đó, cần có cách tiếp cận mới để khắc phục các hạn chế này.

Để khắc phục các khó khăn ở trên, tra cứu ảnh dựa vào đặc trưng thị giác của ảnh đã được đề xuất. Ý tưởng cơ bản của cách tiếp cận này là sử dụng kỹ thuật trích rút đặc trưng thị giác một cách tự động để cho ra các mô tả nội dung ảnh một cách trực tiếp từ chính bản thân ảnh.

Hệ thống tra cứu ảnh dựa vào đặc trưng thị giác sẽ xác định các ảnh trong CSDL ảnh có đặc trưng thị giác tương tự với ảnh truy vấn theo hai pha: Pha 1, tất cả các ảnh trong CSDL được xử lý, được trích chọn đặc trưng thị giác. Quá trình xử lý và trích chọn đặc trưng thị giác được thực hiện một cách tự động ngay khi các ảnh được nhập vào CSDL. Quá trình này gán cho mỗi ảnh một tập các ký hiệu mô tả, các ký hiệu mô tả ảnh này sẽ được lưu trữ trong CSDL và được sử dụng trong pha tiếp theo. Pha 2, trích rút các đặc trưng thị giác của ảnh truy vấn và so sánh các đặc trưng này với các đặc trưng thị giác của ảnh trong CSDL theo một độ đo tương tự nào đó. Các ảnh trong CSDL được phân hạng theo mức độ tương tự của nó với ảnh truy vấn. Ảnh có hạng cao nhất được truy xuất. Trích rút nội dung thị giác của các ảnh hiệu quả và đo độ tương tự giữa các ảnh dựa trên đặc trưng thị giác là hai phần quan trọng trong tra cứu ảnh dựa vào đặc trưng thị giác.

Các nghiên cứu gần đây trong tra cứu ảnh tập trung vào trích chọn đặc trưng thị giác gồm màu, kết cấu, hình dạng và thông tin không gian. Màu là đặc trưng được sử dụng rộng rãi nhất cho tra cứu ảnh do tính toán nhanh, tương đối ổn định với các biến dạng nhỏ, thay đổi về kích thước và hướng. Một số phương pháp đã được đề xuất như: Phương pháp lược đồ màu toàn cục và lược đồ màu cục bộ, phương pháp véc tơ gắn kết màu, phương pháp tương quan màu, phương pháp lược đồ màu khối,… Tuy nhiên, hầu hết các phương pháp này đều gặp phải vấn đề sử dụng nhiều không gian để lưu trữ các lược đồ màu biểu diễn ảnh, độ chính xác tra cứu không cao, độ phức tạp tính toán lớn, nhạy cảm với quay và dịch chuyển, không cho phép nhận biết các đối tượng tương tự có màu khác nhau.

Do đó, việc đề xuất các giải pháp tra cứu ảnh dựa vào đặc trưng thị giác để khắc phục được các hạn chế ở trên là một nhu cầu cấp thiết. Đó cũng là lý do mà luận án chọn đề tài “Nghiên cứu cải tiến một số phương pháp tra cứu ảnh sử dụng đặc trưng ảnh“.

Mục tiêu của luận án

Mục tiêu của luận án là nghiên cứu đề xuất một số phương pháp tra cứu ảnh sử dụng đặc trưng màu và thông tin không gian. Các phương pháp này sẽ hướng tới giải quyết các vấn đề về giảm không gian lƣu trữ các lƣợc đồ màu biểu diễn ảnh, ít nhạy cảm với quay và dịch chuyển, giảm độ phức tạp tính toán và tăng độ chính xác tra cứu.

Các đóng góp của luận án

Trong luận án này, tác giả nghiên cứu đề xuất các kỹ thuật tra cứu ảnh dựa vào đặc trưng của vùng ảnh gồm: phương pháp HG (Histogram Graph), phương pháp IHG (Improving Histogram Graph), phương pháp CSI (Color and Spatial Information) và phương pháp CCS (Cluster of Colors and Space):
– Phương pháp tra cứu ảnh dựa vào đặc trưng màu, có tên là HG. Đặc điểm của phương pháp này là sử dụng ít không gian lưu trữ các lược đồ màu biểu diễn ảnh và ít nhạy cảm với quay và dịch chuyển.
– Để tăng cường phương pháp HG, chúng tôi đã đề xuất phương pháp IHG, nhằm giảm thời gian và tăng độ chính xác tra cứu của phương pháp HG nhưng vẫn sử dụng ít không gian lưu trữ các lược đồ màu biểu diễn ảnh và ít nhạy cảm với quay và dịch chuyển.
– Phương pháp CSI trích rút đặc trưng màu và thông tin không gian của các vùng ảnh và sử dụng trong quá trình tra cứu để nâng cao hiệu năng tra cứu.
– Phương pháp CCS phân hoạch ảnh thành các cụm màu thuần nhất (các cụm màu này có thể có kích cỡ khác nhau) và trích rút thông tin màu và không gian của mỗi vùng phục vụ quá trình tra cứu.
– Xây dựng hệ thống tra cứu ảnh dựa vào đặc trưng thị giác có tên là LVFIR (Local Visual Feature-based Image Retrieval) trên cơ sở các kỹ thuật đề xuất của tác giả. Hệ thống này gồm hai module chính là module tiền xử lý và module tra cứu.

Bố cục của luận án

Luận án này được bố cục thành bốn chương, gồm 125 trang.
  • Chương 1 giới thiệu tổng quan về trích rút đặc trưng và tra cứu ảnh dựa vào đặc trưng thị giác và đưa ra một số kết luận và định hướng cho nghiên cứu.
  • Chương 2 trình bày kỹ thuật tra cứu ảnh dựa vào lược đồ màu khối, có tên là HG và cải tiến của nó, có tên là IHG.
  • Chương 3 trình bày kỹ thuật trích rút đặc trưng của vùng ảnh sử dụng trong quá trình tra cứu ảnh, có tên là CSI và CCS.
  • Chương 4 trình bày thiết kế và thực hiện hệ thống thực nghiệm tra cứu ảnh dựa vào đặc trưng thị giác (sử dụng các kỹ thuật được đề xuất trong Chương 2 và Chương 3) LVFIR, cùng với một số kết quả.
  • Cuối cùng, chúng tôi đưa ra một số kết luận và đề xuất các nghiên cứu trong tương lai.

Link tải tài liệu: https://tii.la/oVVsB

Lưu ý: Link tải có chứa quảng cáo được rút gọn bằng Shrinkearn.com

Mật khẩu mở tệp PDF: sharetailieu.net

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mới Nhất

Cùng Chuyên Mục

Đọc Nhiều Nhất