Một số thuật toán khai phá luật quyết định trên cơ sở dữ liệu di động

Trong những năm gần đây, công nghệ thông tin phát triển mạnh mẽ và đi sâu vào nhiều lĩnh vực trong cuộc sống. Công nghệ thông tin phát triển đi kèm với sự gia tăng không ngừng của cơ sở dữ liệu và nhu cầu sử dụng dữ liệu hiệu quả cũng trở nên ngày càng thiết yếu. Do đó, khai phá dữ liệu đã trở thành lĩnh vực phát triển mạnh với nhiều phương pháp tiếp cận khác nhau. Thời gian đầu, phương pháp tiếp cận quy nạp các luật dựa trên trên tập thô được sử dụng phổ biến với nhiều ứng dụng toàn diện để khai phá dữ liệu như dự báo tài chính, chuẩn đoán y tế…Các ứng dụng này đã chứng tỏ rằng rằng hướng tiếp cận này là rất hữu ích cho việc khai phá kiến thức bằng các luật quyết định từ cơ sở dữ liệu ban đầu. Tuy nhiên, hướng nghiên cứu và các ứng dụng của khai phá tri thức chủ yếu tập trung trong các hệ thống thông tin tĩnh. Nghĩa là các đối tượng và các thuộc tính trong một hệ thống thông tin nhất định không đổi. Trong thực tế, các nguồn dữ liệu thực có đặc điểm động, phát triển lớn mạnh lên về cả thuộc tính và số lượng đối tượng với tốc độ nhanh chóng. Để duy trì hiệu quả kiến thức từ dữ liệu động, các nhà nghiên cứu đã đi theo hướng nghiên cứu tiếp cận gia tăng cho việc cập nhật tri thức. Hiện nay, phương pháp cận gia tăng dựa trên tập thô đã và đang được nhận rất nhiều quan tâm. Theo tài liệu, dữ liệu động chủ yếu tập trung vào hai trường hợp: (1) Tập các đối tượng trong hệ thống thông tin thay đổi theo thời gian trong khi các tập thuộc tính vẫn không đổi. (2) Tập các thuộc tính trong hệ thống thông tin thay đổi theo thời gian trong khi tập đối tượng vẫn không đổi. Do dữ liệu luôn thay đổi, các phân lớp dữ liệu cũng thay đổi theo. Vì vậy, luận văn tập trung tìm hiểu và trình bày “ một số thuật toán khai phá luật quyết định trên sơ sở dữ liệu động” theo hướng tiếp cận gia tăng với kỹ thuật phân lớp dựa trên tập thô. Các luật quyết định có độ chính xác và độ phủ cao là những luật có thể cung cấp các tri thức quan trọng. Để khai phá các luật quyết định có ý nghĩa, ta cần đặt ra ngưỡng của độ chính xác và độ phủ để khai phá được các tri thức quan tâm.

Nội dung của luận văn tập trung vào hướng đã nêu trong trường hợp (1) và (2). Trong đó, luận văn gồm 3 chương.

  • Chương 1: Trình các kiến thức cơ bản về khai phá dữ liệu và các khái niệm cơ bản trong tập thô như khái niệm tập hợp, tập thô, tập mờ, hệ thống thông tin, các mỗi quan hệ, bảng quyết định và luật quyết định.
  • Chương 2: Trình bày về thuật toán khai phá luật quyết định trên bảng dữ liệu khi có giá trị thuộc tính thay đổi (làm thô, làm mịn) theo hướng tiếp cận gia tăng ma trận độ hỗ trợ. Trong chương này, luận văn tập trung trình bày các mối quan hệ của các lớp khi thuộc tính của dữ liệu khi được làm thô, làm mịn, thuật toán và đánh giá độ phức tap tính toán theo thời gian của thuật toán.
  • Chương 3: Trình bày hai thuật toán khai phá luật quyết định trên bảng dữ liệu động khi có tập đối tượng thay đổi. Hai thuật toán này đều được xây dựng trên cùng một mô hình chỉ khác nhau về hướng tiếp cận. Thuật toán một là thuật toán khai phá luật quyết định theo hướng tiếp cận gia tăng ma trận độ chính xác và ma trận độ phủ. Thuật toán hai là thuật toán khai phá luật quyết định theo hướng tiếp cận gia tăng ma trận độ hỗ trợ.
  • Kết thúc là phần kết luận và đề xuất những vấn đề cần tiếp tục nghiên cứu.

Link tải tài liệu: https://tii.la/cNSDDlridC

Lưu ý: Link tải có chứa quảng cáo được rút gọn bằng Shrinkearn.com

Mật khẩu mở tệp PDF: sharetailieu.net

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mới Nhất

Cùng Chuyên Mục

Đọc Nhiều Nhất