Các kỹ thuật phân cụm trong khai phá dữ liệu sử dụng tính toán tiến hóa

Phân cụm dữ liệu là quá trình nhóm một tập các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một cụm là tương đồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng. Phân cụm dữ liệu không đòi hỏi phải định nghĩa trước các mẫu dữ liệu huấn luyện. Vì thế, có thể coi phân cụm dữ liệu là một cách học không giám sát (unsupervised learning). Các Kỹ thuật phân cụm được ứng dụng rất nhiều trong các lĩnh vực tài chính ngân hành để phân lọai các nhóm khách hàng khác nhau. Ngoài ra phân cụm dữ liệu còn có thể được sử dụng như một bước tiền xử lý cho các giải thuật khai phá dữ liệu khác như phân loại và mô tả đặc điểm, có tác dụng phát hiện ra các cụm.

Theo các nghiên cứu cho thấy thì hiện nay chưa có một phương pháp phân cụm tổng quát nào có thể giải quyết trọn vẹn cho tất cả các dạng cấu trúc của các CSDL. Hơn nữa, các phương pháp phân cụm cần có cách thức biểu diễn cấu trúc của các CSDL, với mỗi cách thức biểu diễn khác nhau sẽ có một giải thuật phân cụm thích nghi. Vì vậy phân cụm dữ liệu vẫn đang là một vấn đề khó và mở, vì phải giải quyết nhiều vấn đề cơ bản một cách trọn vẹn và thích nghi với nhiều dạng dữ liệu khác nhau, đặc biệt là đối với dữ liệu hỗn hợp đang ngày càng tăng trong các hệ quản trị dữ liệu và đây cũng là một trong những thách thức lớn trong KPDL. Một điểm khác nữa là các hàm mục tiêu của các giải thuật phân cụm như K-means thường tồn tại nhiều điểm tối ưu cục bộ. Do đó mà đề tài tập trung vào tìm hiểu “Các kỹ thuật phân cụm trong khai phá dữ liệu sử dụng tính toán tiến hóa”; một kỹ – giải thuật tiến hóa được thiết kế để khắc phục tính chất cục bộ của các giải thuật phân cụm.

Luận văn gồm có 3 chương chính:

  • Chương 1: Tổng quan về khám phá tri thức, khai phá dữ liệu và giải thuật di truyền
  • Chương 2: Giải thuật phân cụm dựa trên lai ghép giải thuật tiến hóa và Kmeans
  • Chương 3: Cài đặt và thử nghiệm
    Kết luận định hướng phát triển kết quả nghiên cứu

Link tải tài liệu: https://ckk.ai/vLd0rQ45j

Lưu ý: Link tải có chứa quảng cáo được rút gọn bằng Shrinkearn.com

Mật khẩu mở tệp PDF: sharetailieu.net

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Mới Nhất

Cùng Chuyên Mục

Đọc Nhiều Nhất