ha_anh_p3o

New Member
share miễn phí cho các bạn tài liệu: TÌM HIỂU LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU
MỤC LỤC
Nội dung Trang
PHẦN MỞ ĐẦU 2
NỘI DUNG 3
I. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 3
1. Khái niệm: 3
2. Quá trình khám phá tri thức trong CSDL 3
3. Các kỹ thuật khai phá dữ liệu 4
3.1. Các kỹ thuật tiếp cận trong Data mining 4
3.2. Dạng dữ liệu có thể khai phá 5
3.3. Ứng dụng của khai phá dữ liệu 5
3.4. Khai phá luật kết hợp và ứng dụng 5
II. LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 6
1. Khai phá luật kết hợp 6
2. Lý thuyết về luật kết hợp 7
2.1. Khái niệm 7
2.2. Một số tính chất liên quan đến các hạng mục phổ biến: 8
2.2.1. Tập mục phổ biến: 8
2.2.2. Luật kết hợp: 9
2.3. Một số hướng tiếp cận trong khai phá luật kết hợp 9
2.4. Phát hiện luật kết hợp trên hệ thông tin nhị phân 11
2.4.1. Các định nghĩa về hệ thông tin nhị phân 11
2.4.2. Thuật toán phát hiện tập chỉ mục và luật kết hợp nhị phân 13
III. MỘT SỐ THUẬT TOÁN PHÁT HIỆN LUẬT KẾT HỢP 15
1. Thuật toán Apriori 15
1.1. Ý tưởng thuật toán Apriori 15
1.2. Thuật toán Apriori 15
1.3. Sinh các luật kết hợp từ tập mục phổ biến: 18
2. Thuật toán FP-growth 20
2.1. Ý tưởng thuật toán 20
2.2. Thuật toán FP-growth. 21
2.3. Đánh giá thuật toán FP-growth. 23
IV. THỬ NGHIỆM KHAI PHÁ LUẬT KẾT HỢP 23
1. Phát biểu bài toán 23
2. Phân tích chương trình 25
KẾT LUẬN 27
TÀI LIỆU THAM KHẢO: 28


PHẦN MỞ ĐẦU
Trong những năm gần đây, việc nắm bắt được thông tin được coi là cơ sở của mọi hoạt động sản xuất, kinh doanh. Cá nhân hay tổ chức nào thu thập và hiểu được thông tin và hành động dựa trên các thông tin được kết xuất từ các thông tin đã có sẽ đạt được thành công trong mọi hoạt động. Chính vì lý do đó, việc tạo ra thông tin, tổ chức lưu trữ và khai thác ngày càng trở nên quan trọng và gia tăng không ngừng.
Sự tăng trưởng vượt bậc của các cơ sở dữ liệu (CSDL) trong cuộc sống như: thương mại, quản lý và khoa học đã làm nảy sinh và thúc đẩy sự phát triển của kỹ thuật thu thập, lưu trữ, phân tích và khai phá dữ liệu… không chỉ bằng các phép toán đơn giản thông thường như: phép đếm, thống kê… mà đòi hỏi cách xử lý thông minh hơn, hiệu quả hơn. Từ đó các nhà quản lý có được thông tin có ích để tác động lại quá trình sản xuất, kinh doanh của mình… đó là tri thức. Các kỹ thuật cho phép ta khai thác được tri thức hữu dụng từ CSDL (lớn) được gọi là các kỹ thuật khai phá dữ liệu (DM – Data Mining). Khai phá luật kết hợp là một nội dung quan trọng trong khai phá dữ liệu.
Kỹ thuật khám phá tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật này tương đối còn mới mẻ tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng dụng.
Khai phá dữ liệu (Data Mining) được coi là quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các CSDL, kho dữ liệu… Hiện nay, ngoài thuật ngữ khai phá dữ liệu, người ta còn dùng một số thuật ngữ khác có ý nghĩa tương tự như: Khám phá tri thức từ cơ sở dữ liệu (Knowledge Discovery in Database-KDD), trích lọc dữ liệu (knowlegde extraction), phân tích dữ liệu/mẫu (data/pattern analysis), khảo cổ dữ liệu (data archaeology), nạo vét dữ liệu (data dredging).
Tiểu luận trình bày một số vấn đề về khám phá tri thức, khai phá dữ liệu, và trình bày rõ vấn đề khai phá luật kết hợp và ứng dụng một số thuật toán khai phá luật kết hợp trong CSDL.


Download cho các bạn


- Bạn nào có tài liệu gì hay , up lên đây share cùng anh em.
- Ai cần tài liệu gì mà không tìm thấy ở forum, , đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí
 
Các chủ đề có liên quan khác

Các chủ đề có liên quan khác

Top