Tạp chí Khoa học và công nghệ Đại học Thái Nguyên, T. 225, S. 02

Cỡ chữ:  Nhỏ  Vừa  Lớn

KHAI PHÁ DỮ LIỆU SỬ DỤNG LÝ THUYẾT TẬP THÔ MỜ

Phùng Thị Thu Hiền

Tóm tắt


Ngày nay với sự phát triển mạnh mẽ các ứng dụng công nghệ thông tin và Internet vào nhiều lĩnh vực, đã tạo ra nhiều cơ sở dữ liệu khổng lồ. Số lượng các bản ghi cũng như kích thước từng bản ghi được thu thập rất nhanh và lớn gây khó khăn trong việc lưu trữ và xử lý thông tin. Để khai thác hiệu quả nguồn thông tin từ các cơ sở dữ liệu lớn ngày càng trở thành vấn đề cấp thiết và đóng vai trò chủ đạo trong việc giải quyết các bài toán thực tế. Bên cạnh các phương pháp khai thác thông tin truyền thống, các nhà nghiên cứu đã phát triển các phương pháp rút gọn thuộc tính nhằm giảm kích cỡ của không gian dữ liệu, loại bỏ những thuộc tính không liên quan. Trong bài báo này, chúng tôi giới thiệu một số phương pháp rút gọn thuộc tính theo tiếp cận tập thô mờ, nghĩa là lý thuyết tập thô kết hợp với lý thuyết tập mờ. Đồng thời, tác giả xây dựng công cụ độ đo và bảng ngẫu nhiên tổng quát hóa để tìm tập xấp xỉ trong hệ thông tin đa trị.