
Hệ thống quản trị đào tạo trực tuyến
Sau khi học xong bài này, người học có thể:
Hiểu khái niệm dữ liệu thiếu (Missing Values) trong phân tích dữ liệu.
Hiểu khái niệm dữ liệu trùng lặp (Duplicates).
Nắm được các phương pháp phát hiện và xử lý dữ liệu thiếu trong Pandas.
Nắm được cách phát hiện và loại bỏ dữ liệu trùng lặp.
Người học có khả năng:
Kiểm tra dữ liệu thiếu bằng các hàm của Pandas.
Xử lý dữ liệu thiếu bằng các phương pháp:
Xóa dữ liệu
Thay thế dữ liệu
Phát hiện và loại bỏ dữ liệu trùng lặp trong dataset.
Làm việc cẩn thận và tỉ mỉ khi xử lý dữ liệu.
Kiểm tra dữ liệu trước khi thực hiện phân tích.
Có ý thức đảm bảo chất lượng dữ liệu.