
Hệ thống quản trị đào tạo trực tuyến
Sau khi học xong bài này, người học có thể:
Hiểu được khái niệm Series và DataFrame trong thư viện Pandas.
Phân biệt được Series và DataFrame.
Hiểu cấu trúc Index, Columns và Values của DataFrame.
Nắm được các phương pháp đọc dữ liệu từ các nguồn phổ biến như CSV, Excel, JSON.
Hiểu cách xem tổng quan dữ liệu trước khi phân tích.
Người học có khả năng:
Sử dụng thư viện Pandas để đọc dữ liệu.
Xem và phân tích cấu trúc dữ liệu ban đầu.
Truy xuất dữ liệu bằng:
loc (theo nhãn)
iloc (theo vị trí)
Lấy một phần dữ liệu phục vụ cho phân tích.
Làm việc cẩn thận với dữ liệu.
Kiểm tra dữ liệu trước khi phân tích.
Có tư duy phân tích dữ liệu có hệ thống.