
Hệ thống quản trị đào tạo trực tuyến
Trực quan hóa dữ liệu giúp:
Hiểu dữ liệu nhanh hơn
Phát hiện xu hướng
So sánh dữ liệu dễ dàng
Trình bày kết quả phân tích
Ví dụ:
Doanh thu theo tháng
Doanh thu theo sản phẩm
Phân bố khách hàng theo khu vực
Matplotlib là thư viện phổ biến để vẽ biểu đồ trong Python.
Cài đặt:
pip install matplotlib
Import thư viện:
import matplotlib.pyplot as plt
Biểu đồ đường thường dùng để thể hiện xu hướng theo thời gian.
Ví dụ:
import matplotlib.pyplot as plt
months = ["Jan","Feb","Mar","Apr"]
revenue = [1000,1500,1800,2000]
plt.plot(months,revenue)
plt.title("Revenue by Month")
plt.xlabel("Month")
plt.ylabel("Revenue")
plt.show()
Dùng để so sánh dữ liệu giữa các nhóm.
Ví dụ:
products = ["A","B","C"]
sales = [300,500,200]
plt.bar(products,sales)
plt.title("Sales by Product")
plt.xlabel("Product")
plt.ylabel("Sales")
plt.show()
Dùng để thể hiện tỷ lệ phần trăm.
Ví dụ:
labels = ["North","South","East","West"]
sales = [40,25,20,15]
plt.pie(sales,labels=labels,autopct="%1.1f%%")
plt.title("Sales by Region")
plt.show()
Histogram dùng để xem phân bố dữ liệu.
Ví dụ:
import numpy as np
data = np.random.normal(50,10,100)
plt.hist(data,bins=10)
plt.title("Distribution of Values")
plt.show()
Seaborn là thư viện trực quan hóa dữ liệu cao cấp hơn Matplotlib.
Cài đặt:
pip install seaborn
Import:
import seaborn as sns
import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill",y="tip",data=tips)
plt.show()
Biểu đồ này giúp phân tích mối quan hệ giữa:
total_bill
tip
| Loại dữ liệu | Biểu đồ phù hợp |
|---|---|
| Xu hướng theo thời gian | Line chart |
| So sánh nhóm | Bar chart |
| Tỷ lệ phần trăm | Pie chart |
| Phân bố dữ liệu | Histogram |
| Quan hệ giữa 2 biến | Scatter plot |
Biểu đồ phải dễ đọc
Không sử dụng quá nhiều màu sắc
Có tiêu đề và nhãn trục rõ ràng
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv("sales.csv")
Ví dụ biểu đồ cột:
df.groupby("Product")["Revenue"].sum().plot(kind="bar")
plt.show()
Quan sát biểu đồ để:
xác định sản phẩm bán chạy
xác định xu hướng doanh thu