阅读量:0
在Python中,进行数据预处理的归一化可以使用sklearn库中的MinMaxScaler类。以下是使用MinMaxScaler进行归一化的步骤:
- 导入所需的库和模块:
import numpy as np from sklearn.preprocessing import MinMaxScaler
- 创建一个样本数据集。这里我们创建一个形状为(10, 5)的二维数组,每一行表示一个样本,每一列表示一个特征:
data = np.array([[10, 20, 30, 40, 50], [15, 25, 35, 45, 55], [20, 30, 40, 50, 60], [25, 35, 45, 55, 65], [30, 40, 50, 60, 70], [35, 45, 55, 65, 75], [40, 50, 60, 70, 80], [45, 55, 65, 75, 85], [50, 60, 70, 80, 90], [55, 65, 75, 85, 95]])
- 初始化MinMaxScaler对象,并设置特征范围。这里我们将特征范围设置为[0, 1]:
scaler = MinMaxScaler(feature_range=(0, 1))
- 使用fit_transform()方法对数据进行归一化:
normalized_data = scaler.fit_transform(data)
- 打印归一化后的数据:
print(normalized_data)
执行以上代码后,将得到归一化后的数据集。请注意,归一化后的数据范围将在[0, 1]之间。