本文以线性回归为例,介绍使用sklearn进行机器学习的一般过程。
import numpy as npdef get_data(theta_true,N): X=np.random.normal(size=(N,len(theta_true))) Y=X@theta_true+np.random.normal(size=(N)) return (X,Y)theta_true=np.array([2,3,4])X,Y=get_data(theta_true,100)实例化一个估计器,进行一些可选参数配置。sklearn里的回归和线性回归是位于
sklearn.linear_model包中的``LinearRegression`类,在实例化对象时有两个参数:
from sklearn.linear_model import LinearRegressionlm_model = LinearRegression()fit方法,传入数据和标签,进行学习lm_model.fit(X,Y)lm_model.intercept_#查看截距lm_model.coef_#查看系数lm_model.predict(X_test)lm.model.score(X_test,Y_test)#用R方进行评估