第七次作业 7.逻辑回归实践

zoukankan html css js c++ java

第七次作业 7.逻辑回归实践
1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）

2.用logiftic回归来进行实践操作，数据不限。

1、逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？

(1)逻辑回归是怎么防止过拟合的？

1. 增加样本量，适用任何模型。

2. 如果数据稀疏，使用L1正则，其他情况，用L2要好，可自己尝试。

3. 通过特征选择，剔除一些不重要的特征，从而降低模型复杂度。

4. 检查业务逻辑，判断特征有效性，是否在用结果预测结果等。

5.逻辑回归特有的防止过拟合方法:进行离散化处理，所有特征都离散化。

(2)为什么正则化可以防止过拟合

正则化
代码：

from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import classification_report import pandas as pd # 读取titanic_data数据 data = pd.read_csv('./titanic_data.csv') # 数据预处理 data.drop('Age', axis=1, inplace=True)#删除Age这一列 data.drop('PassengerId', axis=1, inplace=True) # 删除PassengerId这一列 data.loc[data['Sex'] == 'male', 'Sex'] = 1 data.loc[data['Sex'] == 'female', 'Sex'] = 0 # 数据分割 x_data = data.iloc[:, 1:] y_data = data.iloc[:, 0] x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size=0.3) # 进行标准化处理 std = StandardScaler() x_train = std.fit_transform(x_train) x_test = std.transform(x_test) # 构建和训练模型 LR_model = LogisticRegression() LR_model .fit(x_train, y_train)#训练 LR_model_predict = LR_model.predict(x_test) print('准确率： ', LR_model.score(x_test, y_test)) print('召回率： ', classification_report(y_test, LR_model_predict, labels=[0, 1], target_names=['死亡', '存活']))

运行截图：
查看全文

相关阅读:
docker命令大全
 centos mysql 实战第二十六节课 mysql in docker
赋予楼宇“智慧大脑”：厦门双子塔3D可视化
 智慧矿山-选矿工艺数字 3D 可视化
 数字孪生赋能工业发展：可视化“智”造航天新里程
 浅谈可视化设计-数据时代的美味“烹饪师”（下篇）
工业互联网背景下的高炉炉体三维热力图监控系统
 浅谈可视化设计-数据时代的美味“烹饪师”（上篇）
加速城市轨道交通发展，数字化运营新基建搭建地铁管理系统
 加油站三维可视化监控系统，安全管理智慧运营

原文地址：https://www.cnblogs.com/cndl/p/12785650.html