研究生实验1:线性回归与随机梯度下降
2020
PostGraduate
You can click here to get the English version.
实验目的
- 进一步理解线性回归,随机梯度下降的原理。
- 在小规模数据集上实践。
- 体会优化和调参的过程。
数据集
线性回归使用的是LIBSVM Data中的Housing数据,包含506个样本,每个样本有13个属性。请自行下载scaled版本,并将其切分为训练集,验证集。
实验环境
python3,至少包含下列python包:sklearn,numpy,jupyter,matplotlib。
建议直接安装anaconda3,其已经内置了以上python包。
实验形式
个人独立完成
实验步骤
线性回归和随机梯度下降
- 读取实验数据,使用sklearn库的load_svmlight_file函数读取数据。
- 将数据集切分为训练集和验证集,本次实验不切分测试集。使用train_test_split函数切分数据集。
- 线性模型参数初始化,可以考虑全零初始化,随机初始化或者正态分布初始化。
- 选择Loss函数及对其求导,过程详见课件ppt。
- 随机选取训练集中的一个样本,求得该样本对函数的梯度。
- 取梯度的负方向,记为。
- 更新模型参数,。为学习率,是人为调整的超参数。
- 在训练集上测试并得到函数值,在验证集上测试并得到函数值。
- 重复步骤5-8若干次,输出和的值。
整理实验结果,形成图表,并完成实验报告(实验报告模板将包含在此处)
实验代码及报告提交方式
提交内容
- 提交实验报告,不要求提交实验代码
- 实验报告需要按照模板编写,并导出成pdf文件(模板未必与本次实验内容完全契合,可适当修改模板章节)
- 请于截止时间前发送所有实验报告到助教邮箱 jiaju.wu@qq.com,邮件命名为“exp_yourName_yourNumber”,例如“exp_张三_202000000000”
提交时间
- 2021年1月7日24:00截止,请于截止时间前发送所有实验报告到助教邮箱 jiaju.wu@qq.com
注意事项
- 实验报告需按时提交,非特殊情况逾期补交无效
- 实验报告使用中英文均可;LaTex、Word均可(如果用Word编写实验报告,需导出成pdf格式)