@liushiya 2018-10-25T10:10:44.000000Z 字数 1991 阅读 4433

基于AdaBoost算法的人脸检测

机器学习 实验

You can click here to get the English version.

实验目的

深入理解Adaboost的原理
熟悉人脸检测的基本方法
学会利用Adaboost解决人脸检测问题，将理论和实际工程接轨
体验机器学习的完整过程

数据集

本实验提供1000张图片用于训练(和验证)人脸分类器，其中500张是含有人脸的RGB图片，储存在./datasets/original/face 内；另外500张是不含有人脸的RGB图，储存在./datasets/original/nonface 内。
数据集包含在示例仓库内，请自行下载并将其切分为训练集，验证集。

实验环境

python3，至少包含下列python包：sklearn，numpy，pickle，PIL，opencv-python。
建议直接安装anaconda3，其已经内置了以上除了opencv-python以外的python包。可以使用pip工具安装opencv-python的清华镜像：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python

PyCharm Community 集成开发环境（可选）。

实验时间及地点

2018年10月14日下午2:00-5:00 B7-138(谭明奎老师) B7-238（吴庆耀老师）

提交截止时间

2018-11-18 上午12:00

实验形式

个人独立完成

实验步骤

人脸分类
1. 读取数据集数据。读取图片，将全部图片转成大小为24*24的灰度图，数据集正负类样本的个数和比例不限，数据集标签形式不限。
2. 处理数据集数据，提取NPD特征。使用feature.py中NPDFeature类的方法提取特征。（提示：因为预处理数据集的时间比较长，可以用pickle库中的dump()函数将预处理后的特征数据保存到缓存中，之后可以使用load()函数读取特征数据）。
3. 将数据集切分为训练集和验证集，本次实验不切分测试集。
4. 根据ensemble.py中的预留的接口编写AdaBoostClassifier所有函数。以下为AdaBoostClassifier类中的fit()方法的思路：
4.1 初始化训练集的权值 $\omega$ ,每一个训练样本被赋予相同的权值。
4.2 训练一个基分类器，基分类器可以使用sklearn.tree库中DecisionTreeClassifier(注意训练的时候需要将权重 $\omega$ 作为参数传入)。
4.3 计算基分类器在训练集上的分类误差率 $\epsilon$ 。
4.4 根据分类误差率 $\epsilon$ ，计算参数 $\alpha$ 。
4.5 更新训练集的权值 $\omega$ 。
4.6 重复以上4.2-4.6的步骤进行迭代，迭代次数为基分类器的个数。
5. 用AdaBoostClassifier中的方法在验证集上进行预测并计算精确率,并用sklearn.metrics库的classification_report()函数将预测结果写入classifier_report.txt中。

人脸检测

运行face_detection.py，体验OpenCV自带的基于Haar特征和AdaBoost的人脸检测方法，运行结果保存为detect_result.jpg。
可以使用其它图片替换实验默认的测试图片，体验人脸检测结果。

整理实验结果并完成实验报告（实验报告模板将包含在示例仓库）。

评分标准

评分项	占比	说明
出勤	40%	特殊情况可向学院请假
代码有效	20%	代码有效是指代码中是否存在语法错误
实验报告	30%	是否按照实验模板填写
代码规范	10%	主要考核代码变量命名是否规范

实验提交方式

提交流程

访问222.201.187.50:7001
点击对应的提交入口
填写自己的姓名、学号，上传pdf格式的报告和zip格式的代码压缩包

注意事项

实验报告和代码可以多次上传，多次上传会覆盖之前提交的文件。
上传之后可以刷新页面，在下面的文件列表里面检查是否上传成功。
助教会在实验截止时间保存所有上传的结果，截止时间之后上传的文件无效。
如果用Word编写实验报告，需导出成pdf格式。
代码文件打包格式必须为zip，请不要提交rar格式的压缩文件。
提交网址只能校园网访问。
代码用python语言写，实验报告评分标准英文好于中文，latex好于word。

有任何的意见或者建议都可以直接在qq群中向助教反映。

参考文献

[1] Liao, S., Jain, A. K., & Li, S. Z. (2016). A fast and accurate unconstrained face detector. IEEE transactions on pattern analysis and machine intelligence, 38(2), 211-223.
[2] 周志华. 机器学习. 北京：清华大学出版社，2016：173-177