[关闭]
@liushiya 2018-11-19T02:14:05.000000Z 字数 2060 阅读 1158

XGBoost 实验手册

机器学习 实验


You can click here to get the English version.

实验目的

数据集

数据集下载链接:
* 训练集: TrainingData.csv.zip
* 测试集: ValidationData.csv.zip

数据集说明

UJIIndoorLoc 数据库涵盖了 Universitat Jaume I 的4层高的三座建筑。该数据集是在2013年通过20多个不同的用户和25个Android设备创建的,包含19937个培训/参考记录和1111个验证/测试记录。

  1. 数据集的529属性中包含WiFi指纹、拍摄的坐标以及其他有用信息。每个WiFi指纹可以由检测到的无线接入点 (WAP) 和相应的接收信号强度强度 (RSSI) 来表征。强度值表示为负整数值,范围-104dBm (极差信号) 至0dbM。正值100用于表示何时未检测到WAP。
  2. 在数据库创建期间,检测到520个不同的WAP。因此,WiFi指纹由520个强度值组成。
  3. 该数据集提供坐标 (纬度,经度,楼层) 和建筑物ID作为要预测的属性,并且记录了捕获的特定空间(办公室,实验室等)和相对位置(空间内/外)。外面意味着捕获是在空间门前拍摄的。
  4. 数据集还记录了关于谁(用户),如何(android设备和版本)以及何时(时间戳)WiFi捕获的信息。

具体属性:

实验环境

实验形式

个人独立完成 (额外实验,不计入总成绩)

实验步骤

安装并调用XGBoost库

  1. pip 安装:
  2. conda 安装:
    • (linux) conda install xgboost

算法实验步骤

  1. 读取实验数据,使用 pandas 或其他库读取,
  2. BuildingIDFloor 合成一个唯一的属性,作为预测的目标,
  3. 对属性 001~520 (WAP001-WAP520) 进行合适的处理,并转换成xgboost可以接受的数据,作为数据输入,
  4. 为 xgboost 接口设置合理的参数,
  5. 调用 xgboost 库的 api 进行训练,
  6. 预测结果,要求实验最终的准确率在90%以上。

评分标准

评分项 占⽐ 说明
出勤 40% 特殊情况可向学院请假
代码有效 20% 代码有效是指代码中是否存在语法错误
实验报告 30% 是否认真按照实验模板填写
代码规范 10% 主要考核代码变量命名是否规范

提交方式

提交流程

  1. 访问222.201.187.50:7001
  2. 点击对应的提交入口
  3. 填写自己的姓名、学号,上传pdf格式的报告和zip格式的代码压缩包

注意事项


参考⽂献

https://xgboost.readthedocs.io/en/latest/parameter.html (参考其中的参数说明)
有任何的意见或者建议都可以直接在qq群中向助教反映。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注