比赛数据

专为SODA大赛提供的数据集

数据清单

上海新金融大数据众筹平台:电信域

1

数据集名称

基础信息

时间段

6个月

时间粒度

具体数据项

通信号码(加密)、IMSI号(加密)、年龄层次、性别、客户等级、身份证(脱敏)、在网使用的手机卡数量、在网使用中的固话数量、通信黑名单判别

2

数据集名称

通信属性

时间段

6个月

时间粒度

具体数据项

手机异常类型(-1:未知1:注销2:停机3:近当月无通话记录0:本网正常)、当月手机关机天数、当月手机账单金额(元)、当月主叫时长(分钟)、当月呼出次数、当月被叫时间(分钟)、当月呼入次数、当月短信数量(条)、当月手机流量使用情况(MB)、手机当前是否欠费、手机当前欠费金额(元)、手机历史是否有过欠费、手机持续欠费月份数

3

数据集名称

位置属性

时间段

6个月

时间粒度

小时

具体数据项

上班时段(工作日9点-18点)常驻地理位置、休息时段(工作日22点-第二天4点)常驻地理位置

4

数据集名称

终端属性

时间段

6个月

时间粒度

具体数据项

手机品牌、手机终端型号、手机系统、当前手机终端网络类型、当前手机价格、手机入网时间、1年内换号不换机次数、2年内换号不换机次数、3年内换号不换机次数

5

数据集名称

上网属性

时间段

6个月

时间粒度

具体数据项

访问IT类网站的次数、访问餐饮类网站的次数、访问房产类网站的次数、访问购物类网站的次数、访问股票类网站的次数、访问健康类网站的次数、访问金融类网站的次数、访问理财类网站的次数、访问旅游类网站的次数、访问汽车类网站的次数、访问社会类网站的次数、访问时事类网站的次数、访问体育类网站的次数、访问网游类网站的次数、访问文娱类网站的次数、访问招聘类网站的次数、访问其他类网站的次数

上海新金融大数据众筹平台:征信域

1

数据集名称

识别属性

时间段

6个月

时间粒度

具体数据项

手机号(加密)、姓名(加密)、身份证(加密)

2

数据集名称

验证属性

时间段

时间粒度

具体数据项

手机号码+IMSI是否一致、手机号码+MEID是否一致

3

数据集名称

参照评级

时间段

时间粒度

具体数据项

总分(分数)、历史信用(分数)、偿还能力(分数)、账户等级(分数)、社交关系(分数)、行为偏好(分数)

4

数据集名称

人群区间

时间段

6个月

时间粒度

具体数据项

时长区间 (0:0-6 个月 1:6-12 个月 2:12-36 个月 3:36-60 个月 4:60 个月以上)、用量区间(业务用量从高到低的百分比)

5

数据集名称

位置验证

时间段

6个月

时间粒度

小时

具体数据项

地址验证、过去一周停留城市、过去一周停留天数、活动半径(米)

上海新金融大数据众筹平台:资产域

1

数据集名称

识别属性

时间段

6个月

时间粒度

具体数据项

通信号码(加密)、姓名(加密)、身份证(加密)

2

数据集名称

资产信息

时间段

时间粒度

具体数据项

楼盘名称、房产地址(上海市宝山潘泾路***弄)、建筑面积、实际面积

3

数据集名称

交易时间

时间段

时间粒度

具体数据项

年月

4

数据集名称

付款方式

时间段

时间粒度

具体数据项

付款方案(按揭、分期、全款)

5

数据集名称

位置验证

时间段

6个月

时间粒度

小时

具体数据项

地址验证、过去一周停留城市、过去一周停留天数、活动半径(米)

样本数据