1、1212345实用性先进性、开放性可靠性、稳定性可扩展性、易升级性安全性、保密性3 目 标 定 位4业务模块基本信息学业特征上网特征消费特征借阅特征宿舍出入特征奖惩特征功能模块生源地分布年龄分布男女比例课程选择学分绩点统计成绩合格率挂科统计考试通过情况修学分情况毕业所需学分完成率重修课程绩点排名选修课排名等级考试情况上网时长排名上网内容热度上网流量上网时段上网时长分布情况上网访问内容排名消费类目占比消费金额消费时段消费排名借阅类型借阅频次借阅图书排名借阅数量排名借阅人群借阅数量变化趋势宿舍进出流量晚归情况晚归次数百分比可能未归情况打卡记录获奖类型获奖次数处罚人员详细模块学号、姓名、院系、专业、
2、班级、性别、省份、生源地、培养层次、出生日期、政治面貌、身份证、籍贯、学籍、名族、入学时间教务系统成绩数据 安全网关认证系统上网数据一卡通消费数据汇文系统借阅信息通道系统打卡数据获奖信息学工系统学籍数据学号、姓名、课程号、课程名称、开课学期、总成绩、课程性质、课程属性、课程分类、学时、学分、考试性质学号、姓名、上网内容、上线时间、下线时间学号、姓名、消费金额、消费日期学号、姓名、借阅书籍名称、借阅类型、借阅时间学号、姓名、通道、打卡时间、打卡类型(进或出)、打卡宿舍楼学号、姓名、获奖类型、获奖金额、获奖时间学号、姓名、惩罚类型、惩罚原因、惩罚时间处罚信息详细字段数据源5资源管理平台监控数据挖掘
3、PythonSpark-sklearnTensorflowImpalaSpark SQLHIVE hSQLMySQLHDFSHBaseKettleLogtashSqoop接口交互式分析数据储存数据计算ETLStorm/SparkStreaming实时计算Kylin/MapReduce离线计算第三方接口、网页数据源(Yarn)(Cloudera Manager)LOGDBMQFile6WEB移动设备客户端账户系统业务层统计报表预 警 数据分析监 控机器学习深度学习数据挖掘层数据采集大数据层数据清洗数据离线计算数据实时计算X86架构集群硬件环境数据中心网络权限控制日志记录7目前线上版本891011121314151617181920互 联 网招聘就业热搜培训新闻高 校学 术 科 研校 内 商 家无线数据上网数据其他数据教务等系统学籍、教师、课程等数据学术网文献库科研项目第 三 方 数 据打造“高校大脑”21综合决策学生管理教务管理后勤服务科研辅助.未来规划-更为丰富22未来规划-更为有效-谢谢-