摘要随着社会发展和生活方式的改变糖尿病等慢性疾病的发病率逐年上升对人类健康造成了严重威胁。为了更好地预防和控制糖尿病开发一款基于随机森林的糖尿病预测系统。该系统旨在通过大数据分析和机器学习算法实现对糖尿病发病风险的准确预测为个体提供针对性的预防建议。该系统是一款基于B/S架构的web应用其它技术还包括pythonhadoopsparkvueEchartspandas等。用户首先可以通过从PP飞桨网下载糖尿病预测数据集包括血糖值、怀孕次数、BMI值等系统通过echarts展示怀孕与发病情况统计图血压与患病关系统计图不同年龄发病情况统计图还可以通过创建随机森林模型用户输入血糖、怀孕次数、血压、BMI值、年龄等数据预测糖尿病的得病概率预测。总的来说通过预测糖尿病的发病概率个人可以提前采取措施进行干预降低患病风险。同时医疗机构也可以利用该系统对高危人群进行筛查和管理提高防治效果。根据以上的功能需求情况整体的功能模块包括有前台vue项目模块后台django项目模块。前台vue的页面主要页面包括注册与登录页面数据可视化展示页面数据准备模块主要用来下载PP飞桨网的相关数据信息的通过使用hadoop进行数据的存储django后台用来提供前台所用的json数据以及给出糖尿病发病率预测的相关信息。其中糖尿病发病率预测模块的实现是基于机器学习功能之后的应用阶段。系统通过机器学习和训练之后可以根据糖尿病相关的指标的具体特征比如血糖值、怀孕次数、BMI值等评估糖尿病发病率这是通过随机森林线性回归算法实现的