可左右滑动选省市

基于大数据的运动性疲劳预警方法和系统发明专利

更新时间:2024-11-01
基于大数据的运动性疲劳预警方法和系统发明专利 专利申请类型:发明专利;
地区:山东-济南;
源自:济南高价值专利检索信息库;

专利名称:基于大数据的运动性疲劳预警方法和系统

专利类型:发明专利

专利申请号:CN202410022969.2

专利申请(专利权)人:山东体育学院
权利人地址:山东省济南市历城区世纪大道10600号

专利发明(设计)人:耿青青,付永峰,王宏,何伟

专利摘要:本发明涉及一种基于大数据的运动性疲劳预警方法和系统,属于运动数据分析领域,通过计算运动数据变量之间的相关性系数,剔除相关性较大的变量以处理多重共线性问题;构建冗余分析模型识别关键运动表现数据和关键生理生化数据,解决了运动数据分析中由于涉及的运动数据变量过多,导致对疲劳预警的分析效率低和效果差问题。利用运动员信息数据,将运动数据划分成不同运动员类别的数据样本,并构建关键运动表现数据和关键生理生化数据之间的响应关系模型确定不同运动员类别的疲劳阈值,解决了由于运动员个体之间的疲劳阈值存在差异,导致疲劳预警结果不准确的问题。

主权利要求:
1.一种基于大数据的运动性疲劳预警方法,其特征在于:包括以下步骤:S1、数据收集:收集日常监测的运动数据,所述运动数据包括生理生化数据、运动表现数据和运动员信息数据;
S2、数据处理:对收集的运动数据进行处理,包括多重共线性处理和异常样本处理;
S3、关键因子识别:通过构建运动表现数据与生理生化数据之间的冗余分析模型,识别影响生理生化数据的关键运动表现数据,并确定评估疲劳程度的关键生理生化数据,包括以下步骤:S31、确定模型变量:以运动表现数据作为解释变量,生理生化数据作为响应变量,构建冗余分析模型;
S32、模型检验:利用蒙特卡罗置换检验,检查全模型和模型第一轴的显著性,当全模型和模型第一轴存在显著性,模型通过检验;
S33、识别关键因子:根据各变量在排序轴中的得分,绘制排序图,根据图中运动表现数据和生理生化数据箭头之间的夹角大小,确定关键运动表现数据;根据生理生化数据箭头在排序轴的投影长度,确定关键生理生化数据;
S4、疲劳阈值分析:根据运动员信息数据,确定不同运动员类别的运动表现数据阈值,得到疲劳阈值,包括以下步骤:S41、数据样本划分:根据运动员信息数据,对运动数据样本进行划分,得到不同运动员类别的运动数据样本子集;
S42、确定响应关系:根据所述不同运动员类别的运动数据样本子集,以关键运动表现数据为解释变量,关键生理生化数据为响应变量,构建响应关系模型,确定不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系;所述响应关系模型,配置为广义可加模型;
S43、确定疲劳阈值,根据所述不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系,设定关键生理生化数据的阈值,并推算对应的关键运动表现数据阈值,以确定不同运动员类别的疲劳阈值;
S5、疲劳预警:监测运动员的运动表现数据,当运动表现数据达到所述疲劳阈值时,发出疲劳预警。
2.根据权利要求1所述的一种基于大数据的运动性疲劳预警方法,其特征在于:步骤S2中,所述多重共线性处理,包括以下步骤:S21、计算运动数据变量之间的相关性系数;
S22、当两个变量相关性系数大于0.9时,剔除其中一个变量。
3.根据权利要求2所述的一种基于大数据的运动性疲劳预警方法,其特征在于:步骤S21中,所述相关性系数,计算公式如下:式中:rij表示数据变量xi与xj之间的相关性系数;xki表示xi的第k个样本,xkj表示xj的第k个样本,k=1,2,…,n,其中n为样本数; 和 分别表示xi与xj的平均值。
4.根据权利要求1所述的一种基于大数据的运动性疲劳预警方法,其特征在于:步骤S2中,所述异常样本处理,具体为剔除包含缺失值、异常值和重复值的样本。
5.一种基于大数据的运动性疲劳预警系统,其特征在于:应用于如权利要求1‑4任一项所述的一种基于大数据的运动性疲劳预警方法。 说明书 : 基于大数据的运动性疲劳预警方法和系统技术领域[0001] 本发明属于运动数据分析领域,涉及一种基于大数据的运动性疲劳预警方法和系统。背景技术[0002] 运动性疲劳预警通过使用智能穿戴设备、传感器和大数据分析技术来获取和分析运动者的生理指标和运动数据。通过大数据分析和机器学习算法,识别出运动者的疲劳状态及潜在风险,并在超过安全范围或出现异常时发出预警。[0003] 目前对于运行性疲劳预警分析常用的运动数据包括生理生化数据,如运动员的心率、RPE、最大摄氧量、尿蛋白、血乳酸、卡路里和METS等;运动员信息,如年龄、性别、身高和体重等;以及运动表现数据,如运动时间、累计训练量、步频和速度等。然而,这些运动数据变量过多,数据采集复杂,并且难以识别表征运动员疲劳的关键因子,导致预警分析效率低和效果差。此外,由于运动员个体之间存在差异,其达到运动性疲劳的阈值存在差异,导致预警信号难以适应不同个体的变化,导致预警结果不准确。发明内容[0004] 为解决上述现有技术存在的问题,本发明提供了一种基于大数据的运动性疲劳预警方法和系统。[0005] 本发明的目的可以通过以下技术方案实现:[0006] 第一方面,本发明提供了一种基于大数据的运动性疲劳预警方法,包括以下步骤:[0007] S1、数据收集:收集日常监测的运动数据,所述运动数据包括生理生化数据、运动表现数据和运动员信息数据,所述生理生化数据,是指运动员在运动期间的生理和生化状态,用于评估运动员的疲劳程度,包括心率、RPE、最大摄氧量、尿蛋白、血乳酸、卡路里和METS等;所述运动表现数据,是指运动期间的状态表现,影响着生理生化数据的变化,包括运动时间、累计训练量、步频和速度等;运动员信息数据,是指不同运动员个体的年龄、性别、身高和体重信息;[0008] S2、数据处理:对收集的运动数据进行处理,包括多重共线性处理和异常样本处理;[0009] S3、关键因子识别:通过构建运动表现数据与生理生化数据之间的冗余分析模型,识别影响生理生化数据的关键运动表现数据,并确定评估疲劳程度的关键生理生化数据;[0010] S4、疲劳阈值分析:根据运动员信息数据,确定不同运动员类别的运动表现数据阈值,得到疲劳阈值;[0011] S5、疲劳预警:监测运动员的运动表现数据,当运动表现数据达到所述疲劳阈值时,发出疲劳预警。[0012] 进一步地,步骤S2中,所述多重共线性处理,包括以下步骤:[0013] S21、计算运动数据变量两两之间的相关性系数;[0014] S22、当两个变量相关性系数大于0.9时,剔除其中一个变量。[0015] 进一步地,步骤S21中,所述相关性系数,计算公式如下:[0016] ,[0017] 式中:rij表示数据变量xi与xj之间的相关性系数;xki表示xi的第k个样本,xkj表示xj的第k个样本,k=1,2,…,n,其中n为样本数; 和 分别表示xi与xj的平均值。[0018] 进一步地,步骤S2中,所述异常样本处理,具体为剔除包含缺失值、异常值和重复值的样本。[0019] 进一步地,步骤S3中,所述构建运动表现数据与生理生化数据之间的冗余分析模型,识别影响生理生化数据的关键运动表现数据,并确定评估疲劳程度的关键生理生化数据,包括以下步骤:[0020] S31、确定模型变量:以运动表现数据作为解释变量,生理生化数据作为响应变量,构建冗余分析模型;[0021] S32、模型检验:利用蒙特卡罗置换检验,检查全模型和模型第一轴的显著性,当全模型和模型第一轴存在显著性,模型通过检验;[0022] S33、识别关键因子:根据各变量在排序轴中的得分,绘制排序图,根据图中运动表现数据和生理生化数据箭头之间的夹角大小,确定关键运动表现数据;根据生理生化数据箭头在排序轴的投影长度,确定关键生理生化数据。[0023] 进一步地,步骤S4中,所述根据运动员信息数据,确定不同运动员类别的运动表现数据阈值,得到疲劳阈值,包括以下步骤:[0024] S41、数据样本划分:根据运动员信息数据,对运动数据样本进行划分,得到不同运动员类别的运动数据样本子集;[0025] S42、确定响应关系:根据所述不同运动员类别的运动数据样本子集,以关键运动表现数据为解释变量,关键生理生化数据为响应变量,构建响应关系模型,确定不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系;[0026] S43、确定疲劳阈值,根据所述不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系,设定关键生理生化数据的阈值,并推算对应的关键运动表现数据阈值,以确定不同运动员类别的疲劳阈值。[0027] 进一步地,步骤S43中,所述响应关系模型,配置为广义可加模型。[0028] 第二方面,本发明提供了一种基于大数据的运动性疲劳预警系统,应用于上述的一种基于大数据的运动性疲劳预警方法。[0029] 本发明的有益效果:[0030] (1)通过计算运动数据变量之间的相关性系数,剔除相关性较大的变量以处理多重共线性问题;构建冗余分析模型识别关键运动表现数据和关键生理生化数据,解决了运动数据分析中由于涉及的运动数据变量过多,导致对疲劳预警的分析效率低和效果差问题。[0031] (2)利用运动员信息数据,将运动数据划分出不同运动员类别的数据样本,并构建关键运动表现数据和关键生理生化数据之间的响应关系模型确定不同运动员类别的疲劳阈值,解决了由于运动员个体之间的疲劳阈值存在差异,导致疲劳预警结果不准确的问题。附图说明[0032] 为了便于本领域技术人员理解,下面结合附图对本发明作进一步地说明。[0033] 图1为本发明中一种基于大数据的运动性疲劳预警方法的流程图。具体实施方式[0034] 为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。[0035] 请参阅图1,第一方面,本发明提供了一种基于大数据的运动性疲劳预警方法,包括以下步骤:[0036] S1、数据收集:收集日常监测的运动数据,所述运动数据包括生理生化数据、运动表现数据和运动员信息数据,所述生理生化数据,是指运动员在运动期间的生理和生化状态,用于评估运动员的疲劳程度,包括心率、RPE、最大摄氧量、尿蛋白、血乳酸、卡路里和METS等;所述运动表现数据,是指运动期间的状态表现,影响着生理生化数据的变化,包括运动时间、累计训练量、步频和速度等;运动员信息数据,是指不同运动员个体的年龄、性别、身高和体重信息;[0037] S2、数据处理:对收集的运动数据进行处理,包括多重共线性处理和异常样本处理;[0038] S3、关键因子识别:通过构建运动表现数据与生理生化数据之间的冗余分析模型,识别影响生理生化数据的关键运动表现数据,并确定评估疲劳程度的关键生理生化数据;[0039] S4、疲劳阈值分析:根据运动员信息数据,确定不同运动员类别的运动表现数据阈值,得到疲劳阈值;[0040] S5、疲劳预警:监测运动员的运动表现数据,当运动表现数据达到所述疲劳阈值时,发出疲劳预警。[0041] 通过监测运动员的生理生化数据,可以得到客观的数据来评估疲劳程度,而影响疲劳程度大小的在于运动员的运动表现,但是通常涉及的生理生化数据和运动表现数据变量较多,难以一一采集和监测。因此在本实施例中,需要识别出这些数据变量中具有代表性的变量,得以加快监测和分析效率。首先需要处理变量之间多重共线性问题:当两个变量之间存在较大的相关性时,表示二者存在较大的联系,只需取其中一个变量进行分析就可达到分析目的,此外相关性较大的多个变量同时引入后续的建模中,可能出现多重共线性问题导致建模效果不稳定。[0042] 进一步地,步骤S2中,所述多重共线性处理,包括以下步骤:[0043] S21、计算运动数据变量两两之间的相关性系数;[0044] S22、当两个变量相关性系数大于0.9时,剔除其中一个变量。[0045] 需要注意的是,计算相关性系数是分别在生理生化数据和运动表现数据各自的数据集中单独计算的,也就是说没有计算生理生化数据的某个变量和运动表现数据的某个变量之间的相关性系数。此外,所述当两个变量相关性系数大于0.9时,剔除其中一个变量,需要剔除其中哪一个变量,可以基于数据整体特征进行剔除,例如A和B相关性系数大于0.9,A和C相关性系数大于0.9,但是B和C相关性不大于0.9,则只需剔除变量A就可以处理其中的多重共线性问题。[0046] 进一步地,步骤S21中,所述相关性系数,计算公式如下:[0047] ,[0048] 式中:rij表示数据变量xi与xj之间的相关性系数;xki表示xi的第k个样本,xkj表示xj的第k个样本,k=1,2,…,n,其中n为样本数; 和 分别表示xi与xj的平均值。[0049] 进一步地,步骤S2中,所述异常样本处理,具体为剔除包含缺失值、异常值和重复值的样本。[0050] 冗余分析(RDA)模型是一种基于降维排序分析的多元回归分析模型,适用于多个解释变量和响应变量的场景。RDA模型利用箭头表示变量,箭头的夹角可表示变量之间的相关性,同时利用箭头在RDA轴上的投影长度表示变量的重要程度。本实施例中,以运动表现数据作为解释变量,生理生化数据作为响应变量,构建RDA模型。利用变量之间的夹角关系识别与生理生化数据显著相关的关键运动表现数据;并利用生理生化数据的变量箭头在降维后的排序轴的投影,确定关键生理生化数据。[0051] 进一步地,步骤S3中,所述构建运动表现数据与生理生化数据之间的冗余分析模型,识别影响生理生化数据的关键运动表现数据,并确定评估疲劳程度的关键生理生化数据,包括以下步骤:[0052] S31、确定模型变量:以运动表现数据作为解释变量,生理生化数据作为响应变量,构建冗余分析模型;[0053] S32、模型检验:利用蒙特卡罗置换检验,检查全模型和模型第一轴的显著性,当全模型和模型第一轴存在显著性,模型通过检验;[0054] S33、识别关键因子:根据各变量在排序轴中的得分,绘制排序图,根据图中运动表现数据和生理生化数据箭头之间的夹角大小,确定关键运动表现数据;根据生理生化数据箭头在排序轴的投影长度,确定关键生理生化数据。[0055] 需要注意的是,步骤S33中,除了利用运动表现数据和生理生化数据箭头之间的夹角大小的方式,还可以直接计算运动表现数据和生理生化数据在排序轴中得分的相关性系数,确定关键运动表现数据。[0056] 进一步地,步骤S4中,所述根据运动员信息数据,确定不同运动员类别的运动表现数据阈值,得到疲劳阈值,包括以下步骤:[0057] S41、数据样本划分:根据运动员信息数据,对运动数据样本进行划分,得到不同运动员类别的运动数据样本子集;[0058] 需要注意的是,运动员信息数据包含连续变量(如年龄等)和分类变量(如性别等),对于分类变量,数据样本按照分类变量的类别划分,对于连续变量,可先采用聚类方法对连续变量进行聚类,再根据聚类产生的类别对数据样本进行划分,最终产生的结果是将运动数据样本划分为不同运动员类别的子集,例如按照性别可将运动数据划分为男运动员和女运动员;[0059] S42、确定响应关系:根据所述不同运动员类别的运动数据样本子集,以关键运动表现数据为解释变量,关键生理生化数据为响应变量,构建响应关系模型,确定不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系;[0060] S43、确定疲劳阈值,根据所述不同运动员类别的关键运动表现数据和关键生理生化数据之间的响应关系,设定关键生理生化数据的阈值,并推算对应的关键运动表现数据阈值,以确定不同运动员类别的疲劳阈值。[0061] 本实施例中,利用运动员信息数据将运动数据划分出不同运动员类别的数据样本,并利用数据样本确定不同运动员类别的疲劳阈值,克服了不同运动员个体的运动性疲劳阈值存在差异的问题,过程中构建了关键运动表现数据和关键生理生化数据之间的响应关系模型,由于生理生化数据与运动表现数据之间的响应关系可能是非线性的,难以被量化,因此本实施例中所采用的响应关系模型为广义可加模型。[0062] 进一步地,步骤S43中,所述响应关系模型,配置为广义可加模型。[0063] 第二方面,本发明提供了一种基于大数据的运动性疲劳预警系统,应用于上述的一种基于大数据的运动性疲劳预警方法。[0064] 本发明的有益效果:[0065] (1)通过计算运动数据变量之间的相关性系数,剔除相关性较大的变量以处理多重共线性问题;构建冗余分析模型识别关键运动表现数据和关键生理生化数据,解决了运动数据分析中由于涉及的运动数据变量过多,导致对疲劳预警的分析效率低和效果差问题。[0066] (2)利用运动员信息数据,将运动数据划分出不同运动员类别的数据样本,并构建关键运动表现数据和关键生理生化数据之间的响应关系模型确定不同运动员类别的疲劳阈值,解决了由于运动员个体之间的疲劳阈值存在差异,导致疲劳预警结果不准确的问题。[0067] 以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

专利地区:山东

专利申请日期:2024-01-08

专利公开日期:2024-09-03

专利公告号:CN117786505B


以上信息来自国家知识产权局,如信息有误请联系我方更正!
电话咨询
读内容
搜本页
回顶部