提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
江苏全社会研发投入强度达创新型国家中等水平******
科技日报南京1月5日电(记者张晔)1月5日,江苏省科技工作会议以视频形式在南京召开。记者从会上获悉,2022年全省全社会研发投入预计达3700亿元,达到创新型国家和地区中等水平。
江苏省科技厅党组书记、厅长王秦在报告中说,过去五年来,江苏深入实施创新驱动发展战略,科技强省建设取得了明显成效,为全省高质量发展提供了有力的科技支撑。在创新投入方面,预计2022年全省全社会研发投入达3700亿元、较2017年增长超过60%;占地区生产总值比重将首次突破3%大关,达到创新型国家和地区中等水平。在创新产出方面,万人发明专利拥有量超过49件,高新技术企业总数达4.4万家,高新技术产业产值占规上工业比重达48.5%。在创新平台方面,以苏州实验室为代表的战略科技力量集聚江苏,省产业技术研究院改革发展在国内外产生广泛影响,重点领域改革相关经验做法在全国推广。在创新贡献方面,全省科技进步贡献率达67%左右,技术合同成交额突破3800亿元,区域创新能力连续多年位居全国前列,多次获国务院督查激励表扬。
2023年,江苏将重点抓好战略科技力量培育工程、关键核心技术攻坚工程、基础研究强基工程、企业创新能力提升工程、开放协同创新工程,深化科技人才发展机制改革、优化重大科技任务组织机制、完善区域协同创新机制、深化科技成果转移转化机制,促进产业链创新链深度融合。力争到2025年,全省科技自立自强能力实现显著提升;到2035年,率先实现高水平科技自立自强,建成与基本实现社会主义现代化要求相适应的科技强省。
会上,南京市科技局、徐州市科技局、如皋市委市政府、昆山高新区、清华大学苏州汽车研究院等5家单位作了交流发言。
(文图:赵筱尘 巫邓炎)