近日,中国工程院院士、南方海洋科学与工程广东省实验室(广州)教授包振民团队开发国际首个整合宏观/微观进化基因组和功能基因组的综合分析工具(PanSyn,https://github.com/yhw320/PanSyn)。相关成果发表于《自然-实验手册》。该成果是包振民团队长期积累的丰富基因组学分析方法和工具研发经验的系统总结和提升。
阐释基因组的结构和功能是解码地球生命史和生物多样性的核心。高通量测序技术的革命性突破及各类组学技术的广泛应用,为生命科学领域带来前所未有的发展契机,推动生命科学研究快速进入大数据时代。深度挖掘复杂、高维度的海量组学资源已成为当前生命科学领域面临的巨大挑战。对大部分生物类群(特别是非模式海洋生物)而言,至今缺乏深度系统的基因组学分析工具,难以满足日益增长的对复杂海量组学数据的分析需求。
整合宏观/微观进化基因组和功能基因组的综合分析工具PanSyn流程概览。受访者供图
基因组共线性分析为比较基因组学研究提供了基本框架。现存物种基因组间/内和祖先与现存物种基因组之间的基因组共线性分析是阐明基因组结构、调控元件及其进化史的关键步骤。目前大多数共线性分析方法主要集中在微观进化尺度上,或仅在微观或宏观单一进化尺度上进行研究,鲜有对两个尺度的综合分析,严重阻碍了对基因组的泛进化历程及其背后蕴藏的功能意义的全面理解。因此迫切需要开发一种全面且系统的比较基因组学分析工具,以深刻解析基因组结构与功能进化的本质规律。
针对上述国际基因组学领域面临的共性挑战,包振民团队开发了迄今最全面系统的整合宏观/微观进化基因组和功能基因组的综合分析工具PanSyn,其不仅包含功能全面的微观共线性分析模块,还极大弥补了宏观共线性分析工具匮乏的局面,并创新提出整合微观和宏观共线性以及调控组学数据的集成式分析模块。
与主流软件和工具相比,PanSyn具有显著优势:一是,微观共线性分析方面,可实现从单一到多重比对、从简单到复杂倍性、从低维到高维网络、从结构到功能的全面微观共线性分析;二是,宏观共线性分析方面,可实现祖先基因组重建、古老基因家族聚类、核型保守性估算以及染色体进化过程系统推断;三是,整合分析模块方面,首次提出从微观到宏观(自下而上)和从宏观到微观(自上而下)的双重整合策略,实现祖先与现存物种之间的基因组泛进化尺度的系统推演和解析。同时实现整合多维功能组学数据,为理解基因组进化提供更全面深入的功能解读视角。
PanSyn是国际首个整合宏观/微观进化基因组和功能基因组的综合分析工具。PanSyn将为全面解析基因组进化和功能、基因资源开发利用等提供有力工具,以助推生命科学领域的创新发现和重大突破,实现最终描绘出整个生命之树的发展演变的全貌。
相关论文信息:https://doi.org/10.1038/s41596-024-00966-4