目前世界上已有的化学品超过了1000万种,而且每年还有大量的新化学物质产生,其中多数为有害化学品。这些有害化学品对人类的健康和环境危害构成了巨大的威胁。因此,如何科学、客观地评判这些有机化学品的毒理学危害是环境与健康领域中的一个重要研究课题。目前,随着计算机技术和统计学方法的发展,化合物的结构与性质定量构效关系(Quantitative structure-activity relationship,QSAR)研究得到了日益广泛的应用,其研究对象包括化合物的生物活性、毒性、药代动力学参数和生物利用度以及分子的各种理化性质和环境行为等,研究领域涉及生物、药学、化学以及环境科学等诸多学科。QSAR模型可以从分子上揭示化合物的结构与其活性之间的关系,可以对化合物进行设计、筛选和毒理学预测。
苯系化合物是一类在化工、制药等行业广泛利用的原材料,也是导致潜在环境与健康问题的化学品类型。因此,本论文以该类化合物作为研究对象,采用分子结构定量描述,结合多元线性回归(Multiple Linear Regression, MLR)或者支持向量机(Support Vector Machine, SVM)的非线性回归的统计方法,构建几类苯系化合物的急性毒性QSAR模型和致突变模型,为该类新化合物在使用过程中的环境与健康风险性评估提供技术支撑。
本论文第一章介绍了QSAR方法的发展历史、基本原理、方法及研究进展,并且简单的介绍了几种统计学方法的基本原理及其在QSAR模型中的应用。
论文第二章,采用结构与活性/性质定量关系所使用的参数和研究方法,系统构建了八类苯系化合物(苯甲酸类、苯酸酯类、醛酮类、硝基苯类、氨基苯类、苯酚类、烷基苯类、卤代苯类)急性毒性多元线性QSAR模型。通过对模型结果进行分析,发现这些模型对各类化合物的急性毒性具有较好的稳定性和预测能力。
论文第三章,采用结构与活性/性质定量关系所使用的参数和研究方法,系统构建了三类苯系化合物(硝基苯类、氨基苯类、卤代苯类)致突变性多元线性QSAR模型。通过对模型结果进行分析,发现这些模型对各类化合物的致突性具有较好的稳定性和预测能力。
论文第四章,采用新的机器学习方法支持向量机SVM,成功的构建了氨基苯类的急性毒性的非线性QSAR模型。并且通过与线性QSAR模型的比较,发现运用支持向量机SVM算法建立的非线性QSAR模型,其稳定性以及预测效果均优于多元线性QSAR模型。
综上所述,本论文采用多元线性回归以及支持向量机的方法,成功构建了八类苯系化合物的结构与毒性性质的关系模型,所建立的模型可用于这些物质毒性/性质的预测,并从分子水平揭示了环境有机污染物的作用机理。另外,通过对八类苯系化合物相关毒性的线性与非线性QSAR模型的进行比较,发现非线性QSAR模型的稳定性以及预测效果均优于多元线性QSAR模型。 摘要译文
苯系化合物; 急性毒性; 致突变性; 多元线性回归; 支持向量机
071306[修复生态学];083001[环境科学];083003[环境健康]