人工神經(jīng)網(wǎng)絡法預測多氯代二苯并對二噁英logKow值的研究
論文類型 | 技術(shù)與工程 | 發(fā)表日期 | 2001-11-01 |
來源 | 第二屆環(huán)境模擬與污染控制學術(shù)研討會 | ||
作者 | 黃俊,余剛,張彭義 | ||
摘要 | 黃俊 余剛 張彭義 (清華大學環(huán)境科學與工程系 環(huán)境模擬與污染控制國家重點實驗室,北京 100084) 1 前言 氯代二苯并對二噁英(polychlorinated dibenzo-p-dioxins,簡稱PCDDs)是國際上首批列入控制的12種持久性有機污染物之一,同時也是很強的內(nèi)分泌干擾物。因氯原子的取代數(shù)目及位 ... |
黃俊 余剛 張彭義
(清華大學環(huán)境科學與工程系 環(huán)境模擬與污染控制國家重點實驗室,北京 100084)
1 前言
氯代二苯并對二噁英(polychlorinated dibenzo-p-dioxins,簡稱PCDDs)是國際上首批列入控制的12種持久性有機污染物之一,同時也是很強的內(nèi)分泌干擾物。因氯原子的取代數(shù)目及位置的不同,PCDDs共有75種分子結(jié)構(gòu)[1],其中2,3,7,8-TCDD被認為是已知化合物中毒性最強的物質(zhì),同時還是很強的多位點致癌物,動物實驗證明,它易誘發(fā)肝、肺、粘膜和皮膚癌的發(fā)生,1997年國際癌癥研究機構(gòu)(IARC)將其確認為一級致癌物。
logKow值即正辛醇是進行污染物環(huán)境風險評價時考察其環(huán)境行為的一個重要參數(shù),由于單一PCDDs純物質(zhì)通常難以制備或購得,而且有些共存的PCDDs即使是用GC/MS方法中仍不容易分開,因此目前還有相當數(shù)量的PCDDs化合物難以獲得logKow實驗數(shù)據(jù)。在這種情況下,借助定量構(gòu)效關(guān)系(QSAR)方法來預測logKow很有必要。從已發(fā)表的PCDDs的logKow定量模型看,主要有采用基團/原子貢獻法的經(jīng)驗方法和熱力學方法兩類[2]。本文以單苯環(huán)氯取代指數(shù)作為分子結(jié)構(gòu)描述符,采用人工神經(jīng)網(wǎng)絡思想建立數(shù)學模型,并用于尚未有實驗值的PCDD分子的logKow的預測。
2 研究方法
2.1 建模樣本:本研究中利用了Rulle等[3]所收集整理的42種PCDDs及母體化合物二苯并對二噁英(Dibenzo-p-dioxin)共43種化合物構(gòu)成建模樣本,這是目前文獻報道中最為完整的PCDDs的logKow實驗數(shù)據(jù)集。
2.2 分子結(jié)構(gòu)描述:采用Liang等[4]在Hale等最先提出的單苯環(huán)取代描述規(guī)則基礎(chǔ)上改進后的分子結(jié)構(gòu)描述符,具體的取值規(guī)則參見文獻[4]。對于一個PCDD分子,有G1~G10共10個算符來描述其結(jié)構(gòu)。
2.3 建模方法:采用目前應用最廣泛、理論最完善的誤差反向傳播人工神經(jīng)網(wǎng)絡(BP-ANN),其建模算法及相應的程序參見文獻[5-6]。首先計算43種分子的G1~G10描述符,并與其相應的logKow值組織成訓練樣本;然后采用帶一個偏置節(jié)點的10-6-1體系進行樣本學習,10個分子描述符加載到10個輸入節(jié)點上,而logKow實驗值則加載到輸出節(jié)點上。向量均采用線性歸一化方法,其中輸入向量歸一化至-2~2區(qū)間,輸出向量歸一化至0~1區(qū)間。學習步長η取為0.2,動量因子α取0.5。采用隨機數(shù)矩陣進行權(quán)值矩陣的初始化,設(shè)置隨機數(shù)發(fā)生器的區(qū)間為-3~-3,網(wǎng)絡精度(目標誤差)取為0.05。訓練完畢后就得到了PCDDs分子結(jié)構(gòu)與logKow值之間的定量模型,精度檢驗后對樣本集外的33種PCDD的logKow值進行預測。
3 結(jié)果與討論
3.1 訓練結(jié)果
經(jīng)過57585次迭代(在128M內(nèi)存、Celeron 466微機上約耗時22秒),網(wǎng)絡訓練完畢,輸出各項參數(shù)。模型值與實驗值的相對誤差絕對值的平均值為0.4%,最大值為3.1%,精度符合建模目標要求。相對誤差的頻數(shù)分布圖如圖1所示,以模型值對實驗值所作的相關(guān)關(guān)系圖如圖2所示。從圖1和圖2可以看出,誤差大多數(shù)集中在±0.5%之間(共36個樣本,占樣本總數(shù)的84%),明顯地優(yōu)于文獻[3]中MOD模型的建模精度。模型值與實驗值之間的相關(guān)性相當好,說明所建立的BP-ANN模型較好地反演了蘊含在PCDD分子結(jié)構(gòu)與logKow之間的數(shù)學關(guān)系,可以用于預測。
3.2 BP-ANN的預測結(jié)果
利用上述模型,對尚未有實驗值報道的其它33種PCDD分子的logKow值進行預測,結(jié)果列于表1中。
8.17 2,3,7 - 6.55 1,2,3,4,6,9 -
6.26 1,7,8 - 4.45 1,2,3,7,8,9 - 8.18 1,3,6 - 5.99 1,2,3,4,6,7 - 5.54 1,3,7 - 4.36 1,2,3,4,6,7,9 - 8.12 1,3,8 - 4.36
參 考 文 獻
1 鄭明輝, 劉鵬巖, 包志成等. 科學通報, 1999, 44(5): 455-463
2 黃俊, 余剛, 張彭義等. 計算機與應用化學, 2001, 18(4): 289-292
3 Rulle P. Chemosphere, 2000, 40(5): 457-512
4 Liang X., Wang, W. Wu W., et., al. Chemosphere, 2000, 41(6): 923-929
5 黃俊, 周申范, 國振雙等. 色譜, 2000,18(1): 1-4
6 黃俊, 周申范, 唐婉瑩. 環(huán)境科學研究, 2000, 13(2): 3-5
論文搜索
月熱點論文
論文投稿
很多時候您的文章總是無緣變成鉛字。研究做到關(guān)鍵時,試驗有了起色時,是不是想和同行探討一下,工作中有了心得,您是不是很想與人分享,那么不要只是默默工作了,寫下來吧!投稿時,請以附件形式發(fā)至 paper@h2o-china.com ,請注明論文投稿。一旦采用,我們會為您增加100枚金幣。