空氣監(jiān)測(cè)數(shù)據(jù)處理是保障數(shù)據(jù)準(zhǔn)確性、可用性與決策價(jià)值的核心環(huán)節(jié),需遵循 **“數(shù)據(jù)預(yù)處理→統(tǒng)計(jì)分析→質(zhì)量驗(yàn)證→可視化與應(yīng)用”** 的全流程規(guī)范,具體方法如下:
一、數(shù)據(jù)預(yù)處理:消除噪聲與異常,統(tǒng)一數(shù)據(jù)格式
1. 原始數(shù)據(jù)核查與篩選
完整性校驗(yàn)
剔除缺失值占比>10% 的監(jiān)測(cè)時(shí)段數(shù)據(jù)(如傳感器斷電、通信故障導(dǎo)致的空白數(shù)據(jù));
對(duì)短時(shí)缺失(<1 小時(shí))數(shù)據(jù),采用線(xiàn)性插值法填補(bǔ);對(duì)長(zhǎng)時(shí)缺失(>12 小時(shí))數(shù)據(jù),標(biāo)注為 “無(wú)效數(shù)據(jù)”,不參與統(tǒng)計(jì)。
格式標(biāo)準(zhǔn)化
統(tǒng)一數(shù)據(jù)單位(如顆粒物濃度換算為 μg/m3,氣態(tài)污染物換算為 mg/m3 或 μmol/mol);
校準(zhǔn)時(shí)間戳(統(tǒng)一為北京時(shí)間,精確到分鐘 / 小時(shí),消除不同設(shè)備的時(shí)間偏差);
關(guān)聯(lián)元數(shù)據(jù)(如監(jiān)測(cè)點(diǎn)位、儀器型號(hào)、校準(zhǔn)時(shí)間、氣象參數(shù)),確保數(shù)據(jù)可溯源。
2. 異常值識(shí)別與處理
異常值指偏離正常數(shù)據(jù)分布的極端值(如傳感器故障、突發(fā)干擾導(dǎo)致的異常高 / 低值),需通過(guò)以下方法識(shí)別并處理:
識(shí)別方法 適用場(chǎng)景 處理原則
3σ 準(zhǔn)則 正態(tài)分布的常規(guī)污染物數(shù)據(jù) 超出均值 ±3 倍標(biāo)準(zhǔn)差的數(shù)據(jù)判定為異常,用相鄰時(shí)段均值替換
箱線(xiàn)圖法 非正態(tài)分布的離散監(jiān)測(cè)數(shù)據(jù) 剔除四分位距(IQR)1.5 倍以外的異常值,保留疑似突發(fā)污染的極端值(單獨(dú)標(biāo)注)
趨勢(shì)對(duì)比法 多點(diǎn)位同步監(jiān)測(cè)數(shù)據(jù) 某點(diǎn)位數(shù)據(jù)與周邊點(diǎn)位趨勢(shì)偏差>50% 時(shí),判定為設(shè)備異常,剔除該時(shí)段數(shù)據(jù)
邏輯校驗(yàn)法 有明確物理限值的污染物 如 O?濃度不可能<0μg/m3、CO 濃度不可能>100mg/m3,超出物理限值直接剔除
特殊情況處理:突發(fā)污染事件(如工廠(chǎng)泄漏)導(dǎo)致的極端值,需結(jié)合現(xiàn)場(chǎng)工況標(biāo)注為 “有效異常值”,不納入常規(guī)統(tǒng)計(jì),但需用于應(yīng)急分析。
添加微信
聯(lián)系方式
18052636575
地址:靖江市七圩港西路102號(hào)
郵箱:jssunuo@163.com