技術(shù)文章
TECHNICAL ARTICLES數(shù)據(jù)
前幾天涉及到一個(gè)數(shù)據(jù),我和一個(gè)老師爭論了一陣的Checkcif問題。晶體數(shù)據(jù)很清晰的顯示的原子的位置,在Checkcif里卻認(rèn)為是有問題的Alert。如果是修,自然是可以修掉的,但是作為一個(gè)晶體學(xué)工作者的尊嚴(yán),為了修而修,這不是科學(xué),就成了畫畫了。但這個(gè)爭論也只持續(xù)了一會(huì),我自知無力改變什么,一個(gè)科學(xué)發(fā)現(xiàn)就這樣淹沒在checkcif里。如同Alert簡單粗暴的被90%以上的同學(xué)和老師稱之為錯(cuò)誤,即便解釋了再多遍,也鮮有人認(rèn)真去改正。讀過Checkcif歷史的同學(xué)都會(huì)知道,Checkcif初衷是個(gè)輔助工具幫助我們減少一些不必要的失誤。但是現(xiàn)在這個(gè)初衷變了味,成了大多數(shù)同學(xué)甚至審稿人眼里的一刀切標(biāo)準(zhǔn)。每個(gè)Checkcif Report都會(huì)有這么一句話
“THIS REPORT IS FOR GUIDANCE ONLY. IF USED AS PART OF A REVIEW PROCEDURE FOR PUBLICATION, IT SHOULD NOT REPLACE THE EXPERTISE OF AN EXPERIENCED CRYSTALLOGRAPHIC REFEREE."
然而這句話我相信絕大多數(shù)同學(xué)從來都沒有讀過。單一標(biāo)準(zhǔn)的問題對(duì)于做化學(xué)晶體的同學(xué)們尤為嚴(yán)重。這已經(jīng)是吐槽了太久的吐槽,有時(shí)候是無奈的事情。不過我更想吐槽的是關(guān)于數(shù)據(jù)質(zhì)量的判斷。雖然絕大多數(shù)做蛋白晶體的同學(xué)并沒有真實(shí)接觸過晶體學(xué),但對(duì)于分辨率的概念理解卻比大多數(shù)做化學(xué)晶體的同學(xué)要好的太多。在化學(xué)晶體里,好像世界很單一。不管是什么樣的晶體,分辨率統(tǒng)一的是0.77? or 0.83 ?。對(duì)于數(shù)據(jù)質(zhì)量的判斷,永遠(yuǎn)只有信噪比,Rint,完整度,其它一概不問。可是對(duì)于晶體學(xué)來說,不應(yīng)該衍射分辨率(自然不是所謂的0.83 ?)是較重要的概念么?
討論
比如下面這顆晶體的數(shù)據(jù),學(xué)生告訴我:
“您看沒有紅色,數(shù)據(jù)質(zhì)量還可以,信噪比馬馬虎虎,Rint也低于10%,可就是解不好結(jié)構(gòu)。"
“分辨率呢?"
“0.84 ?"
聽到0.84 ?,其實(shí)我就已經(jīng)開始懷疑了,其實(shí)這并沒有回答我問的問題。
“那這樣吧,你看下你的信噪比分布。"
“咦,這是什么?"
“…這是數(shù)據(jù)信噪比的分布,你可以看到按照信噪比3的閾值線,2theta角對(duì)應(yīng)的還不到80°,分辨率是多少?"
“... 不懂…"
“好吧,那看Xprep吧.."
“假設(shè)沒那么嚴(yán)格,信噪比>2的時(shí)候,這里對(duì)應(yīng)的分辨率是多少?"
“…1.05 ??"
“XPREP給你的平均信噪比是多少呢?"
“…只有3.5.."
“那這個(gè)數(shù)據(jù)看起來還好么?"
“…不好"
“看看你1.2 ?以上的數(shù)據(jù),Rmerge值有多高呢?"
“…"
“假設(shè)30% 是閾值線,這個(gè)數(shù)據(jù)1.2 ?到0.83 ?基本上都是噪音,衍射圖上應(yīng)該也很弱。這么差的數(shù)據(jù)為什么你會(huì)認(rèn)為還不錯(cuò)呢?"
“可是我是按照0.83 ?,信噪比10收的數(shù)據(jù)…"
“晶體的有效分辨率不是設(shè)定出來的..我也不知道為什么Olex2會(huì)計(jì)算出來那么高的平均信噪比,至少它對(duì)我來說沒有實(shí)際意義,我更關(guān)注它的真實(shí)分辨率"
“那我R1還能修到5%么?"
“…這個(gè)…別想太多了…"
...對(duì)于一個(gè)衍射較弱的數(shù)據(jù),分辨率不足,這明顯是一個(gè)硬傷??墒沁@個(gè)簡單明顯的問題,卻很少有人去查看。甚至在拿到hkl文件后,都沒有去查看過衍射圖的習(xí)慣。同樣的統(tǒng)計(jì)數(shù)字,實(shí)際上對(duì)應(yīng)的可能是不同數(shù)據(jù)質(zhì)量的晶體。甚至這些數(shù)字也不一定是真實(shí)的。
總結(jié)
所以,在解析一個(gè)數(shù)據(jù)之前,先確定這個(gè)晶體的分辨率真實(shí)有多少,再去設(shè)定對(duì)它的期望。如果真是分辨率不到1.2?,那么就要做好相位都解析不了的心理準(zhǔn)備。當(dāng)然這些實(shí)際上在收數(shù)據(jù)的時(shí)候就應(yīng)該已經(jīng)了解,只是衍射圖太多時(shí)候被丟棄在一邊。當(dāng)然給晶體的數(shù)據(jù)質(zhì)量打分,其實(shí)是一個(gè)多參數(shù)評(píng)判的過程,取決于很多因素,并不是看hkl文件的幾個(gè)簡單的數(shù)值就結(jié)束了。甚至我們需要查看晶體對(duì)心,衍射圖,數(shù)據(jù)還原等過程。像這個(gè)看起來Rint值很低的數(shù)據(jù),實(shí)際上也只是低角度的數(shù)據(jù)很好,反而掩蓋了基本的分辨率不足的問題。而更多常見的問題會(huì)有定錯(cuò)了晶胞,沒有處理孿晶,吸收校正錯(cuò)誤,冗余度太低,刪除了太多衍射點(diǎn)等等…也許每一步都是坑,填平了坑,才能知道下一步是不是走得下去。(未完,待續(xù))
-轉(zhuǎn)載于《布魯克X射線部門》公眾號(hào)
掃一掃,關(guān)注公眾號(hào)
服務(wù)電話:
021-34685181 上海市松江區(qū)千帆路288弄G60科創(chuàng)云廊3號(hào)樓602室 wei.zhu@shuyunsh.com服務(wù)熱線:
021-34685181
17621138977