Sa isang kamakailang pag-aaral na inilathala sa Mga Pamamaraan ng National Academy of Sciences, Ang mga mananaliksik mula sa United States of America ay bumuo at nagpatunay ng “TimeMachine,” isang algorithm na hinuhulaan ang circadian phase ng mga pasyente na gumagamit ng gene expression sa peripheral blood mononuclear cells (PBMCs) mula sa isang sample ng dugo. Nalaman nila na ang algorithm ay nababaluktot at tumpak sa mga hula nito at mahusay na gumanap sa bagong data nang walang muling pagsasanay o renormalization.
Pag-aaral: Platform-independiyenteng pagtatantya ng oras ng pisyolohikal ng tao mula sa mga solong sample ng dugo. Credit ng Larawan: Nuva Frames / Shutterstock
Background
Ang circadian rhythm, isang conserved at endogenous timekeeping system, ay nakakaimpluwensya sa iba’t ibang biological na proseso. Ang dysregulation ng ritmong ito ay nauugnay sa mga isyu sa kalusugan tulad ng obesity, diabetes, cancer, at cardiovascular disease. Ang pag-align ng dosing ng gamot sa mga circadian cycle ay maaaring mapahusay ang pagiging epektibo ng paggamot at mabawasan ang mga side effect. Ang dim-light melatonin onset (DLMO), ang kasalukuyang gold standard measure ng circadian phase, ay nakakaubos ng oras at magastos, na humahadlang sa malawak na pagpapatupad sa pananaliksik at mga klinikal na setting. Ang transcriptomic profiling at machine learning ay nag-aalok ng magandang alternatibo, gamit ang gene expression bilang readout ng circadian rhythm. Ang mga nakaraang algorithm na binuo sa bagay na ito ay walang generalizability at nalilimitahan ng batch correction, retraining, o mga hamon na partikular sa platform. Upang matugunan ang agwat na ito, ipinakilala ng kasalukuyang pag-aaral ang algorithm na “TimeMachine” upang mahulaan ang yugto ng circadian ng tao mula sa isang pagguhit ng dugo habang nakatuon sa pagiging simple at pagiging pangkalahatan.
Tungkol sa pag-aaral
Kasama sa framework ng TimeMachine algorithm ang tatlong hakbang: pagpili ng feature, within-sample rescaling, at pag-angkop sa predictor. Ito ay una na sinanay at nasubok sa isang circadian gene expression dataset (TrTe). Dagdag pa, inilapat ito nang walang batch correction o retraining sa sample ng data mula sa tatlong independyente, nai-publish na mga dataset (V1, V2, at V3) ng transcriptome ng buong dugo ng tao. Ang lahat ng mga dataset na ginamit sa kasalukuyang pag-aaral ay nakuha mula sa National Center for Biotechnology Information Gene Expression Omnibus (NCBI GEO) repository at kasangkot ang paggamit ng iba’t ibang mga platform para sa microarray at ribonucleic acid sequencing (RNA-seq). Isang kabuuan ng 7,615 gene na karaniwan sa lahat ng mga dataset ang ginamit para sa pagsusuri.
Nagsisimula ang algorithm sa pamamagitan ng pagpili ng mga gene na naglalaman ng impormasyon sa phase bilang mga potensyal na circadian biomarker. Ang paglalapat ng mga umiiral nang pamamaraan (ZeitZeiger, PLSR-based, TimeSignature) sa data ng pagsasanay ay nakatulong sa pagtukoy ng 135 na gen ng kandidato. Mula sa mga ito, 37 mga gene na nagpapakita ng matatag na mga pattern ng pagbibisikleta, na tinutukoy ng JTK_Cycle analysis, ay ginamit bilang mga input para sa TimeMachine predictor.
Iminungkahi ng mga mananaliksik ang dalawang paraan ng normalisasyon: pairwise gene ratios at z-score transformation, na humahantong sa pagbuo ng dalawang variant ng algorithm— ratio TimeMachine (rTM) at z-score TimeMachine (zTM), ayon sa pagkakabanggit. Ang mga variant na ito ay naglalayong tiyakin ang pare-pareho at maihahambing na data ng expression sa mga platform sa pamamagitan ng pagbibigay-diin sa kamag-anak na expression ng gene kaysa sa ganap na magnitude. Ang parehong mga variant ay gumagamit ng bivariate regression na may elastic net regularization para sa paghula ng physiological time bilang isang function ng gene expression. Isinasaalang-alang ng pagsusuri ang median absolute error at ang normalized na lugar sa ilalim ng error cumulative distribution function curve (AUC). Dagdag pa, ang TimeMachine ay inihambing sa makabagong pamamaraan batay sa PLSR (maikli para sa bahagyang hindi bababa sa mga parisukat na regression) sa maraming dataset at platform.
resulta at diskusyon
Para sa TrTe, nakamit ng rTM ang isang median absolute error na 1.39 h, na may 55.7% ng mga hula sa loob ng 2 h at 83.8% sa loob ng 4 h. Kapag inilapat sa V1 at V3, nagpakita ang rTM ng mga tumpak na hula sa kabila ng mga pagkakaiba sa mga pang-eksperimentong kundisyon at mga platform ng profiling, na nagbubunga ng median na ganap na error na 2:41 h para sa V1 at 1:53 h para sa V3. Ang variant ng zTM ay nagpakita ng maihahambing na pagganap, na nagmumungkahi na ang parehong mga pamamaraan ng normalisasyon ay katumbas para sa paghihinuha ng circadian phase mula sa mga transcriptomic ng dugo sa mga platform.
Sa paghahambing ng mga pag-aaral, ang TimeMachine ay nagpakita ng katulad o higit na mahusay na pagganap sa PLSR, na may median na ganap na error na 2:13 h hanggang 2:55 h. Mahalaga, nalampasan ng TimeMachine ang PLSR habang nangangailangan ng mas kaunting predictor genes. Parehong nakamit ang ratio na TimeMachine at z-score na TimeMachine na mga variant ng maihahambing na katumpakan, na mas mataas ang PLSR sa mga dataset na TrTe at V3. Ang mga pagtatasa ng generalizability sa lahat ng apat na pag-aaral ay nagpakita ng pare-parehong pagganap ng TimeMachine sa paghula ng lokal na oras, kahit sa iba’t ibang platform. Kung ikukumpara sa dalawang-timepoint na pamamaraan, ang rTM at zTM ay nagpakita ng isang mean absolute error na mas makabuluhan sa 20–40 min. Sa pangkalahatan, ang isang beses na mga hula ng TimeMachine sa yugto ng circadian at lokal na oras ay nagpakita ng matatag at mapagkumpitensyang pagganap sa magkakaibang mga dataset at platform.
Bukod pa rito, sinisiyasat ng pag-aaral ang mga salik na nakakaimpluwensya sa pagganap ng TimeMachine, na nakatuon sa kaugnayan sa pagitan ng katumpakan ng hula at hinulaang amplitude. Ang mga sample na may mga hinulaang amplitude na mas mababa sa 0.5 ay patuloy na nagpakita ng mas mataas na mga error para sa rTM at zTM, na nagbibigay ng mga insight sa kumpiyansa sa hula. Ang pagkategorya ng mga sample ayon sa mga agwat ng phase ay nagsiwalat ng kabaligtaran na ugnayan sa pagitan ng hinulaang amplitude at error.
Konklusyon
Sa konklusyon, tinutugunan ng TimeMachine ang mga hamon ng pagsusuri ng mga circadian biomarker, na nag-aalok ng mga tumpak na hula sa yugto ng circadian gamit ang isang solong-timepoint na gene expression na profile ng mga PBMC. Ang pagiging praktikal nito, kasunduan sa in-lab na data, at pagiging pangkalahatan para sa mga prospective at retrospective na pagsusuri ay ginagawa itong isang mahalagang tool para sa magkakaibang mga aplikasyon sa medikal na pananaliksik, mga klinikal na setting, at ang paggalugad ng mga tungkulin ng circadian rhythms sa iba’t ibang sakit, kabilang ang cancer.