產品列表 / products
全基因組關聯(lián)研究(GWAS)針對大量人群尋找有助于常見的多基因特征(如身高或肥胖)的基因。這些綜合性研究經常發(fā)現(xiàn)大量微小的遺傳變異,這些變異在高齡,肥胖等人群中更常發(fā)生。但這種相關性并不一定意味著因果關系的存在。
雖然有許多計算算法可用于幫助提取GWAS結果,但很難知道選擇哪一種。研究人員在《American Journal of Human Genetics》雜志上發(fā)表的文章稱Benchmarker一種可靠的對GWAS數(shù)據(jù)進行挖掘的算法。
“我們有不同的優(yōu)先級算法,但我們實際上并不知道如何確定哪一個是的,”該文章主要作者Rebecca Fine說 “我們不想依賴先前的'黃金標準'或引入除原始GWAS數(shù)據(jù)之外的任何其他內容。”
借助“交叉驗證”的機器學習概念,Benchmarker使調查人員能夠將GWAS數(shù)據(jù)本身作為自己的控制。我們的想法是采用GWAS數(shù)據(jù)集并挑出一條染色體。然后,基準測試的算法使用來自剩余的21條染色體(除X和Y之外的所有染色體)的數(shù)據(jù)來預測單個染色體上的哪些基因有可能對所研究的性狀有貢獻。由于依次對每個染色體重復該過程,因此匯集算法標記的基因。然后通過將這組優(yōu)先基因與原始GWAS結果進行比較來驗證該算法。
“首先在GWAS上訓練算法,并保留一條染色體,然后返回到該染色體,并詢問這些基因是否與原始GWAS結果中的強p值相關聯(lián),”Fine解釋說。 “雖然這些p值并不能代表確切的”正確答案“,但它們確實可以告訴我們一些真正的遺傳關聯(lián)。終產品是對每種算法執(zhí)行情況的評估。
Fine,Hirschhorn及其同事通過應用得出的結論是,結合多種策略通常可以獲得*結果。他們還發(fā)現(xiàn)了某些算法在尋找某些特征的基因時表現(xiàn)*的證據(jù)。
“我們希望在GWAS之后開發(fā)更多算法來回答關鍵的下一個問題:哪些基因和變異與人類特征和疾病有因果關系,”Hirschhorn說。 “benchmarker可以作為一種無偏見的方法來確定用于回答這個問題的算法。”