System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于基因芯片,涉及一種綿羊3k液相芯片及其應用。
技術介紹
1、綿羊作為重要的家畜,歷經長期自然選擇與人工馴化,形成了獨特的生理與行為特性。新疆地區的綿羊品種,如多浪羊、柯爾克孜羊、阿勒泰羊、巴爾楚克羊和巴音布魯克羊等,這些品種以其獨特的地理標志產品保護和優良的生產性能而著稱,如阿勒泰羊以其體格大、肉脂生產性能高而聞名;巴爾楚克羊則以其肉毛兼用型地方品種和優良的生產性能受到推崇;巴音布魯克羊以早熟、耐粗飼、適應性強等優點而著稱,以產肉量高而聞名。這些不同的品種展示了綿羊在自然界和人類馴化下的多樣性,從適應極端環境的野生綿羊到特定地區優化的品種綿羊,體現了自然選擇和人工選擇的不同影響。
2、在綿羊的種質資源遺傳多樣性分析、遺傳與進化分析、親緣關系鑒定、全基因組關聯分析和基因組選擇等研究工作中,單核苷酸多態性(single?nucleotide?polymorphism,snp)作為分布廣泛的遺傳分子標記,具有密度高、遺傳穩定性強和易于自動化分析等特點,因而得到越來越多的應用。
3、基于snp制備的基因芯片主要包括固相芯片和液相芯片,固相芯片是基于探針與dna序列的互補雜交,通過標記物的熒光顯色信號進行分型。液相芯片則基于重測序技術,對每個目標位點進行專一性捕獲,并進行高深度的重測序,具有檢測準確性高、通量大的優點。液相芯片根據dna互補原理,為每個待測位點設計的一條生物素(biotin)標記、覆蓋目標snp的探針,這些探針在液相中與基因組目標區域雜交形成雙鏈,可以利用鏈霉親和素包衣的磁珠與帶有生物
4、雖然液相芯片具備上述諸多優點,但目前應用成熟的可用于綿羊育種等工作中的商業化液相芯片仍較為匱乏,主要是snp分子標記密度低、分布不均勻,檢測成本較高等,給研究工作效率造成極大影響,這就需要開發密度高、準確性好、可商業化應用的綿羊snp液相芯片。
技術實現思路
1、為了加快綿羊育種進程,高效、準確地鑒定出批量樣品的基因型,專利技術人前期對15個不同品種的綿羊樣本進行分析研究,獲得3000個位于綿羊基因組的snp位點,并將其制備成液相芯片,以期實現不同綿羊品種的快速鑒定。
2、一方面,本專利技術提供一組綿羊snp位點,所述snp位點如no.1~no.3000所示:
3、
4、
5、
6、
7、
8、
9、
10、
11、
12、
13、
14、
15、
16、
17、
18、
19、
20、
21、
22、
23、
24、
25、
26、所述snp位點定位于綿羊參考基因組ars-ui_ramb_v2.0。
27、進一步,所述snp位點包括:
28、1)阿勒泰羊的snp位點;
29、2)巴爾楚克羊的snp位點;
30、3)巴什拜羊的snp位點;
31、4)巴音布魯克羊的snp位點;
32、5)中國美利奴羊的snp位點;
33、6)策勒黑羊的snp位點;
34、7)哈薩克羊的snp位點;
35、8)和田羊的snp位點;
36、9)柯爾克孜羊的snp位點;
37、10)羅布羊的snp位點;
38、11)吐魯番黑羊的snp位點;
39、12)塔什庫爾干羊的snp位點;
40、13)葉城羊的snp位點;
41、14)多浪羊的snp位點;
42、15)卡拉庫爾羊的snp位點。
43、進一步,所述snp位點由如下步驟篩選:
44、1)測序:將15個不同綿羊品種的血液樣本進行基因組重測序(新疆康普森生物技術有限公司),得到每個樣本的fastq.gz下機數據。
45、2)格式轉換:將fastq.gz下機數據經過fastqc軟件的質量控制、bwa軟件的序列比對、samtools軟件的排序以及去除重復、gatk軟件的變異調用,得到vcf.gz格式文件。
46、3)過濾:利用gatk、bcftools和plink軟件進行過濾,得到等位基因頻率(minorallele?frequency,maf)大于0.1、位點缺失率(missing?rate)小于0.1且哈代-溫伯格平衡檢驗(hardy?weinberg?equilibrium,hwe)p值大于0.001的位點;利用plink軟件去除連鎖位點,條件:窗口大小為50snp、步長為10snp、ld閾值為0.2。
47、4)初篩:利用plink軟件計算群體固定指數(fst),在不同品種綿羊的全基因組范圍內,篩選出每個品種fst最高的前1%snp位點;合并所述前1%snp位點,并去除重復位點;
48、5)復篩:利用python中的隨機森林模型和支持向量機器學習的方法篩選最佳位點,將snp位點的數據集按8:2的比例分為訓練集和測試集,并進行分層抽樣,以保證每個品種在訓練集和測試集的分布比例一致。利用隨機森林模型的特征重要性,選擇最重要的snp特征,控制選擇的特征數量,選擇200、500、1000、2000、3000、4000、5000和10000個特征;設置決策樹的數量為1000;隨機數種子等于0;支持向量分類器(svc)的參數設置:c=[0.01,0.1,1,5,10,100];交叉驗證的折數設置為5。
49、6)剔除:將上述所有符合條件的候選snp位點去除在基因組上無法唯一比對的snp位點、去除側翼序列中包含重復序列的snp位點,之后再對snp位點的間距進行評估,使任意相鄰的兩個snp位點間距大于60bp,以實現探針的合成。
50、另一方面,本專利技術還提供所述snp位點在制備綿羊液相芯片中的應用:將各個snp位點在綿羊參考基因組上前后各延伸60bp,將包括snp位點在內的共計121bp的反向互補序列作為探針序列;合成所述探針序列,得到液相芯片;采用同樣的方法合成其余位點的探針序列,得到綿羊3k液相芯片。
51、基于上述應用,本專利技術還提供一種綿羊3k液相芯片,所述綿羊3k液相芯片利用上述snp位點制備。
52、本法專利技術還請求保護上述綿羊3k液相芯片在綿羊基因分型檢測、品種鑒定、育種和遺傳多樣性分析等方面的應用。
53、與現有技術相比,本專利技術“一種綿羊3k液相芯片及其應用”具有以下有益效果:
54、1)本專利技術從大規模測序數據中挖掘綿羊關鍵功能位點和品種特異位點,篩選出3000個snp位點,所述snp位點均為新發現的snp位點,利用這些snp位點制本文檔來自技高網...
【技術保護點】
1.一組綿羊SNP位點,其特征在于,所述SNP位點如NO.1~NO.3000所示:
2.根據權利要求1所述的SNP位點,其特征在于,包括:
3.根據權利要求2所述的SNP位點,其特征在于,所述SNP位點由如下步驟篩選:
4.權利要求1所述的SNP位點在制備綿羊液相芯片中的應用,其特征在于,將各個SNP位點在綿羊參考基因組前后各延伸60bp,將包括SNP位點在內的共計121bp的反向互補序列作為探針序列;合成所述探針序列,得到液相芯片;采用同樣的方法合成其余位點的探針序列,得到綿羊3K液相芯片。
5.根據權利要求4所述的應用,其特征在于,所述綿羊參考基因組為ARS-Ul?Rambv2.0。
6.一種綿羊3K液相芯片,其特征在于,所述綿羊3K液相芯片利用權利要求1所述的SNP位點制備。
7.權利要求6所述的綿羊3K液相芯片在綿羊基因分型檢測中的應用。
8.權利要求6所述的綿羊3K液相芯片在綿羊品種鑒定中的應用。
9.權利要求6所述的綿羊3K液相芯片在綿羊育種中的應用。
10.權
...【技術特征摘要】
1.一組綿羊snp位點,其特征在于,所述snp位點如no.1~no.3000所示:
2.根據權利要求1所述的snp位點,其特征在于,包括:
3.根據權利要求2所述的snp位點,其特征在于,所述snp位點由如下步驟篩選:
4.權利要求1所述的snp位點在制備綿羊液相芯片中的應用,其特征在于,將各個snp位點在綿羊參考基因組前后各延伸60bp,將包括snp位點在內的共計121bp的反向互補序列作為探針序列;合成所述探針序列,得到液相芯片;采用同樣的方法合成其余位點的探針序列,得到綿羊3k液相...
【專利技術屬性】
技術研發人員:鄭文新,吳偉偉,林長春,宮平,魏佩玲,張蓉銀,邢巍婷,呂雪峰,劉建,馬艷萍,
申請(專利權)人:新疆畜牧科學院畜牧業質量標準研究所新疆維吾爾自治區種羊與羊毛羊絨質量安全監督檢驗中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。