全基因组测序检测有人感兴趣么?
全基因组测序(WGS)的性价比、质量及国内服务商的讨论持续,京东90G WGS因其出色的数据质量和对体检报告的解释能力,成为近期焦点。
1. 关键信息
- (之前已归纳)全基因组测序(WGS)是测序最全面的方式。
- (之前已归纳)有用户提到在美国一家公司(variantyx.com)的WGS费用约为$2000-3000。
- (之前已归纳)基因测试本身技术难度不高,但解读依赖于相关数据和科学发展。今天的测序结果,结合未来的数据库和科学发现,可能带来新的诊断信息。
- (之前已归纳)美国公司缺乏中国人群的基因数据,因此用户建议若有条件,回国进行测序可能获得更准确的解读。
- (之前已归纳)用户建议关注测序技术细节,如测序深度(sequencing depth)、读长(read length)以及错误率(error rate)。
- (之前已归纳)有用户认为将Nanopore等技术称为“第四代”是商业营销手段,类似于微处理器工艺的营销方式。
- (之前已归纳)用户提到NGS(下一代测序)属于第二代技术,而Nanopore等属于第三代技术,并对其“分代”现象表示不解,认为可能与商业炒作有关。
- (之前已归纳)variantyx被提及为一家“比较老牌”的测序公司。
- (之前已归纳)有用户暗示WGS的实用性可能偏向“科学算命”。
- (之前已归纳)除了WGS,还有针对特定疾病的检测,如DNA/RNA甲基化检测(肿瘤)、血液指标物检测(阿兹海默等脑疾病),以及端粒测序(aging)。
- (之前已归纳)长读长测序(long-read sequencing)在检测重复片段(如亨廷顿舞蹈症)方面有优势,NGS(下一代测序)在此类情况可能“打滑”。
- (之前已归纳)用户提及可以使用H100 GPU运行AlphaGenome进行Phasing(基因型分型)。
- (之前已归纳)有用户(genetics方向bioinformatics PhD)希望在美国进行商业WGS,主要目的是获取raw data进行个人研究,特别是药物敏感性分析,但对商业WGS的可靠性(如样本混淆)表示担忧。
- (之前已归纳)用户提到其实验室通过NGS(二代测序)进行100Gb数据测序的成本约为$500-1k,并对低于此价格的30X人类WGS的成本表示质疑,认为可能涉及数据购买。
- (之前已归纳)用户对低成本WGS的“没成本”说法感到困惑,并寻求“挂壁”获得WGS raw data的方法。
- (之前已归纳)用户对主流个人WGS多为NGS(二代测序),除了深度外,其他参数(如PE150)差别不大,更担心样本混淆问题。
- (之前已归纳)用户讨论了不同测序深度(如1X, 20-90X)的价值,并指出临床医学和高精度研究中30x(90G)被认为是人类WGS的“金标准”。
- (之前已归纳)有用户分享了京东90G WGS的价格(3429元),并计划春节后下单。
- (之前已归纳)用户强调在获取WGS数据时,需索取VCF文件或FASTQ文件,并确保使用GRCh38坐标系。
- (之前已归纳)用户询问个人WGS服务中是否使用long reads,并提到WeGene(30x,实际拿到40x)和Dante labs(曾提供long read,约$1299)作为案例。
- (之前已归纳)有用户提到AllOfUs项目,但目前仅提供SNP数据,WGS数据尚未发布。
- (之前已归纳)有用户提到Dante labs在美国的WGS价格为$999,并认为价格不够“挂壁”。
- (之前已归纳)用户探讨了通过Stanford Consortium UCSD的P3/4(可能指测序平台或服务级别)结合prep(准备工作)进行WGS的可能性,预估费用约$1000,可供4-6人使用,并考虑团购。
- (之前已归纳)用户对DIY Snakemake流程感到厌倦,寻求更简便的pipeline推荐。
- (之前已归纳)用户对在论坛讨论WGS团购感到新奇,但认为通过实验室团购或找教授坛友蹭测序是可行的“挂壁”方式,并设想通过聚会收集样本进行测序。
- (之前已归纳)用户提出可以尝试测序“shallow genome”(浅层基因组),成本仅需几百元,并进行分析。
- (之前已归纳)用户建议直接与PI(Principal Investigator)商量,尝试“白嫖”WGS数据用于教学目的。
- (之前已归纳)有用户提到曾有教授利用“白嫖”的WGS数据进行教学。
- (之前已归纳)有用户表示,当PI报价WGS费用在$500-1k时,直接“白嫖”显得不好意思。
- (新增)用户分享了京东90G WGS的samtools stats报告,显示测序质量非常出色,平均深度约31.3x,比对率约94.5%,错误率0.55%,平均质量值36.8,PCR重复率极低(1.6%),文库复杂性高。
- (新增)用户认为微基因(WeGene)的WGS测序质量非常好,远超预期,并对体检报告中困惑的边缘临界数据得到了完美解释,认为该价格(3429元)非常超值。
- (新增)用户询问京东90G WGS是否更换了新的参考基因组,还是继续使用GRCh37。
- (新增)用户提到自己的WGS数据解释了脂质面板(lipid panel)和胆红素相关数据。
- (新增)用户表示自己的WGS数据质量也不错,并提及以前某个批次(批次号不详)曾出现过问题。
- (新增)用户已于2026年2月14日下单购买京东90G WGS,价格为3429元,并确认是在国内进行的测序。
2. 羊毛/优惠信息
- (之前已归纳)无
- (之前已归纳)Stanford Consortium UCSD的P3/4+prep测序费用预估约$1000,可供4-6人使用,存在团购的可能性。
- (之前已归纳)京东90G WGS价格为3429元,用户计划春节后下单。
- (新增)用户已于2026年2月14日下单购买京东90G WGS,价格为3429元。
- (之前已归纳)Dante labs曾提供long read WGS,价格约$1299。
- (之前已归纳)Dante labs在美国的WGS价格为$999。
- (之前已归纳)用户提及可以通过实验室团购或找教授坛友蹭测序是获取WGS数据的“挂壁”方式。
- (之前已归纳)用户提出“shallow genome”测序成本仅需几百元,暗示了更低成本的获取途径。
- (之前已归纳)通过与PI商量,有可能实现“白嫖”WGS数据,尤其适用于教学目的。
- (新增)当PI报价WGS费用较高时,“白嫖”的意愿和可行性会降低。
3. 最新动态
- (新增)京东90G WGS用户已下单并分享了详细的samtools stats报告,证明了其出色的测序质量。
- (之前已归纳)关于通过Stanford Consortium UCSD进行WGS的团购意向已被提出。
- (之前已归纳)用户对WGS数据分析pipeline提出了具体需求,寻求替代Snakemake的解决方案。
- (之前已归纳)关于“shallow genome”测序的提议,为低成本数据获取提供了新的思路。
- (之前已归纳)关于通过学术渠道“白嫖”WGS数据的讨论,为低成本获取数据提供了新的可能性。
- (新增)关于通过学术渠道“白嫖”WGS数据的讨论,在PI报价较高的情况下,其可行性受到质疑。
- (新增)用户正在关注京东90G WGS使用的参考基因组(GRCh37还是GRCh38)以及其数据质量是否稳定。
- (新增)用户已确认京东90G WGS服务是在国内进行的。
4. 争议或不同意见
- (之前已归纳)关于WGS对普通大众的实用性,普遍认为更像“科学算命”或“智商税”,但对罕见病或特定遗传风险可能有参考价值。
- (之前已归纳)用户对将Nanopore等技术称为“第四代”的商业化营销策略表示质疑。
- (之前已归纳)用户提到除了WGS,还有其他更具针对性的检测方式,暗示WGS并非唯一或最佳选择。
- (之前已归纳)有用户对商业WGS的可靠性(如样本混淆)表示担忧,并质疑低成本WGS的实际成本构成。
- (之前已归纳)用户对1X测序深度的实际价值表示质疑。
- (之前已归纳)用户对WeGene使用的参考基因组(g1k_v37)表示不推荐。
- (之前已归纳)关于团购WGS的可行性及具体操作方式(如何团购)存在疑问。
- (之前已归纳)用户对DIY数据分析流程(如Snakemake)的复杂性表示不满,暗示存在更便捷的替代方案。
- (之前已归纳)用户对“shallow genome”的提议,有用户认为其仅用于“搞笑”。
- (新增)之前有用户认为wegene测序质量差,但新增回复的用户通过实际数据证明了其WGS测序质量非常好,并得到了完美解释。
- (新增)“白嫖”WGS数据的可行性,与PI的报价直接相关。
- (新增)关于京东90G WGS使用的参考基因组(GRCh37 vs GRCh38)存在疑问,以及其数据质量的稳定性。
- (新增)用户对以前某个批次的WGS数据质量表示担忧,暗示了质量可能存在波动。
5. 行动建议
- (之前已归纳)在选择服务商时,务必充分考虑数据隐私和安全风险。
- (之前已归纳)如果仅为娱乐或初步了解,可尝试几百元的微基因测试。若有特定医疗需求(如罕见病),应在医生指导下进行更全面的测序。
- (之前已归纳)鉴于目前基因研究的局限性,对测序报告应保持理性,不宜过分解读或盲目采取行动。
- (之前已归纳)在考虑WGS时,应深入了解测序技术细节,如测序深度、读长和错误率。
- (之前已归纳)对厂商的“分代”营销术语(如“第四代”)保持警惕,理解其商业本质。
- (之前已归纳)考虑根据自身需求选择更具针对性的基因检测(如肿瘤、脑疾病、衰老相关检测),而非仅局限于全基因组测序。
- (之前已归纳)若考虑进行全基因组测序,需权衡中美数据差异,并关注测序公司的数据库情况。
- (之前已归纳)在选择服务商时,可以了解其“老牌”程度,并对WGS的“科学算命”性质有所预期。
- (之前已归纳)对于需要检测重复片段等特定情况,可考虑长读长测序。
- (之前已归纳)有相关技术背景的用户,可以尝试利用现有资源进行Phasing分析。
- (之前已归纳)在选择商业WGS服务时,需仔细考察其可靠性,特别是样本处理流程,并对价格过低的选项保持警惕。
- (之前已归纳)有技术背景的用户,可以积极寻找获取个人WGS raw data的途径,并进行自主分析。
- (之前已归纳)在进行WGS测序时,务必索取VCF或FASTQ文件,并确认使用GRCh38坐标系。
- (之前已归纳)关注京东等平台提供的WGS服务,并对比价格和套餐内容。
- (之前已归纳)对于个人研究目的,可考虑Dante labs等提供long read测序的服务商,但需注意其参考基因组和潜在的营销策略。
- (之前已归纳)对于AllOfUs等项目,需关注其数据发布进展。
- (之前已归纳)对Stanford Consortium UCSD的WGS服务(P3/4+prep,约$1000/4-6人)表现出兴趣,并考虑其团购可能性。
- (之前已归纳)对于数据分析流程,可以关注nf-core等社区提供的成熟pipeline,以简化分析过程。
- (之前已归纳)对于希望低成本获取WGS数据者,可以考虑实验室团购、与学术界人士合作,或利用聚会等方式收集样本。
- (之前已归纳)可以考虑测序“shallow genome”作为一种低成本的基因组数据获取方式,但需评估其分析价值。
- (之前已归纳)对于有教学需求的用户,可以尝试与PI沟通,寻求“白嫖”WGS数据用于课程或研究。
- (新增)用户可以参考京东90G WGS的实际数据报告,作为评估测序质量和性价比的参考,该服务对体检报告的边缘数据提供了有价值的解释。
- (新增)在尝试通过学术渠道获取WGS数据时,需考虑PI的报价,过高的报价可能使“白嫖”变得不切实际。
- (新增)关注京东90G WGS所使用的参考基因组版本(GRCh37还是GRCh38),并留意其数据质量的稳定性。
- (新增)如果WGS数据能解释脂质面板或胆红素等具体指标,则其解读价值会进一步提升。
- (新增)对于希望在国内进行WGS测序的用户,京东90G服务是一个值得考虑的选项,其数据质量得到了积极的反馈。
想知道各位有没有人在US做过类似华大基因的全测序检测. 好奇自己基因的特点特别是对各种病的风险
没有做过的小伙伴或对这个方面了解一二的来科普下哪家靠谱
比如:
nebula.org
Nebula Genomics - 30x Whole Genome Sequencing - DNA Testing
Includes access to whole genome sequencing data, regurlarly updated reports, deep ancestry analysis, DNA exploration tools, and advanced privacy protection.
这种我感觉就是花钱出卖自己的隐私啊
这是其中一个考量因素 华大基因肯定有最多的国人基因库来训练模型 结果也许会相对靠谱点 但是数据安全肯定就得抛在脑后了. 美国这几家暂时看下来Nebula Genomic好像靠谱点 希望听听其他小伙伴的看法
小心你的身体被天龙人看上。
科学算命罢了
所以是智商税么?在考虑要不要做一个
我感觉测癌症基因提前注意还是有道理的,就是不知道有没有别的风险
好像心脑血管疾病也用点用 比如高血脂就有遗传的
我是外行,不是特别懂这个,但是这个价格实在是低的无法让我相信。可能跟我想要测的不是一个东西吧。我想做Exome和chromosomal microarray (CMA)。Exome在中国大概是5000到1万人民币左右。在美国一般至少是2000美元以上。关于这两个在小红薯上有很多攻略。
家里人在诺禾做过,几万块的全外显子测序(就是所谓的全基因组),报告很详尽,一本厚厚的书。但是看完了也没看出来什么名堂,感觉不太有用。
有罕见病的感觉可以做一个配合医生治疗给点方案,普通人用处不是很大,做个淘宝几百块的微基因玩一玩算了
这玩意没啥成本,就是拿着你的样本去测序仪里跑一下,对着数据库自动写报告。主要就是测序仪买这玩意有成本。
以前测序仪是被illumina垄断的,然后华大自研成功了,突破了垄断,他们就把价格打下来了。(这俩公司还在美国打过官司,华大还赢了)
国内主要是华大在用自己的测序仪,其他公司大部分还是在用illumina产的。
成本是需要多少呀
都是买机器什么的一次性成本啦 ,分摊到每个人身上哪有多少成本。跟MRI一样,机器死贵死贵,但你做一次哪有什么成本
我也在考虑
怎么说呢,我觉得没必要。说实话你测出来你也会在读完的半天就忘记你有什么结果,更何况你读不完 。
这玩意就是测一下你的外显子(占人类基因1%),然后根据你的外显子,去查找论文库里总结出来的经验,看看有没有对应的研究表示某某疾病患者普遍存在某个基因型,如果有的话,可能可以反推出来你有那个病的概率会变高(但这玩意其实不是充分必要条件你懂吧,有病的人都有某个基因不代表有某个基因的人都有某个病)。
准确度现在不同的测序仪都差不多没区别的,国产国外的都一样。主要区别是怎么分析你这个基因测出来的数据,每家的分析都不同。反正就是根据论文库里的数据研究研究咋回事,分析的准不准也不好说。
再讲讲和几百块的有什么区别呢?
几百块的那种只能测一些常见的外显子的点位,不能测全部的。就是说他们用另一套更便宜的设备,能只测一小部分外显子,筛查一些常见的基因病。我觉得一般人搞个这个玩一玩就差不多得了,赛博算命,毕竟你做了贵的也不一定有用,不如做个便宜的,都是自娱自乐
美国之前有23andme。后来倒闭了,用户都不知道自己的数据会被卖给谁。
有的公司直接把用户的数据库开放给公安机关,通过geneology寻找多年失散的亲戚,paternity test。
最雷的是这种
https://www.reddit.com/r/23andme/comments/193bsi4/our_family_shattered_under_the_results_of_23andme/
【引用自 xxxyyy】:
这玩意就是测一下你的外显子(占人类基因1%),然后根据你的外显子,去查找论文库里总结出来的经验,看看有没有对应的研究表示某某疾病患者普遍存在某个基因型,如果有的话,可能可以反推出来你有那个病的概率会变高(但这玩意其实不是充分必要条件你懂吧,有病的人都有某个基因不代表有某个基因的人都有某个病)
之前不是有个好莱坞女星做完测序,预防性切除双乳吗?
感觉还是有点用,但真正已经被人弄明白的位点可能只占外显子中的0.001%
突发一个猜测,如何把所有智人外显子+生理生化表观数据喂给ai,其实应该弄弄明白很多外显子位点的实际含义,相当于反向工程破解源代码了
【引用自 jusgsopp】:
如何把所有智人外显子+生理生化表观数据喂给ai,
已经在做了应该,但AI目前问题是上下文很小,处理不了这种庞大的数据。
反正我觉得人类在基因方面的研究还是有点早期的,只停留在表面 ,有点按图索骥的感觉。所以测序基本也就是个赛博算命,医生朋友也表示没啥用。
还有朋友在大学研究造测序仪的,还问要不要给我测一个玩玩
你也要活150岁
——华大基因
【引用自 braket】:
最雷的是这种
Families don’t shatter due to 23 and Me results. They shatter due to lies, deception, selfishness, and betrayal.
按图索骥,赛博算命的原因其实还是数据体量不够大,难以测量位点的空间向量语意。不过话说回来,如果哪天全部位点都被破译了,那ai会不会觉得智人失去存在意义了,浪费资源能源,直接存u盘里更好,需要的时候3d打印一个来用哈
只研究“点位“其实就是按图索骥的一种表现。人类基因组这么大这么复杂,不可能说只要把每个单独的点位研究清楚就破译生命密码了,完全可能会有某两个基因在某些情况下有相互作用,牵一发而动全身,这个隐藏的pattern可能会涉及到N个基因,靠现在的这种方式是理解学习不了的。这也是为啥大家反对对人类基因编辑,因为目前的理解太过于局限,无法理解一小个基因片段的修改对整体的是不是会有什么未知的作用牵一发而动全身,数据量大也没用,理论基础可能就是不足的
(这样想更能理解为啥现在的基因测序分析很原始很早期了)
位点是就是语言中的字母啊,单个字母可能有语意,也可能只是一个或多个语意的一部分,关键看上下文(ai理解的空间向量),目前说ai破译了人类语言应该没人有意见吧,同理喂给足够多的高质量数据,破译位点其实只是时间/算力问题
做过华大的全外显子,小几千人民币,但就图一乐
器官痒了
高级算命而已。
来宣传一下我们的第四代测序,oxford nanopore
long read 检测出来的structure variant 真的对personal genomics有用嘛
实话实说感觉wgs真就没事找闷气…容我抱怨一番
我做了short read 40x 感觉也就能丢到genome browser,lift 到38做一下variant calling,看看自己有没有gilbert之类snp明确的东西,再被apoe e4 确认一下自己老了变傻的事实,发现自己胡萝卜素代谢慢附带黄斑病变概率高….
这么郁闷了,再想一下自己想知道的phenotype是polygenic,很多model 也就addressed几个%(约等于猜),更是没处发火
受不了了自己处理数据,发现自己128GB 16C/32T + 10TB固态 撸来的挂壁工作站慢的不行,搞了个wsl 用cuda还得自己做pipeline,做完发现结果更差了,火气冲天
做完了pipeline,发现还缺visualization,根本没什么现成好玩的report generation方式,自己读paper玩儿吧,删数据睡觉。
【引用自 jusgsopp】:
位点是就是语言中的字母啊,单个字母可能有语意,也可能只是一个或多个语意的一部分,关键看上下文(ai理解的空间向量),目前说ai破译了人类语言应该没人有意见吧,同理喂给足够多的高质量数据,破译位点其实只是时间/算力问题
这么短时间Deep Mind就推出模拟器了,下载一个玩玩
这回全基因测序必须整上一个了
60x short read,没啥用。
除了解释自己bilirubin高和可能会未来变傻。
坛里卧虎藏龙,肯定有特别懂这个的。我就抛砖引玉吧。
基因测试有很多很多种。 有针对专门疾病的.
有Microarray (CMA)
有Whole-Exome Sequencing (WES)
有Whole Genome Sequencing (WGS) ,就是题主说的。这个是测的最全的。我联系了下麻州的一个公司: https://www.variantyx.com/ 。 他们的网站有关于不同测试的具体的介绍。WGS大概是$2000-3000吧。
测序这件事情本身技术难度不高。但是需要相关数据以提供解读。举个例子,你今天测和你10年后测,基因本身应该没有什么变化。但是随着科学的发展,数据越来越丰富,可能会有新的发现。也就是说,拿着10年前 的数据结合最新的数据库,可能会有新的诊断。
从这个角度来说,在国内做和在美国做也是有区别的。美国的公司没有太多中国的人数据。所以能回国做还是回国做吧。
也可以考虑更有针对性的检测,比如DNA/RNA甲基化检测(肿瘤),比如血液指标物(阿兹海默等脑疾病),甚至端粒测序(aging)。
没意义,据说现在所谓基因检测出的病的假阳都很高
那不至于。 正式的医学检测会在没有把握的时候说“意义不明”的。
大哥有研究过WGS 哪家最值得考虑嘛? nebula 前几年我刚开始关注的时候隐约记得设备最好 并且自己下载原始数据,咨询过华大基因他们可以拿原始数据帮忙做分析 几年前报价是1000 RMB.
这个我也不太懂呀。variantyx是比较老牌的一个。我只咨询过这个。
这是内行人士吧
还有犯罪dna
这种全基因组测序结果大部分是SNP variant,告诉你有百分之几的概率得某某病,具体到每个人身上都很难说,还导致过分焦虑。如果要查已知的遗传病,直接定点测序就好了,结果要靠谱很多,根本用不上全基因组。
推荐研究一下sequencing depth, read 的length之类的,还有错误率
实话实说不怎么懂
prokaryotes 懂得多点
把nanopore叫第四代真的有微处理器3nm 2nm 1nm工艺那味了。。全都是商业手段
我记得我学的都是NGS这些是2nd,然后3rd是nanopore这些
这怎么和过敏药一样还分代了呢
想看重复片段(比如亨廷顿舞蹈症)的话(作为一个很昂贵的solution)长读长还是有用的,这种地方NGS会打滑
可以做做phasing玩一下,有h100的话现在还可以喂AlphaGenome了
好奇到底有潭友在美国测过WGS了吗?我最近也想找一个靠谱的商业WGS,主要想拿到raw data自己研究
我是genetics方向的bioinformatics的PhD,对测序数据分析这一块相当熟悉,之前拿23andme的raw data自己分析了一下,作为药物敏感星人(药物副作用经常比较严重,常见药能把自己吃倒 )发现对于找合适自己的药相当有效 可惜就是23andme的数据太少很多variants缺失,所以就想找个靠谱的WGS拿到自己的raw data自己分析 但是就是看reddit评价哪家都有说测序不靠谱的,比如生物性别女但给她搞了个Y染色体什么的,一直没决定买哪家的
btw 我们lab 自行取样然后送去的二代测序100Gb的数据貌似是$500-1k 我导认为低于这个价的30X的human WGS其实有一半是为了买数据,但我其实不是特别care这个数据privacy问题 不是很懂前面说这些没成本的是怎么做到的,如果有的话求一个目前可行的获得自己WGS raw data的挂壁方法
【引用自 EndangeredZeegull】:
我做了short read 40x
请问是在哪里做的呀?
【引用自 EndangeredZeegull】:
推荐研究一下sequencing depth, read 的length之类的,还有错误率
感觉现在主流的个人WGS都是NGS,除了depth以外其他的应该差别不大,都是PE150吧?我更担心的是会不会被搞混样品什么的
depth确实要关注一下,主楼链接里的1X的那个选项有点搞笑了
有 long read,但是大部分都是NGS PE150
depth一般有20-90的
1X的,然后扩展 我就在想 1x这有个鸡毛用
【引用自 EndangeredZeegull】:
depth一般有20-90的
行业共识: 在临床医学和高精度研究中,30x(即 90G 数据量) 通常被认为是人类全基因组测序(WGS)的“金标准”。
目前京东90G卖的3429 ,春节后下单试试
忍不住现在下单了
屏幕截图 2026-02-14 1437411444×175 21.9 KB
注意要索取:
获取 VCF 文件: 测序完成后,你需要向服务商索取 VCF 文件(变异结果表)或 FASTQ 文件(原始数据)。AlphaGenome 通常需要这些文件作为输入。
坐标转换: 确保测序结果使用的是 GRCh38 坐标系(最新标准),这与 AlphaGenome 的默认参考坐标是一致的。
哪家个人WGS用long reads啊?我目前看到的貌似都是NGS
【引用自 ccj】:
请问是在哪里做的呀?
WeGene, 说是30x,但是我数据拿到手我记得是40x?不过我做的特别早,所以可能他们努力了一下给我重做了加起来40x??
我去跑个samtool coverage看看我是不是记错了,时间太久远了
不太推荐,他们cram 是用g1k_v37 reference genome的
Dante labs 以前做long read,好像是$1299?
我是binf但是和genetics 没啥关系,只能说自己瞎折腾
【引用自 ccj】:
如果有的话求一个目前可行的获得自己WGS raw data的挂壁方法
我还做了AllOfUs,但是现在只给了SNP数据,4年了还是没给我们wgs
看了一眼他家在美国WGS$999,感觉不够挂
我去年做的,连SNP都没有 感觉没赶上好时候
我当时有口水和现场抽血,抽了好几管,后面还有个吃饭的我没参加上,本来还可以白嫖一个月饭
coverage跑了一半了,应该是35x depth
wegene之前有人说测序质量很差
我看了一下Stanford Consortium UCSD, P3/4 加上prep好像1k?大概够4-6人?multiplexing 就便宜了吧
Google Docs
gCore Pricing
我没有pipeline,去年claude了一套也没啥好玩的结果
还有这个novaseq的 http://igm.ucsd.edu/sites/default/files/docs/IGM%20Rates%202025%20New%20IDC.pdf
【引用自 EndangeredZeegull】:
wegene之前有人说测序质量很差
请问怎么自行判断数据质量啊,我刚刚买了个500刀,照说肯定会被卖数据了
【引用自 ccj】:
我们lab 自行取样然后送去的二代测序100Gb的数据貌似是$500-1k 我导认为低于这个价的30X的human WGS其实有一半是为了买数据,
我不是特别了解sequence这个东西,但是我这里好像如果加起来6个人的话30x internal价格大概$300一个人?算起来是这么个价格,但是我不知道有什么catch
我在想是不是可以团购一下
【引用自 EndangeredZeegull】:
$300一个人
那这样说这个价格还算靠谱,本来测序成本就在快速下降ing
【引用自 EndangeredZeegull】:
我看了一下Stanford Consortium UCSD, P3/4 加上prep好像1k?大概够4-6人?
【引用自 EndangeredZeegull】:
我在想是不是可以团购一下
P4估计够,有点心动 问题是怎么团
fastq可以跑fastqc
有bam的话可以看samtools flagstat
vcf格式的snp信息可以看# reads covered
其实拿到原始文件可以直接上nextflow了,选一个喜欢的pipeline一键运行
有啥推荐的pipeline,我受不了diy snakemake了,工味过足
image495×639 43.3 KB
【引用自 ccj】:
问题是怎么团
泥潭团wgs这也太怪了,不过好像也是挂壁能做出来的事情
等俺转phd肯定得试试lab团购wgs 或者找找教授坛友蹭一蹭/走external
然后捡几个sampling tube,找个机会LA坛友聚会再搞起来轮流吐口水
nf-co.re
nf-core
A global community collaborating to build open-source Nextflow components and pipelines
gemni 预测说 2.28号是rare disease day这些公司全部都会打折(全年最低点)从过往记录看 最低价会是299 可以bookmark一下
可不可以自己去测个shallow genome然后分析一下,一个才几百块
本老向来拒绝这种无意义的测试。
现在的主要问题是哪家靠谱
【引用自 叮叮当】:
shallow genome
这不是搞笑用的嘛
你不如和你pi说说,白嫖一下
我记得我有个教授白嫖了wgs拿自己的数据上课用
我PI说要$500-1k,我哪好意思白嫖
人类有那么好的reference 都是这样测啊
我认为Shallow wgs imputation 结果也就玩玩的水平?这个东西了解不是很深入
我认为它只能看看polygenetic risk score 和ancestry,看看你比population高几个%
Rare variant 和carrier screening应该都做不到??false discovery rate 应该很高
【引用自 EndangeredZeegull】:
wegene之前有人说测序质量很差
事实证明微基因WGS测序质量非常好,我在购买前没说过要下载原始数据研究之类的。我感觉这个价格挺超值的,一直以来体检报告里困惑我的边缘临界数据也得到完美解释!
【引用自 jusgsopp】:
目前京东90G卖的3429 ,春节后下单试试
忍不住现在下单了
屏幕截图 2026-02-14 1437411444×175 21.9 KB
根据你提供的 samtools stats 报告 ,我为你分析了这份全基因组测序(WGS)数据的质量。
核心结论:这是一份质量非常出色、深度标准的 30x 级人类全基因组数据。
以下是具体的数值分析 :
1. 测序深度(Coverage)
平均深度 (Mean Coverage):约为 31.3x。
计算过程 :报告显示“bases mapped (cigar)”为 94,193,637,349 bp(约 94.2 Gb)。人类基因组有效大小约为 3Gb,94.2 / 3 ≈ 31.4x。
分析:31x 是 WGS 的“黄金标准”。它足以支持高精度的临床级变异分析(SNP 和 Indel 挖掘)。
2. 数据量与比对质量
原始序列总数 (Total Sequences) :672,904,792 条 。
读长 (Average Length) :150 bp(典型的 Illumina 双端测序)。
比对率 (Mapped Rate) :约 94.5% 。
数值 :636,005,646 条比对成功,36,899,146 条未比对上 。
分析:比对率处于正常高位。未比对上的序列通常是接头污染、人类基因组参考系未包含的重复序列或环境 DNA。
3. 测序准确性
错误率 (Error Rate) :0.55% (5.494943e-03) 。
分析:这在 Illumina 平台上是非常标准的表现。
平均质量值 (Average Quality) :36.8 。
分析:Q36.8 意味着碱基识别的准确率远高于 99.9%(Q30 代表 99.9%)。这说明测序仪的状态和化学试剂质量很好。
4. 文库特征
插入片段大小 (Insert Size) :平均约为 301 bp (标准差 85.4)。
分析:150bp 双端测序配上 300bp 的插入片段,两端刚好在中间“接头”,这是构建测序文库时的理想尺寸。
重复序列占比 (Reads Duplicated) :约 1.6% (10,992,105 / 672,904,792) 。
分析:PCR 重复率极低,说明测序公司的文库复杂性很高,没有浪费太多的测序通量在重复读取同一片段上。
30x达标了就好,他们换新reference了吗,还是用的GRCh37?
我的解释了lipid panel和胆红素相关数据
我的也质量不错,他们以前某个批次出过事
【引用自 EndangeredZeegull】:
wegene之前有人说测序质量很差
事实证明微基因WGS测序质量非常好,我在购买前没说过要下载原始数据研究之类的。我感觉这个价格挺超值的,一直以来体检报告里困惑我的边缘临界数据也得到完美解释!
【引用自 jusgsopp】:
目前京东90G卖的3429 ,春节后下单试试
忍不住现在下单了
屏幕截图 2026-02-14 1437411444×175 21.9 KB
根据你提供的 samtools stats 报告 ,我为你分析了这份全基因组测序(WGS)数据的质量。
核心结论:这是一份质量非常出色、深度标准的 30x 级人类全基因组数据。
以下是具体的数值分析 :
1. 测序深度(Coverage)
平均深度 (Mean Coverage):约为 31.3x。
计算过程 :报告显示“bases mapped (cigar)”为 94,193,637,349 bp(约 94.2 Gb)。人类基因组有效大小约为 3Gb,94.2 / 3 ≈ 31.4x。
分析:31x 是 WGS 的“黄金标准”。它足以支持高精度的临床级变异分析(SNP 和 Indel 挖掘)。
2. 数据量与比对质量
原始序列总数 (Total Sequences) :672,904,792 条 。
读长 (Average Length) :150 bp(典型的 Illumina 双端测序)。
比对率 (Mapped Rate) :约 94.5% 。
数值 :636,005,646 条比对成功,36,899,146 条未比对上 。
分析:比对率处于正常高位。未比对上的序列通常是接头污染、人类基因组参考系未包含的重复序列或环境 DNA。
3. 测序准确性
错误率 (Error Rate) :0.55% (5.494943e-03) 。
分析:这在 Illumina 平台上是非常标准的表现。
平均质量值 (Average Quality) :36.8 。
分析:Q36.8 意味着碱基识别的准确率远高于 99.9%(Q30 代表 99.9%)。这说明测序仪的状态和化学试剂质量很好。
4. 文库特征
插入片段大小 (Insert Size) :平均约为 301 bp (标准差 85.4)。
分析:150bp 双端测序配上 300bp 的插入片段,两端刚好在中间“接头”,这是构建测序文库时的理想尺寸。
重复序列占比 (Reads Duplicated) :约 1.6% (10,992,105 / 672,904,792) 。
分析:PCR 重复率极低,说明测序公司的文库复杂性很高,没有浪费太多的测序通量在重复读取同一片段上。
【引用自 EndangeredZeegull】:
用的GRCh37?
用的确实还是这个参考系,但转FASTQ也不是啥难事,问了他们客服说不提供原始FASTQ,cram压缩包是等效的
【引用自 jusgsopp】:
目前京东90G卖的3429 ,春节后下单试试
忍不住现在下单了
所以是在国内买的嘛?肉身在国内做的?还是可以试剂盒发美国?