匿名
未登录
登录
医学百科
搜索
查看“Picard”的源代码
来自医学百科
名字空间
页面
更多
更多
语言
页面选项
Read
查看源代码
历史
←
Picard
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看和复制此页面的源代码。
<div style="padding: 0 4%; line-height: 1.8; color: #1e293b; font-family: 'Helvetica Neue', Helvetica, 'PingFang SC', Arial, sans-serif; background-color: #ffffff; max-width: 1200px; margin: auto;"> <div style="margin-bottom: 30px; border-bottom: 1.2px solid #e2e8f0; padding-bottom: 25px;"> <p style="font-size: 1.1em; margin: 10px 0; color: #334155; text-align: justify;"> <strong>Picard</strong> 是一套基于 <strong>[[Java]]</strong> 开发的命令行工具集,由 <strong>[[Broad Institute]]</strong> 基因组测序平台开发并维护。它专门用于处理和分析高通量测序(HTS)数据,特别是 <strong>[[SAM]]</strong> / <strong>[[BAM]]</strong> / CRAM 格式的比对文件。 <br>在生物信息学分析流程中,Picard 被誉为处理 SAM/BAM 文件的“瑞士军刀”。它弥补了 <strong>[[Samtools]]</strong> 在某些高级功能上的不足,特别是在<strong>去除 PCR 重复</strong>(MarkDuplicates)和<strong>添加测序组信息</strong>(AddOrReplaceReadGroups)方面,是 <strong>[[GATK]]</strong> 最佳实践流程(Best Practices)中不可或缺的预处理工具。 <br>Picard 能够计算丰富的质控(QC)指标(如插入片段大小、GC 偏好性),帮助研究人员评估测序库的质量。 </p> </div> <div class="medical-infobox mw-collapsible mw-collapsed" style="width: 100%; max-width: 320px; margin: 0 auto 35px auto; border: 1.2px solid #bae6fd; border-radius: 12px; background-color: #ffffff; box-shadow: 0 8px 20px rgba(0,0,0,0.05); overflow: hidden;"> <div style="padding: 15px; color: #1e40af; background: linear-gradient(135deg, #e0f2fe 0%, #bae6fd 100%); text-align: center; cursor: pointer;"> <div style="font-size: 1.2em; font-weight: bold; letter-spacing: 1.2px;">Picard</div> <div style="font-size: 0.7em; opacity: 0.85; margin-top: 4px; white-space: nowrap;">SAM/BAM Manipulation Tools (点击展开)</div> </div> <div class="mw-collapsible-content"> <div style="padding: 25px; text-align: center; background-color: #f8fafc;"> <div style="font-size: 0.8em; color: #64748b; margin-top: 12px; font-weight: 600;">测序数据的“净化器”</div> </div> <table style="width: 100%; border-spacing: 0; border-collapse: collapse; font-size: 0.85em;"> <tr> <th colspan="2" style="padding: 8px 12px; background-color: #e0f2fe; color: #1e40af; text-align: left; font-size: 0.9em; border-top: 1px solid #bae6fd;">软件档案</th> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0; width: 40%;">开发者</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">[[Broad Institute]]</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">编写语言</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;">[[Java]]</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">开源协议</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #16a34a;">MIT License</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">核心依赖</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">HTSJDK</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">操作对象</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">SAM, BAM, VCF</td> </tr> <tr> <th colspan="2" style="padding: 8px 12px; background-color: #e0f2fe; color: #1e40af; text-align: left; font-size: 0.9em; border-top: 1px solid #bae6fd;">王牌功能</th> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">去重</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #e11d48;">[[MarkDuplicates]]</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">表头处理</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #1e40af;">AddOrReplaceReadGroups</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569; border-bottom: 1px solid #e2e8f0;">质控统计</th> <td style="padding: 6px 12px; border-bottom: 1px solid #e2e8f0; color: #0f172a;">CollectInsertSizeMetrics</td> </tr> <tr> <th style="text-align: left; padding: 6px 12px; background-color: #f8fafc; color: #475569;">格式转换</th> <td style="padding: 6px 12px; color: #1e40af;">SamToFastq</td> </tr> </table> </div> </div> <h2 style="background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;">GATK 的“开路先锋”</h2> <p style="margin: 15px 0; text-align: justify;"> 在运行 GATK 进行变异检测之前,原始的比对文件(BAM)必须经过严格的“清洗”和“标准化”,这正是 Picard 的主战场。 </p> <div style="overflow-x: auto; margin: 20px auto;"> <table style="width: 100%; border-collapse: collapse; border: 1.2px solid #cbd5e1; font-size: 0.9em; text-align: left;"> <tr style="background-color: #f1f5f9; border-bottom: 2px solid #0f172a;"> <th style="padding: 12px; border: 1px solid #cbd5e1; color: #0f172a; width: 30%;">核心命令</th> <th style="padding: 12px; border: 1px solid #cbd5e1; color: #1e40af; width: 35%;">功能描述</th> <th style="padding: 12px; border: 1px solid #cbd5e1; color: #475569; width: 35%;">生物学意义</th> </tr> <tr> <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">MarkDuplicates</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">识别并标记 <strong>PCR 重复</strong>(Duplicates)。</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">防止因扩增偏好导致的变异频率(AF)计算错误,避免假阳性。</td> </tr> <tr> <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">AddOrReplaceReadGroups</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">为 BAM 文件添加 <strong>Read Group (@RG)</strong> 头信息。</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">GATK 必须依赖 RG 标签来区分不同的样本、文库和测序通道(Lane)。</td> </tr> <tr> <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">CollectInsertSizeMetrics</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">统计双端测序的<strong>插入片段</strong>长度分布。</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">评估建库质量。若插入片段过短,可能导致测序 Reads 读通接头(Adapter)。</td> </tr> <tr> <td style="padding: 10px; border: 1px solid #cbd5e1; font-weight: 600;">LiftOverIntervalList</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">将基因组坐标在不同版本间(如 hg19 -> hg38)转换。</td> <td style="padding: 10px; border: 1px solid #cbd5e1;">实现旧数据的复用,使其能与新参考基因组进行比对。</td> </tr> </table> </div> <h2 style="background: #f1f5f9; color: #0f172a; padding: 10px 18px; border-radius: 0 6px 6px 0; font-size: 1.25em; margin-top: 40px; border-left: 6px solid #0f172a; font-weight: bold;">Picard vs. Samtools:瑜亮之争?</h2> <p style="margin: 15px 0; text-align: justify;"> 两者都是处理 BAM 文件的神器,但侧重点不同。现代生信流程中常结合使用:用 <strong>[[BWA]]</strong> 比对,用 <strong>[[Samtools]]</strong> 排序/索引,用 <strong>Picard</strong> 去重/质控。 </p> <div style="background-color: #f0f9ff; border-left: 5px solid #1e40af; padding: 15px 20px; margin: 20px 0; border-radius: 4px;"> <ul style="margin: 0; padding-left: 20px; color: #334155;"> <li style="margin-bottom: 12px;"><strong>Samtools (C语言):</strong> <br>• 优势:<strong>速度快</strong>,内存占用小。 <br>• 擅长:排序 (Sort)、索引 (Index)、查看 (View)、切片 (Slice)。</li> <li style="margin-bottom: 0;"><strong>Picard (Java):</strong> <br>• 优势:<strong>功能复杂</strong>,可扩展性强,与 GATK 兼容性完美。 <br>• 擅长:复杂的逻辑操作(如跨染色体的去重)、详细的统计报告、Header 修复。</li> </ul> </div> <div style="font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 50px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #f8fafc; border-radius: 0 0 10px 10px;"> <span style="color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;">关键相关概念 [Key Concepts]</span> <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;"> <strong>1. PCR Duplicates (PCR 重复):</strong> 在建库过程中,同一个 DNA 片段被 PCR 扩增多次,产生完全相同的 Reads。这些重复会人为放大该片段上的测序错误(假阳性),或干扰变异频率计算,必须使用 Picard 标记并忽略。 </p> <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;"> <strong>2. Read Group (@RG):</strong> BAM 文件的“身份证”。包含 <code>ID</code> (唯一标识), <code>SM</code> (样本名), <code>LB</code> (文库名), <code>PL</code> (测序平台)。GATK 在进行 <strong>[[VQSR]]</strong> 和 <strong>[[BQSR]]</strong> 时,完全依赖 RG 信息来对不同样本进行分组建模。 </p> <p style="margin: 12px 0;"> <strong>3. HTSJDK:</strong> Picard 的底层核心库。它定义了 Java 操作 SAM/BAM/VCF 文件的 API 接口。许多其他的 Java 生信工具(包括 GATK)都依赖于 HTSJDK。 </p> </div> <div style="font-size: 0.92em; line-height: 1.6; color: #1e293b; margin-top: 20px; border-top: 2px solid #0f172a; padding: 15px 25px; background-color: #ffffff;"> <span style="color: #0f172a; font-weight: bold; font-size: 1.05em; display: inline-block; margin-bottom: 15px;">学术参考文献 [Academic Review]</span> <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;"> [1] <strong>Broad Institute. (GitHub).</strong> <em>Picard Tools Documentation.</em> <strong>[[GitHub / Broad]]</strong>. <br> <span style="color: #475569;">[点评]:Picard 官方并未发表独立的学术论文,其文档和源码库是引用的主要来源。通常在论文中引用为 "Picard toolkit, Broad Institute, GitHub Repository".</span> </p> <p style="margin: 12px 0; border-bottom: 1px solid #e2e8f0; padding-bottom: 10px;"> [2] <strong>Van der Auwera GA, et al. (2013).</strong> <em>From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline.</em> <strong>[[Curr Protoc Bioinformatics]]</strong>. <br> <span style="color: #475569;">[点评]:详细描述了 GATK 最佳实践流程,其中 Picard 的预处理步骤(MarkDuplicates 等)被确立为标准操作。</span> </p> </div> <div style="margin: 40px 0; border: 1px solid #e2e8f0; border-radius: 8px; overflow: hidden; font-family: 'Helvetica Neue', Arial, sans-serif; font-size: 0.9em;"> <div style="background-color: #eff6ff; color: #1e40af; padding: 8px 15px; font-weight: bold; text-align: center; border-bottom: 1px solid #dbeafe;"> 生物信息学 · 知识图谱 </div> <table style="width: 100%; border-collapse: collapse; background-color: #ffffff;"> <tr style="border-bottom: 1px solid #f1f5f9;"> <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">上级分类</td> <td style="padding: 10px 15px; color: #334155;">[[生物信息学]] • 数据处理工具</td> </tr> <tr style="border-bottom: 1px solid #f1f5f9;"> <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">核心功能</td> <td style="padding: 10px 15px; color: #334155;">[[MarkDuplicates]] • [[QC]] • 格式转换</td> </tr> <tr> <td style="width: 85px; background-color: #f8fafc; color: #334155; font-weight: 600; padding: 10px 12px; text-align: right; vertical-align: middle;">协作软件</td> <td style="padding: 10px 15px; color: #334155;">[[GATK]] (下游) • [[Samtools]] (平级) • [[BWA]] (上游)</td> </tr> </table> </div> </div>
返回至
Picard
。
导航
导航
症状百科
疾病百科
药品百科
中医百科
中药百科
人体穴位图
全国医院列表
功能菜单
最近更改
随机页面
Wiki工具
Wiki工具
特殊页面
页面工具
页面工具
用户页面工具
更多
链入页面
相关更改
页面信息
页面日志