匿名
未登录
登录
医学百科
搜索
查看“BLAST”的源代码
来自医学百科
名字空间
页面
更多
更多
语言
页面选项
Read
查看源代码
历史
←
BLAST
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看和复制此页面的源代码。
{{Infobox | bodystyle = width: 300px; float: right; clear: right; margin: 0 0 1em 1em; border: 1px solid #a2a9b1; background: #f9f9f9; | abovestyle = background: #e0e0e0; font-size: 110%; font-weight: bold; text-align: center; | headerstyle = background: #eeeeee; font-weight: bold; | above = BLAST<br><small>Basic Local Alignment Search Tool</small> | image = | label1 = 全称 | data1 = Basic Local Alignment Search Tool | label2 = 开发者 | data2 = Altschul, Gish, Miller, <br>Myers, Lipman (1990) | label3 = 维护机构 | data3 = [[NCBI]] | label4 = 核心算法 | data4 = 启发式局部比对算法 | label5 = 统计指标 | data5 = '''E-value''' (期望值) | label6 = 常见变体 | data6 = blastn, blastp, blastx | label7 = 对AI价值 | data7 = 基因特征提取、<br>序列相似性计算 }} '''BLAST'''({{lang-en|Basic Local Alignment Search Tool}},即“基本局部比对搜索工具”),是一套在生物信息学领域使用最广泛的算法和程序,用于比较初级生物序列信息(如蛋白质的氨基酸序列或 DNA 的核苷酸序列)。 BLAST 被誉为生物学界的“Google”。它可以让研究人员输入一段未知的序列(Query),然后在巨大的数据库(如 [[GenBank]])中迅速找到与之相似的已知序列(Subject)。对于您的“基因医生”项目,它是确认患者基因突变位点最基础的工具。<ref name="BLAST_Paper" /> == 核心原理 == 与“全局比对”(Global Alignment,如 Needleman-Wunsch 算法)试图从头到尾对齐两条序列不同,BLAST 采用'''局部比对'''(Local Alignment)策略: * '''种子延伸法''':它先寻找短的、完全匹配的片段(称为“种子”或 Word),然后向两端延伸,直到相似度下降到阈值以下。 * '''优势''':这种启发式算法比全局比对快几个数量级,使其能够处理 [[GenBank]] 这种 PB 级别的数据量。 == 五大核心变体 (技术选型指南) == 您的 AI 团队在编写自动分析流程(Pipeline)时,必须根据数据类型选择正确的程序: {| class="wikitable" |- ! 程序名 !! 查询序列 (Input) !! 目标数据库 !! 典型应用场景 |- | '''blastn''' || 核苷酸 (DNA/RNA) || 核苷酸 || 寻找同源基因、映射引物位置 |- | '''blastp''' || 蛋白质 || 蛋白质 || 寻找功能相似的蛋白、药物靶点分析 |- | '''blastx''' || 核苷酸 (翻译后) || 蛋白质 || '''最常用''':分析未知 DNA 片段可能编码什么蛋白 |- | '''tblastn''' || 蛋白质 || 核苷酸 (翻译后) || 在未注释的基因组中寻找新基因 |- | '''tblastx''' || 核苷酸 (翻译后) || 核苷酸 (翻译后) || 远缘物种间的深度同源性分析 |} == 关键统计指标:E-value == 这是解读 BLAST 结果的灵魂。 * '''定义''':E-value (Expect Value) 表示在随机情况下,在这么大的数据库中找到得分如此高的匹配结果的'''期望次数'''。 * '''解读规则''': ** '''越小越好''':E-value 越接近 0,说明匹配越不可能是巧合(即具有真实的生物学意义)。 ** '''阈值''':通常 E-value < $10^{-5}$ 被认为有统计学意义;在“基因医生”的临床诊断中,通常要求 E-value 接近 0(如 $10^{-100}$)。 == 实际应用与 AI 结合 == * '''本地化部署 (Local BLAST)''':出于患者隐私([[HIPAA]]/GCP 合规)考虑,您的“智慧医生”系统不应直接把患者序列传到 NCBI 的公网服务器。您需要在公司内部服务器搭建 '''Local BLAST+''',并在内网运行比对。 * '''特征工程''':在训练基因组大模型时,BLAST 的比对结果(如一致性百分比、覆盖度)是极其重要的特征输入(Feature Engineering),可以帮助 AI 判断一个变异是否会导致功能丧失。 == 参见 == * [[NCBI]] * [[GenBank]] * [[序列比对]] * [[生物信息学]] * [[RefSeq]] == 参考资料 == <references> <ref name="BLAST_Paper">Altschul, S. F., Gish, W., Miller, W., Myers, E. W., & Lipman, D. J. (1990). Basic local alignment search tool. ''Journal of Molecular Biology'', 215(3), 403-410.</ref> <ref name="NCBI_BLAST_Help">NCBI. (2023). BLAST® Command Line Applications User Manual. [https://www.ncbi.nlm.nih.gov/books/NBK279690/]</ref> </references> [[Category:生物信息学]] [[Category:算法]] [[Category:计算生物学]]
该页面使用的模板:
模板:Infobox
(
查看源代码
)
模板:Infobox/row
(
查看源代码
)
模板:Lang
(
查看源代码
)
模板:Lang-en
(
查看源代码
)
模板:LangWithName
(
查看源代码
)
返回至
BLAST
。
导航
导航
症状百科
疾病百科
药品百科
中医百科
中药百科
人体穴位图
全国医院列表
功能菜单
最近更改
随机页面
Wiki工具
Wiki工具
特殊页面
页面工具
页面工具
用户页面工具
更多
链入页面
相关更改
页面信息
页面日志