您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 数据挖掘--概念与技术

  2. 目录 第一章 引言 ......................................................................................................................................................... 8 1.1 什么激发数据挖掘?为什么它是重要的?.............................................................
  3. 所属分类:Web开发

    • 发布日期:2010-09-06
    • 文件大小:1mb
    • 提供者:huanghyw
  1. DNA序列数据挖掘技术

  2. 关于数据挖掘中的方法,针对生物信息学中的DNA序列进行挖掘
  3. 所属分类:其它

    • 发布日期:2014-12-02
    • 文件大小:889kb
    • 提供者:lai8782138
  1. 算法实习基因拼接

  2. 随着大量的基因组DNA序列数据被获得,它对了解基因越来越重要(基因组DNA的一部分,是负责合成蛋白质的)。总所周知,在基因组序列中,由于存在垃圾的DNA中断基因的编码区,真核生物(相对于原核生物)的基因链更加复杂。也就是说,一个基因被分成几个编码片段(称为外显子)。虽然在蛋白质的合成过程中,外显子的顺序是固定的,但是外显子的数量和长度可以是任意的。 大多数基因识别算法分为两步:第一步,寻找可能的外显子;第二步,通过寻找一条拥有尽可能多的外显子的基因链,尽可能大地拼接一个基因。这条链必须遵循外显
  3. 所属分类:C/C++

    • 发布日期:2015-07-02
    • 文件大小:3kb
    • 提供者:wmm9879
  1. FinchTV.rar

  2. finchtv是任何处理DNA序列数据的人的工具。它用于从最流行的格式读取色谱文件。只需拖放ab1或SCF文件,甚至用gzip压缩的文件,进入查看窗口显示一个多色序列。finchtv还显示质量值,当可用时,可以在单视图和multipane视图中调整垂直和水平方向的比例。使用finchtv ,可以打印数据、编辑数据、导出fasta
  3. 所属分类:医疗

    • 发布日期:2017-08-18
    • 文件大小:4mb
    • 提供者:houchuanrong
  1. 动态编程和基因序列比对

  2. 基因组数据库保存了海量的原始数据。人类基因本身就有接近 30 亿个 DNA 碱基对。为了查遍所有数据并找到其中有意义的关系,分子生物学家们越来越依赖于高效的计算机科学字符串算法。本文将介绍三个这方面的算法,它们都利用动态编程 技术,这是解决最优化问题的一种高级的算法技术,它从下向上寻找子问题的最优解。本文将使用这些算法的 Java™ 实现,还将学习一个用于处理生物学数据的开源的 Java 框架。
  3. 所属分类:其它

    • 发布日期:2009-04-23
    • 文件大小:312kb
    • 提供者:wind_sncz
  1. DNA序列分析软件 DNAssit 3.10 可用于64位windows

  2. DNA序列分析软件 DNAssit 3.10 可用于64位windows,DNAssist可不仅仅是对测序结果的。它处理我们平常需要的一些关于DNA,RNA和蛋白质的基本数据,对表达非常有帮助。这里用一个例子来说明它的功能。主要演示①对测序报告(序列比对);②DNA的物化性质、限制性酶切位点图谱分析;③分析蛋白质的物化性质、抗原性、疏水性。
  3. 所属分类:医疗

    • 发布日期:2019-05-26
    • 文件大小:9mb
    • 提供者:wjjc1017
  1. 2019-nCoV (MN908947.3) 基因序列

  2. 1.2019新型冠状病毒基因序列 2.数据日期2020-01-13日测序结果 3.可用于DNA测序分析,预测等算法
  3. 所属分类:医疗

    • 发布日期:2020-04-07
    • 文件大小:30kb
    • 提供者:qq_42359956
  1. 基于线粒体16S rDNA序列的日本Unionoida(软体动物:双壳纲)的系统发生关系。

  2. 根据成虫和幼虫的形态特征,日本union类贻贝分为2科(Margaritiferidae和Unionidae),12属和18种。 但是,关于它们的系统性有一些争论。 在这项研究中,我们确定了属于18个物种的60个标本的线粒体16S核糖体DNA序列(347 bp),并构建了树以阐明系统发育关系并评估了日本union类贻贝的当前系统。 尽管从远方收集了两个或两个以上的标本,但几乎所有的物种都形成了进化枝,除了Inagasiyan yanagawensis,Sinanodonta lauta,S。ja
  3. 所属分类:其它

  1. 预测DNA-蛋白质结合位点的分层注意网络

  2. 发现DNA-蛋白质结合位点(也称为基序发现)是进一步分析转录因子(TF)的基础。 诸如卷积神经网络(CNN)和递归神经网络(RNN)之类的深度学习算法被引入到主题发现任务中,并取得了最新的性能。 但是,这些方法仍然有局限性,例如忽略大规模测序数据中的上下文信息。 因此,受DNA序列和人类语言之间相似性的启发,本文提出了一种基于自然语言处理方法进行文档分类的,用于预测DNA-蛋白质结合位点的分层注意力网络。 所提出的方法在真实的ChIP-seq数据集上进行了测试,并且与两个经过充分测试的基于深度学
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:490kb
    • 提供者:weixin_38674883
  1. GTEx_exploration:来自基因型组织表达项目的RNA-seq数据分析包含自闭症相关重复扩展的基因-源码

  2. GTEx_exploration 基因型组织表达项目的RNA-seq数据分析包含自闭症相关重复序列扩展的基因。 该项目的背景是一项遗传研究,由Trost B.等人在《自然》杂志2020年发表(Trost B,Engchuan W,Nguyen CM,Thiruvahindrapuram B,Dolzhenko E,Backstrom I等人。自闭症中扩增的DNA重复序列,自然[互联网],2020年; 586(十月),可从以下网站: : 。 这项研究显示,在自闭症患者中发现的55个不同基因
  3. 所属分类:其它

  1. nim-dna-seq:Nim软件包,用于处理核苷酸序列数据-源码

  2. bio_seq 一个用于将核苷酸编码为IUPAC模糊度代码以及写入和读取FASTA文件的库。 基于的核苷酸的8位无符号整数表示形式 对齐解析 对于解析对齐,要求所有FASTA条目都具有相同的长度,否则将引发错误。 解析对齐字符串 import bio_seq let s = ">header1 \n ACTG \n >header2 \n >CTUG" let r = parseFastaAlignmentString (s) 解析对齐文件 import nim_seq l
  3. 所属分类:其它

  1. DNA序列的2D共轭图

  2. 随机序列在更广泛的安全应用程序(例如移动通信和网络安全性)中起着重要作用。 由于DNA序列具有自然随机性,为了直观地显示DNA的特征,本文提出了一种将DNA序列表示为共轭图的方法。 该方法包括两个核心模型:将DNA数据转换为测量值的测量模型,以及将随机序列作为分布图显示DNA特性的可视模型。 最后说明并比较了样品DNA和CA随机序列之间的空间关系。 结果表明,DNA序列和CA随机序列的分布具有明显的差异和相似性。 它可以为在测量图谱上对DNA序列进行深入可视化研究提供参考。
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:192kb
    • 提供者:weixin_38661466
  1. 在变异图谱上绘制整个DNA序列

  2. 整个DNA序列与大数据流自然相关,对整个DNA序列进行分类和可视化是一项艰巨的任务。 本文提出了一种新的全DNA序列作图方法,并采用一种特殊的作图方案将整个DNA序列作为多个二维统计概率图进行转移。 从南美(夜莺(Aotus Nancymaae))的夜猴物种中选出一个样本,从相关地图上观察到有趣的模式。
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:994kb
    • 提供者:weixin_38713393
  1. iNuc-PseKNC:基于序列的预测子,用于预测具有伪k元组核苷酸组成的基因组中核小体的定位

  2. 动机:核小体定位参与许多细胞活动,并在调节细胞过程中发挥重要作用。 随着在后基因组时代产生的基因组序列的雪崩,迫切需要开发用于快速有效地鉴定核小体定位的自动化方法。 尽管提出了一些计算方法,但大多数计算方法是物种特异性的,并且忽略了可能在确定DNA序列上核小体定位中起重要作用的内在局部结构性质。 结果:在这里开发了一种名为“ iNuc-PseKNC”的预测子,用于预测智人,秀丽隐杆线虫和果蝇果蝇基因组中的核小体定位。 在新的预测因子中,DNA序列的样品是由一种称为“伪k元组核苷酸组成”的新型特征
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:532kb
    • 提供者:weixin_38720322
  1. 使用内核方法进行DNA序列分类:内核方法的机器学习(MVA 2021)-使用内核方法和ML算法从头开始进行DNA序列分类-源码

  2. 核方法对DNA序列的分类 使用内核方法的机器学习(MVA 2021)-使用内核方法和ML算法从头开始进行DNA序列分类 转录因子(TFs)是调节蛋白,可结合基因组中的特定序列基序来激活或抑制靶基因的转录。 可以使用一些实验技术对全基因组蛋白-DNA结合图谱进行分析,因此对于感兴趣的TF,所有基因组可以分为两类:结合的或未结合的。 在这个挑战中,我们将使用与三个不同TF对应的三个数据集,并预测一个序列是否与TF绑定。
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:841kb
    • 提供者:weixin_42151729
  1. tskit:分析,创建和处理树序列-源码

  2. tskit 简洁的树序列是通过将其祖先编码为沿基因组的一组相关树来存储一组相关DNA序列的高效方法。 树序列格式由许多软件库和程序(例如 , , 和 )输出,它们可以模拟或推断遗传序列的进化历史。 tskit库提供了用于加载,检查和操作树序列的基础功能,包括用于计算遗传统计数据的有效方法。 它通常是其他软件包(例如上面列出的软件包)安装的一部分。 请参阅以获取更多详细信息,其中包括。 tskit同时具有Python和C API Python API tskit大多数用户将使用pytho
  3. 所属分类:其它

  1. modimizer:使用新型缩减型kmer进行快速DNA读集匹配和组装的工具集-源码

  2. 修改器 使用简单的kmer采样方法进行快速,节省空间的DNA读集匹配和组装的工具集。 具有精确kmer匹配的种子序列比对是DNA序列匹配和数据集分析的许多生物信息学方法的关键组成部分。 存在用于快速枚举读取集的所有kmers的工具,但是将它们全部表示在内存中的开销很大。 快速访问的自然工具是哈希表,但这可能会占用更多空间。 最近,已经引入了minhash和最小化方法,这些方法仅通过使用kmer的子集来节省速度上的空间。 对于这些方法,基于它们的哈希值相对于集合中的其他值较低(minhash)还
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:67kb
    • 提供者:weixin_42162216
  1. 出版物:文章和数据的链接-源码

  2. 杰夫·韦纳尔 出版物和数据 最后更新2021年2月12日 2021年 Weinell,Jeffrey L和Alan E Leviton,Rafe M Brown。 从民都洛岛,菲律宾:芦苇蛇,属铁线蛇属(Calamariinae游蛇)的2021年一新种。 菲律宾系统生物学杂志14(2),1-14。 文章: ; DNA序列: , 。 2020年 Weinell,Jeffrey L和Daniel J Paluh,Cameron D Siler,Rafe M Brown。 2020年。来自菲律宾
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:98mb
    • 提供者:weixin_42109545
  1. 基于QSA数组计算序列中所有NE重复模式的算法

  2. 序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征和重复模式检测结果之间的统计联系;算法中的约束条件包括最小周期pmin和最大间距gmax,其可用于筛选符合条件的NE重复模式,并可按照递增序输出所有NE重复模式的出现位置。与已有的基于后缀索引的算法相比,此算法的空间效率得到了提高。在分类属性数据样本集上进行的实验表明,算法
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:939kb
    • 提供者:weixin_38621553
  1. 高通量DNA测序数据的生物信息学方法

  2. 高通量测序技术产生的DNA序列数据长度较短,而且数据量非常巨大。分析了高通量测序环境下大数据的挑战和机遇,总结并讨论了数据压缩、宏基因组数据序列拼接、宏基因组数据序列分析方面的算法和工具等研究成果。最后,展望了高通量测序下DNA短读序列数据研究的发展趋势。
  3. 所属分类:其它

« 12 3 4 »