您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 实时唇动检测与跟踪的算法改进

  2. 计算机唇读的研究在语音识别、人机智能接口、多媒体系统以及人脸数据压缩等领域具有重要的理论意义和实用价值。
  3. 所属分类:其它

    • 发布日期:2009-10-10
    • 文件大小:1mb
    • 提供者:huizi022
  1. 光学数字人体形貌三维重建技术

  2. 本文主要研究光学三维形貌术用于活人体形貌的三维重建技术问题。基于面 结构光投影的傅立叶变换形貌术,理论上可重建活人体等动态物体,我们通过研 究传统傅立叶变换形貌术及其在三维人体形貌重建中的应用,针对传统傅立叶变 换形貌术的局限性,提出了窗口傅立叶变换形貌术和多尺度窗口傅立叶变换形貌 术,以及它们在三维人体形貌重建中的应用。小波变换在空一频局域化、多分辨 方面具有较大的优势,从理论上证明了在慢变位相梯度条件下,可通过求解小波 变换脊的位相来解调变形光栅条纹的位相,进一步提出了直接提取小波变换脊位
  3. 所属分类:专业指导

    • 发布日期:2009-10-14
    • 文件大小:7mb
    • 提供者:huaidan531
  1. 唇部识别相关论文

  2. 唇部识别相关的一些论文.主要讲唇部检测,唇部提取,唇读识别等技术。
  3. 所属分类:C++

    • 发布日期:2012-12-09
    • 文件大小:1mb
    • 提供者:liuhe1507006
  1. 一种自适应唇区检测及定位方法

  2. 一种自适应唇区检测及定位方法
  3. 所属分类:互联网

    • 发布日期:2014-03-02
    • 文件大小:552kb
    • 提供者:xiangqiao123
  1. asp 中文转拼音(字库转换,非unicode编码转换)

  2. 纯字库转换,包含几乎所有汉字,网上现有传播的转换都是unicode编码转换,其中很多字不在字库内,举例:瑛(ying)无法识别,存在很多问题,本代码直接字库转换,且公开文本,没有找到的字还可以添加到字库。 不涉及版权,本人免费分享给大家,可以商用。 测试地址:http://www.i0415.net/pinyin.asp 欢迎Asp开发者共同交流 以下是部分代码和字库 Session.CodePage=936 Response.Charset="GB2312" function pinyin(
  3. 所属分类:Web开发

    • 发布日期:2019-04-11
    • 文件大小:145kb
    • 提供者:u011289462
  1. 基于视觉信息和深度学习的中文唇语数据集构建与识别_胡扬.caj

  2. 本文以中文唇语识别为主线,通过更有效的数据收集手段将中文的唇语识别问 题拓展到更一般更现实的中文环境中,并通过深度学习技术有效解决现实环境下变 长唇语序列图片的中文识别问题。本文的主要研究内容包括: 1. 研究以互联网视频为数据源头,自动快速构建中文唇语数据集的方法。互联 网视频中的场景变化较多,与现实环境相符,同时资源获取成本较低,本文 基于此,提出有效的从互联网视频中获取可以用于训练唇读模型的唇部序列 图片和对应的中文内容。 2. 研究中文唇语识别的网络设计。相较于限定实验环境下的唇
  3. 所属分类:深度学习

    • 发布日期:2020-04-27
    • 文件大小:1mb
    • 提供者:zhr_the_great
  1. 基于HMM与深度学习的唇读识别研究_宋文明(好).caj

  2. 尽管国内的唇语识别研究工作已经开展了一段时间,但统一的、标准的用于汉语唇 语识别的语料库还没有建立起来,也没有权威机构提出该方面的建议。因此,本文提出了自己的一套汉语识别的语料架构用于本文涉及到的实验,并在此基础上提出改进方案 以使其适用范围更广。 隐马尔可夫模型的双随机过程与人类语言表达相吻合,这一特点使得该方法成为最 适合唇语识别的方法。本文将对 HMM 方法做深入研究,探究其在唇语识当中的具体适用形式,包括参数设置、模型的类型选择以及训练方法等。
  3. 所属分类:深度学习

    • 发布日期:2020-04-27
    • 文件大小:2mb
    • 提供者:zhr_the_great
  1. 希尔思仪表DS 300-P便携式多功能测量仪操作手册.pdf

  2. 希尔思仪表DS 300-P便携式多功能测量仪操作手册pdf,希尔思仪表DS 300-P便携式多功能测量仪操作手册CS INSTRUMENTS DS 300-P cs iNSTRumeNTS DS 300-P EC Declaration of Conformity 量程 露点 参见传感器规格说明 For 流量 参见传感器规格说明 压力: DIRECTIVE 2002/96/EC OF THE EUROPEAN PARLIAMENT AND OF THE COUN- 0..40bar(相对式) C
  3. 所属分类:其它

  1. 普通话十套题带拼音 国家普通话水平测试试卷

  2. 普通话十套题带拼音 一、读单音节字词100个(10分) 蹦(bèng) 耍(shuǎ) 德(dé) 扰(rǎo) 直(zhí) 返(fǎn) 凝(níng) 秋(qiū) 淡(dàn) 丝(sī) 炯(jiǒng) 粗(cū) 袄(ǎo) 瓮(wèng) 癣(xuǎn) 儿(ér) 履(lǚ) 告(gào) 筒(tǒng) 猫(māo) 囊(náng) 驯(xùn) 辱(rǔ) 碟(dié) 栓(
  3. 所属分类:其它

    • 发布日期:2011-05-10
    • 文件大小:310kb
    • 提供者:tsc0372
  1. FlowerPower:花也有感觉-源码

  2. 使用时间卷积网络进行唇读 s , , ,。 内容 深层唇读 介绍 这是的和。 在此存储库中,我们提供了预训练的模型以及用于端到端可视语音识别(口头阅读)的网络设置。 我们在上训练了我们的模型。 网络体系结构基于3D卷积,ResNet-18和MS-TCN。 通过使用此存储库,您可以在LRW数据集上实现87.9%的性能。 该报告还提供了用于特征提取的脚本。 预处理 如,来自LRW数据集的每个视频序列都经过以下处理:1)进行面部检测和面部对齐,2)将每帧对齐到参考平均面部形状3)从对齐后的裁剪出固
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:133mb
    • 提供者:weixin_42104366
  1. LipNet:从tensorflow中的python实时视频中自动读取Lip-源码

  2. 利普网 该项目基本上是由Yannis M. Assael,Brendan Shillingford,Shimon Whiteson,Nando de Freitas牛津大学于2016年与Google精打细算的合作发起的。朗读是从说话者的嘴巴运动中解码文本的任务。 传统方法将问题分为两个阶段:设计或学习视觉特征以及预测。 较新的深层唇读方法是端到端可培训的(Wand等人,2016; Chung&Zisserman,2016a)。 但是,现有的端到端训练模型研究仅执行单词分类,而不执行句子级序列预测
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:170mb
    • 提供者:weixin_42116585
  1. Multi-Perspective-LSTM-for-Joint-Visual-Representation-Learning-源码

  2. LSTM联合视觉表示学习的多视角 MPLSTM — TensorFlow-Keras正式实施 用于联合视觉表示学习的多视角LSTM Alireza Sepas-Moghaddam,Fernando Pereira,Paulo Lobato Correia,Ali Etemad CVPR'21论文: ://arxiv.org/abs/ 摘要:我们提出了一种新颖的LSTM单元结构,该结构能够实现多视角LSTM(MP-LSTM)单元体系结构,以学习从多个角度捕获的视觉序列中可用的内部和内部透视关
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:188kb
    • 提供者:weixin_42116596