您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 漫谈大数据第四期-storm

  2. Twitter将Storm正式开源了,这是一个分布式的、容错的实时计算系统,它被托管在GitHub上,遵循 Eclipse Public License 1.0。Storm是由BackType开发的实时处理系统,BackType现在已在Twitter麾下。GitHub上的最新版本是Storm 0.8.0,基本是用Clojure写的。 Storm为分布式实时计算提供了一组通用原语,可被用于“流处理”之中,实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。 Storm也可被用于“连续
  3. 所属分类:Java

  1. Iris flower data set 或 Fisher

  2. 参考网页 http://en.wikipedia.org/wiki/Iris_flower_data_set Iris flower data set (Fisher's Iris data set)是一个用于区分分析(discriminant analysis)的多变量数据集。该数据集有3个类,每类50个样本,每个样本是一个4维的特征向量。
  3. 所属分类:专业指导

    • 发布日期:2008-11-24
    • 文件大小:4kb
    • 提供者:cat_ng
  1. imdb-wiki中的wiki人脸部分,共3GB

  2. imdb-wiki数据集的wiki人脸部分,总共约3G,因为文件过大使用百度云链接,假如链接失效可以发邮件至947142043@qq.com
  3. 所属分类:深度学习

    • 发布日期:2018-08-16
    • 文件大小:64byte
    • 提供者:qq_35571432
  1. glove.6B.50d词向量数据

  2. glove.6B.50d数据集,来源于wiki百科和Gigaword数据集。
  3. 所属分类:深度学习

    • 发布日期:2019-03-05
    • 文件大小:61mb
    • 提供者:angel_hben
  1. glove.6B.100d词向量数据

  2. glove.6B.100d词向量数据集,来源于wiki百科和Gigaword数据集。
  3. 所属分类:深度学习

    • 发布日期:2019-03-05
    • 文件大小:119mb
    • 提供者:angel_hben
  1. wiki数据集text8.zip

  2. 解压后使用里面的压缩包,双重压缩防止重复资源无法上传。 妾发初覆额,折花门前剧。 郎骑竹马来,绕床弄青梅。 同居长干里,两小无嫌猜, 十四为君妇,羞颜未尝开。 低头向暗壁,千唤不一回。 十五始展眉,愿同尘与灰。 常存抱柱信,岂上望夫台。 十六君远行,瞿塘滟滪堆。 五月不可触,猿声天上哀。 门前迟行迹,一一生绿苔。 苔深不能扫,落叶秋风早。 八月胡蝶来,双飞西园草。 感此伤妾心,坐愁红颜老。 早晚下三巴,预将书报家。 相迎不道远,直至长风沙。
  3. 所属分类:深度学习

    • 发布日期:2020-05-12
    • 文件大小:29mb
    • 提供者:u012329554
  1. 文本分类数据集(共13个20ng,mr,R8,R52,ohsumed,wiki,agnews等)

  2. 文本分类数据集(共13个20ng,mr,R8,R52,ohsumed,wiki,agnews等) 数据量很多,适合进行深度学习实验
  3. 所属分类:互联网

    • 发布日期:2020-10-27
    • 文件大小:50mb
    • 提供者:qq_28969139
  1. 泰坦尼克号旅客数据集

  2. 泰坦尼克号旅客数据集titanic3.xls,原下载地址http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.xls无法获取到。网上的资源比较贵,不方便学习。现在将找到的titanic3.xls数据集以较低的分提供给大家。
  3. 所属分类:机器学习

    • 发布日期:2021-01-03
    • 文件大小:278kb
    • 提供者:longmaohu
  1. TERSI-labelmkr:一个依据labelimg开源代码做的能够标注MTCNN所需数据集的数据集制作工具-源码

  2. TERSI-labelmkr(双眼摄像头坐站识别器的标签制作器) 一个依据labelImg开放源码代码做的能够标注MTCNN所需数据集的数据集制作工具一个数据集制作工具,可以基于labelImg的开源代码注释MTCNN数据集 参考了的代码。 请参阅的代码。此项目能够标注点,当然是为了配合MTCNN识别人脸和器官点而确定地标注那几个,暂时功能比较僵硬,而且只能左键画框,右键标点,最后生成的标注文件会记录文件名,一个框和五个点的位置信息。 该项目可以标记点以匹配MTCNN来识别面部和器官点。临时功能
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:310kb
    • 提供者:weixin_42102401
  1. AnalogyDataset:用于类比知识探测的数据集-源码

  2. 类比数据集 用于类比知识探测的数据集: SAT风格的类比测试: 单词对列表: 剧本 :从检索wiki-common-word-pairs,这是在Wikipedia转储中对选定单词对进行训练的单词对嵌入模型。 :使用类比测试数据集和wiki-common-word-pairs的单词对,使用FastText计算在Wikipedia上的。 usage: get_relative_embedding.py [-h] [-o OUTPUT] [-w WINDOW_SIZE] [--minimum-
  3. 所属分类:其它

  1. FiveThirtyEight Bachelorette Dataset 单身汉数据集-数据集

  2. 此文件夹包含故事背后的数据:如何在“单身汉”或“单身汉”上寻找前锋;雷切尔(Rachel)的季节正好适合“单身汉”的历史;雷切尔·林赛(Rachel Lindsay)的“单身汉”季,三张图。数据是从Bachelor Nation Wiki上收集的,然后缺少的季节由ABC和FiveThirtyEight工作人员填补。 bachelorette.csv README.md
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:10kb
    • 提供者:weixin_38502239
  1. scut-wiki:华南理工大学非官方Wiki-源码

  2. 华工Wiki 华南理工大学Wiki,域名非常好记: : Wiki站需要大家的支持才能走的更远,请考虑贡献文档。 不是有一个华工小百科的小程序了吗?搞这个干嘛? 上面的内容永远没办法用搜索引擎搜索到,而且万年不更新,因此我想转移社区的力量搞一个更好的华工百科,更加方便同学们的学习生活。 Wiki内容规划 在华工学习生活所需要的一切可以公开的信息。 包括各种注意事项,学院要求,选课避坑,交流群等等。 欢迎以下两种网站的友链 华工校友的个人网站。 同类高校Wiki站。
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:74kb
    • 提供者:weixin_42131601
  1. pNEUMA_mastersproject:编写的python文件可与pNEUMA数据集一起使用-源码

  2. 概述 :图片:: :目标: :ALT:文档状态..最终证章 #从大规模轨迹数据集中估算交通特征。此存储库中的代码是硕士论文的一部分。 无人机从pNEUMA实验获得的轨迹数据被链接到基础网络,以通过放置虚拟回路来获得网络中任何位置的宏观流量特性。 使用代码非常简单,首先将数据集转换为正确的格式,然后提取研究区域的网络,并将所有轨迹映射到该网络。 将虚拟环路放置在网络中的任何位置都可以获取宏观的流量特征。 有关更多信息,请参阅此存储库中的论文文本。 在不久的将来,将进行一些更新,编辑和错误修
  3. 所属分类:其它

  1. Data-Science-Wiki:数据科学,统计,数学,R,Python,AI,机器学习,自动化,Devops工具,Bash,Linux教程,脚本和数据集的Wiki-源码

  2. DevopsWiki 与devop相关的指南,脚本和教程的Wiki 目录 操作系统和命令行 程式设计 源代码控制 编者 自动化 其他位 联网 检查AWS子文件夹 Linux 初学者指南 进步 Tmux tmux是一个“终端多路复用器”,它使多个终端(或窗口)可以从单个终端进行访问和控制。 可以通过sudo apt-get install tmux或yum install tmux 吉特 Bash指南和脚本 Python指南和脚本 Awk 塞德 Perl C Java脚本 自动化指南
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:14kb
    • 提供者:weixin_42178963
  1. gridstudio:Grid Studio是基于Web的数据科学应用程序,完全集成了开源数据科学框架和语言-源码

  2. Grid studio是基于Web的电子表格应用程序,与Python编程语言完全集成。 它旨在提供用于加载,清理,处理和可视化数据的集成工作流。 这是通过用Go编写的电子表格后端与Python运行时集成来操纵其内容来实现的。 架构概述 该应用程序分为两部分: (集中式)工作空间管理器 CRUD界面,用于创建,复制,编辑和删除工作空间。 代理将流量发送到正确的工作区环境(第2部分) Workspace Go执行环境 进行单元格解析和评估电子表格后端 Node.js终端会话 Python解释
  3. 所属分类:其它

  1. Disney-Movies-Wiki-WebScraper:Disney Movies的Web Scraping Wikipedia,以创建Disney Movies数据集,然后清理数据以使用清理后的JSON进行进一步的数据分析-源码

  2. 迪士尼电影Wikipedia WebScraper 目录 关于该项目 在此 Jupyter笔记本中,我们为迪士尼电影抓取了Wikipedia页面,以创建迪士尼电影数据集。 任务 任务1:从Toy Story 3 Wiki页面中抓取信息框,并保存在python词典中。 任务2:为所有迪士尼电影刮取信息框,并保存在python词典列表中。 任务3:清除数据! 删除所有引用([1],[2]等) 拆分长字符串 将“运行时间”字段转换为整数 将“预算”和“票房”字段转换为浮点数 将日期转换为日期时
  3. 所属分类:其它

  1. AI_Resources:面向初学者的人工智能资源的完整列表。 主题范围从AI社团和开源数据集到前提数学-源码

  2. AI_资源 标题说明了一切! 该文档是关于人工智能各个方面的运行Wiki。 使主题神秘化的最简单方法是将其分解为子组件并调查其基本特征(有趣的事实:类似于卷积层; D)。 本文档是我(以及希望通过众包努力进行的其他尝试)概述人工智能应用程序随附的工具包的尝试。 有趣的是,类别从统计数学和深度学习框架一直到基于心理学的文学和外行媒体文章。 我希望AI的这种跨学科性质能够证明它可以为您带来多样化和创造性的体验。 同样,希望该Wiki能够启动您的AI努力,并帮助您逐渐揭示其跨学科的美! (另外:Ro
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:12kb
    • 提供者:weixin_42131439
  1. 多任务学习:在IMKI-Wiki数据集上对GENKI4k进行多任务学习微笑检测,年龄和性别分类-源码

  2. 使用多任务学习进行微笑检测,性别和年龄估计 在原始论文《 ,作者仅根据给定图像就能够对个人的年龄进行分类,从而显示出非凡的结果。 让我们看看在有限的资源下,如何通过自我构建架构获得准确性(我猜是很糟糕)。 不仅是年龄,我们还使用多任务训练技术对性别和微笑进行分类。 依存关系 Python 3.x OpenCV 2 张量流 麻木 大熊猫 matplotlib 科学的 海生的 用于人脸检测 用法 下载数据集 首先下载和 (裁剪版)数据集。 预处理数据 首先运行 。 此步骤预处理IMDB-WI
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:149mb
    • 提供者:weixin_42117622
  1. 大数据探索:[归档]实习生项目-使用MongoDB进行大数据探索-此存储库不支持MongoDB产品-源码

  2. 此存储库不是受支持的MongoDB产品 MongoDB大数据探索项目 该项目旨在利用MongoDB进行存储和计算时发现,调查和解决大数据集问题。 这个暑期实习项目还展示了如何使用MongoDB的框架和连接器回答有关存储在MongoDB中的大型数据集的问题。 MongoDB本机聚合框架和hadoop都被用来浏览数据。 该项目的数据来自两个主要来源: 提供了我们的航班数据集,这是过去一年的国内航班时刻表。 为我们提供了Twitter-Memes数据集,其中包含博客帖子和2008年总统大选的新文
  3. 所属分类:其它

  1. CRD3:包含关键角色龙与地下城数据集的回购-源码

  2. [ACL 2020]对话式讲故事:地牢和龙的数据集的关键作用 总览 本文描述了《地牢与龙》的关键角色数据集(CRD3)及其相关分析。 关键角色(Critical Role)是一个无脚本的现场直播节目,固定人群在其中玩开放式角色扮演游戏《龙与地下城》。 该数据集是从159个关键角*节中收集的,这些情节被转录为文本对话,包括398,682个回合。 它还包括从Fandom Wiki收集的相应抽象摘要。 该数据集在语言上是独一无二的,因为叙述完全是通过玩家的协作和口头互动来产生的。 对于每个对话,都有
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:280mb
    • 提供者:weixin_42168230
« 12 3 »