CDC(Change Data Capture)是oracle在数据库级别实现的增量抽取解决方案。在一般的ETL过程中,对于增量抽取,无非是在数据上加时间截,全记录比对,关键字段比对,日志分析抽取等几种方法,要么需要修改原表结构,要么需要大量的算法,要么借助第三方的工具实现。Oracle从9i开始引入的CDC特性,使得有机会在数据库层面上直接实现增量抽取功能,在性能方面由于和数据库引擎的直接集成,比第三方工具应该具有一定的优势。 CDC有两个模式:同步和异步。两种模式的实现机制是截然不同的。同
Uplift Dataset is provided by Alimama, Alibaba. Data is collected from ads on Alimama platform including some ads log from Youku. 本数据集由阿里妈妈提供,来源于阿里妈妈品牌广告业务场景,采样了部分优酷资源位的广告数据日志。
Terms of Use.pdf