说明:WhyLogs Java库
这是WhyLogs的Java实现,并支持针对大型数据集的Apache Spark集成。可以在找到Python实现。
无论数据是为生产还是实验而构建,了解数据在应用程序中移动时的属性对于保持ML / AI管道稳定并改善用户体验都是至关重要的。 WhyLogs是一个开源统计日志记录库,它使数据科学和ML团队可以轻松地描述ML / AI管道和应用程序,并生成可用于监视,警报,分析和错误分析的日志文件。
WhyLogs可以为任何大小不超过TB规模的数据集计算近似统计信息,从
<weixin_42151305> 上传 | 大小:2mb