什么是数据湖 数据湖(Data Lake)是一个存储各种数据类型数据的大型仓库,实现数据集中式管理,包括HDFS或者对象存储系统S3 都属于这个范畴;除了存储,还包括管理和分析工具,提供数据目录服务以
阅读更多...
InfluxDB InfluxDB是开源时序型数据库,由Go写成,被广泛应用于监控系统,如cpu利用率,io,内存等指标;穿戴设备,如心率,体温;IoT实时数据等场景。InfluxDB 官方网站:ht
Kafka介绍 现代互联网分布式系统,离不开几个中间件:远程调用(RPC)框架、消息队列、数据库访问中间件。Kafka是一种高吞吐量的分布式发布订阅的消息队列系统,用Scala语言实现,具有高性能、持