Kafka简介(二)

2018, Oct 24    

一、kafka简介

kafka是什么?

kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

kafka能做什么

分布式消息传递

网站活跃数据跟踪

日志聚合

流式数据处理

数据存储

事件源

关键术语

1.Topics

消息都归属于一个类别成为topic,在物理上不同Topic的消息分开存储,逻辑上一个Topic的消息对使用者透明

每个Topics划分为一个或者多个Partition,并且Partition中的每条消息都被标记了一个sequential id ,也就是offset,并且存储的数据是可配置存储时间的 。

消息图

  1. 优势
  2. 应用场景

二、核心原理

  1. 设计思想
  2. 原理分析