HTTP缓存服务，提供高效简单的HTTP缓存服务。

一直以来都使用varnish来做HTTP缓存，喜欢它的性能高效与vcl配置的强大。在规范化缓存的配置之后，强大的vcl对于我也没有太多的作用了，此时我更希望易上手，更简洁的配置，Pike则由此诞生。

Pike主要基于fasthttp与badger两个开源库开发

特性

基于yaml的配置，简洁易懂
WEB管理后台，提供系统性能、黑名单IP、缓存清理功能
标准化的基于HTTP头Cache-Control缓存控制
压缩保存的响应数据，避免每次响应时重新压缩（如果客户端不支持压缩则解压）
自定义日志格式，支持二十多种placeholder，如：cookie，请求头字段，响应头字段，响应时间等。
访问日志支持以文件（按天分隔）或者UDP的形式输出
支持自定义HTTP响应头配置
支持自定义最小压缩长度，对于内网之间的访问，避免压缩、解压的时间损耗

前言

在刚开始从前端转向后端开发之后，对于接口性能的优化手段比较单一，都是接口缓存化，经历了两个阶段：

将复杂的处理过期结果缓存至mongodb，后续取数据从缓存中读取
使用redis替换mongodb，细化接口缓存公共逻辑

从mongodb --> redis 的缓存架构中，性能上是有所提升，但是还是无法避免缓存之间的数据交叉使用（如缓存A的数据从缓存B与缓存C的数据组合），在数据有误时需要清除缓存时痛点，交叉使用的数据已经无法理清该清理哪些缓存。

在系统稳定下来之后，对于杂乱的缓存设计也是时候理一理了。由于是资讯类的站点，我们的数据有着准实时性的特性，而缓存上我们希望是支持HTTP（这样将缓存前置，性能更高效），需要缓存设置与过期等都简单易用。在考察了各类的缓存软件，最终我们选择了varnish，使用varnish做HTTP缓存，缓存处理前置，避免更复杂的各缓存数据的交叉影响，在完成系统切换之后，感觉一下子世界变得美好多了，一切都是那么有条不紊。

在这几年使用varnish的过程中，也遇到过不少的坑，它的vcl很强大，可以通过自己配置各种不同的缓存处理方式，而用得越多，越来越觉得不需要太复杂的配置方式。

我们的现状是每个系统都自己配置一套自己的vcl，大家已迷失在配置的海洋里。后续开始慢慢收敛自定义的配置，只支持使用HTTP的Cache-Control来处理缓存，标准化此类中间件的使用。

varnish很好很强大，一直以来都想自己来实现一个类似的varnish，但是以前只是对node.js比较熟悉，C/C++还处于很水货的层面（主要学不懂），后来接触了golang，其性能上的优越性让我心动不已，因此码出一个http cache:Pike

对缓存使用的误区

缓存主要是为了提升系统的处理并发量，而不是让本来慢的请求变得响应快

在这几年遇到过不少这样的情况，开发人员将本来慢的接口加下varnish处理之后，在第一次调用时接口很慢，但是后续缓存生效之后，接口响应就快了很多，这样立即解决了测试（产品）对于接口慢的抱怨，自己也不用做太多的调整。

结果还是接口太慢超时，导致等待中的其它请求直接pass至后端（由于超时设置太长，等待堆积的请求更多），系统变得更卡，最终雪崩效应，整个系统都拖垮了。

后续我们规范了所有请求都需要在3秒内响应，对于超时的请求，每天排查相关统计数据，保证系统的高效性。而对于一些处理时间比较长的功能，我们调整为异步的处理，客户端请求时，生成后台任务，记录任务状态至数据库，并返回至客户端。后续再请求时，直接查询状态，如果还是处理中，直接返回保证了接口的性能。

HTTP缓存的有效期过长

在日常使用场景中，有部分的HTTP接口依赖多个服务或者数据源，将多个数据合并处理生成响应数据。在以往使用varnish的时候，对于缓存时长的设置，都是根据自己的经验判断，觉得某些数据都不会改变，会设置1，2个小时的缓存时长。而事实上，有些数据总会因为产品配置等人为因素导致错误，此时又要去清除缓存，虽然不复杂但是也挺让人烦恼（因为有些配置的数据可能会影响多个接口，通常无法短时间内整理出来）。

至此我开始认真的考虑长缓存是否有意义？是否能使用更短的缓存有效期呢？如果我使用1分钟的缓存有效期来替换1个小时的，对于系统的性能是否有大的影响呢？答案是：『不会』。因为varnish对于请求的处理方式保证了，在缓存过期之后，有更多的请求同时发生，也只会有一个请求转发至后端。而每1分钟一次的接口处理，不太可能增加大的负载（此时又强调一次，正常负载下，接口的响应应该是快速的）。使用短缓存之后，就算是数据配置错误，而缓存会在短时间之内更新，也就不再需要手工处理（找运维人员，提供需要清理的接口，再到清理完成，等操作完成，估计都不止1分钟）

缓存有效期设置方式的形式多样

由于vcl的灵活性，我们可以通过各种不同的形式来设置缓存时长。有些项目直接在vcl指定url的缓存时长，有些就使用自定义HTTP头X-TTL来设置，最终就出现了上千行的vcl配置。对于一个接口的缓存场景，每次都需要查一下配置文件，真是坑了运维坑了自己。

其实varnish本来就支持以Cache-Control来设置缓存有效期的方式，因此我们对整个公司的项目强行推行标准化，对于无设置Cache-Control的，全部认为不可缓存（宁愿性能变差也不可数据出错）。一个个项目的做切换调整，最终出来的效果挺不错，运维对于varnish的配置全部标准化，不再需要运维去关心缓存的处理，全部交由接口开发人员自己定义（原则上也只有开发人员才清楚接口是否可以缓存，可以缓存多久）

注：varnish支持从Cache-Control中优先选择s-maxage，再选择max-age，因此对于希望客户端缓存时间较长，但服务端使用短缓存，则配置不同的maxAge，如Cache-Control: public, max-age=3600, s-maxage=60。如果想了解varnish的各种特性，可以阅读我之前写的善用HTTP缓存利器-Varnish

HTTP缓存服务的设计

谁最清楚接口是否可以缓存？接口开发者！谁最清楚接口应该缓存多久？接口开发者！谁来控制缓存的有效期？Cache-Control!

由开发者控制，最简单的缓存形式

对于HTTP缓存服务，主要实现以下几点：

简化缓存的配置，使用HTTP的标准头Cache-Control来控制缓存
对于响应时无设置Cache-Control的，默认为不缓存（varnish可以通过设置default ttl来实现为可缓存），宁愿牺牲性能也不可以缓存了不可缓存的数据
根据Cache-Control判断该请求不可缓存的，记录缓存状态hit-for-pass，提升缓存判断的效率
支持指定规则的url则直接为pass，提升系统性能（如GET /user/xx 这种接口都是不可缓存的）
对于过期缓存数据能自动清除，不需要手工干预
支持健康检查，支持不同的策略选择后端服务
简化配置，配置文件使用yaml格式，简单易懂

下面看看pike的配置（最简化的）：

# 程序监听的端口，默认为 :3015
listen: :3015
# 数据缓存的db目录，默认为 /tmp/pike 
db: /tmp/pike
# 设置upstream的连接超时，默认为0，0表示无限制(time.Duration)，
# 不建议使用默认值
connectTimeout: 3s 
directors:
  -
    # 名称
    name: tiny
    # backend的健康检测，如果不配置，则不做检测，默认backend都为正常
    ping: /ping
    # backend列表
    backends:
      - 127.0.0.1:5018
      - 192.168.31.3:3001
      - 192.168.31.3:3002

注意：在调整配置的时候，尽量不要设置较长的响应超时，由于对于不能确认是否能缓存的请求（GET/HEAD请求在首次请求时），在首次响应时，多个请求会以队列的形式等待响应结果，如果响应超时太长，会导致等待队列过长

性能

对于缓存服务，大家最关心的肯定还是性能问题，下面是pike的对缓存与不可缓存请求的性能测试：

首先单独来测试一下pike本身HTTP的响应处理（Pike本身有一个/ping的响应，用于其它服务检测pike是否正常运行）：

wrk -H 'Accept-Encoding: gzip, deflate' -t10 -c200 \
-d1m 'http://127.0.0.1:3015/ping' --latency

Running 1m test @ http://127.0.0.1:3015/ping
  10 threads and 200 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency     1.12ms    1.53ms  46.46ms   92.87%
    Req/Sec    23.71k     2.29k   36.60k    74.70%
  Latency Distribution
     50%  770.00us
     75%    1.13ms
     90%    1.94ms
     99%    8.27ms
  14168320 requests in 1.00m, 2.23GB read
Requests/sec: 235773.39

接着是对可缓存请求的测试：

wrk -H 'Accept-Encoding: gzip, deflate' -t10 -c200 \
-d1m 'http://127.0.0.1:3015/api/sys/status' --latency

Running 1m test @ http://127.0.0.1:3015/api/sys/status
  10 threads and 200 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency     2.17ms    2.39ms  64.81ms   90.41%
    Req/Sec    11.27k     2.25k   22.45k    73.91%
  Latency Distribution
     50%    1.63ms
     75%    2.57ms
     90%    4.44ms
     99%   12.08ms
  6732203 requests in 1.00m, 32.80GB read
Requests/sec: 112036.59
Transfer/sec:    558.91MB

对不可缓存的请求测试（首次接收至请求则知道该请求不可缓存，如POST或者符合配置的pass条件）

wrk -H 'Accept-Encoding: gzip, deflate' -t10 -c200 \
-d1m 'http://127.0.0.1:3015/api/users/me' --latency

Running 1m test @ http://127.0.0.1:3015/api/users/me
  10 threads and 200 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency    13.86ms    2.30ms  92.20ms   88.69%
    Req/Sec     1.45k   151.81     1.62k    79.18%
  Latency Distribution
     50%   13.20ms
     75%   14.13ms
     90%   16.46ms
     99%   19.77ms
  867906 requests in 1.00m, 191.20MB read
Requests/sec:  14459.01
Transfer/sec:      3.19MB

# 直接压测

wrk -H 'Accept-Encoding: gzip, deflate' -t10 -c200 \
-d1m 'http://127.0.0.1:5018/api/users/me' --latency

Running 1m test @ http://127.0.0.1:5018/api/users/me
  10 threads and 200 connections
  Thread Stats   Avg      Stdev     Max   +/- Stdev
    Latency    12.42ms  834.04us  30.14ms   86.07%
    Req/Sec     1.62k    81.15     1.82k    78.58%
  Latency Distribution
     50%   12.17ms
     75%   12.72ms
     90%   13.34ms
     99%   15.38ms
  966524 requests in 1.00m, 140.11MB read
Requests/sec:  16101.42
Transfer/sec:      2.33MB

对于上面的测试结果，主要关注以下两点：

一、对于可缓存的请求，接口性能如何

二、对于不可缓存（转发至后端服务）的请求，性能损耗如何（因为有转发）

结语

自己去实现一个简化的varnish，这个几年前已经有的想法。在终于开始决心学习golang之后，才开始了pike这个项目的实现，在此只是为了实现自己几年以来的想法，并学习多一门新的语言。

如果愿意试用pike，做小白鼠的，请在项目中联系我https://github.com/vicanso/pike，提供一步步式的搭建帮助。在此，感恩不言谢！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pike.md

pike.md

特性

前言

对缓存使用的误区

缓存主要是为了提升系统的处理并发量，而不是让本来慢的请求变得响应快

HTTP缓存的有效期过长

缓存有效期设置方式的形式多样

HTTP缓存服务的设计

性能

结语

Files

pike.md

Latest commit

History

pike.md

File metadata and controls

特性

前言

对缓存使用的误区

缓存主要是为了提升系统的处理并发量，而不是让本来慢的请求变得响应快

HTTP缓存的有效期过长

缓存有效期设置方式的形式多样

HTTP缓存服务的设计

性能

结语