ocelot（二）- 请求聚合与负载均衡

作者：markjiang7m2
原文地址：
源码地址：https://gitee.com/sevenm2/ocelotdemo

在上一篇ocelot的文章中，我已经给大家介绍了何为ocelot以及如何简单使用它的路由功能，如果你还没有不了解ocelot为何物，可以查看我的系列文章 ocelot – .net core开源网关。在这篇文章中，我将会继续给大家介绍ocelot的功能：请求聚合与负载均衡。

开篇题外话：在上一篇文章的案例中，我直接使用api返回服务器的端口和接口的路径，我感觉这样举例过于偏技术化，比较沉闷，然后我想到了之前参加pmp课程培训时候，我们的培训讲师——孙志斌老师引用小王和老李的模型给我们讲述项目管理的各种实战，可谓是生动形象，而且所举的例子也非常贴近我们的日常工作，通俗易懂，因此，我也尝试使用类似的人物形象进行案例的讲解。首先，本文将会引入两个人物willing和jack。willing是一名资深专家，工作多年，而jack则是.net新手。

本文中涉及案例的完整代码都可以从我的代码仓库进行下载。

仓库地址：https://gitee.com/sevenm2/ocelotdemo

案例二请求聚合

我们在案例一路由中已经知道，ocelot可以定义多组路由，然后根据优先级对上游服务发出的请求进行不同的转发处理，每个路由转发都匹配唯一的一个下游服务api接口。然而，有时候，上游服务想要获得来自两个api接口返回的结果。ocelot允许我们在配置文件中声明聚合路由aggregates，从而实现这样的效果。
举个例子，有一天我的老板（用户）让我（上游服务）去了解清楚willing和jack两位同事对工作安排有什么意见（请求），当然了，我可以先跑去问jack，然后再跑到willing那里了解情况，可是这样我就要跑两趟，这样不划算啊，于是，我去找了他们的领导（聚合）说我老板想要了解他们两个的意见，他们领导一个电话打过去，willing和jack就都一起过来了，我也就很快完成了老板交代的任务。
在这个过程中，我是可以单独访问willing或者jack的，因此，他们是在reroutes中声明的两组普通的路由，而他们的领导是在aggregates中声明的一组聚合路由。刚刚我们的举例当中，访问不同的人需要到达不同的地方，因此在声明路由时，也需要注意它们的upstreampathtemplate都是不一样的。
下面是具体的路由配置：

"reroutes": [
{
    "downstreampathtemplate": "/api/ocelot/aggrwilling",
    "downstreamscheme": "http",
    "downstreamhostandports": [
    {
        "host": "localhost",
        "port": 8001
    }
    ],
    "upstreampathtemplate": "/ocelot/aggrwilling",
    "upstreamhttpmethod": [ "get" ],
    "key": "aggr_willing",
    "priority": 2
},
{
    "downstreampathtemplate": "/api/ocelot/aggrjack",
    "downstreamscheme": "http",
    "downstreamhostandports": [
    {
        "host": "localhost",
        "port": 8001
    }
    ],
    "upstreampathtemplate": "/ocelot/aggrjack",
    "upstreamhttpmethod": [ "get" ],
    "key": "aggr_jack",
    "priority": 2
}
],
"aggregates": [
{
    "reroutekeys": [
    "aggr_willing",
    "aggr_jack"
    ],
    "upstreampathtemplate": "/aggrleader"
}
]

大家可以注意到，在reroutes中声明的两组路由相比案例一不同的是，多加了一个key属性。aggregates跟reroutes是同级的，而且也是一个数组，这代表着我们可以声明多个聚合路由，而在我们声明的这一组聚合路由中的属性reroutekeys，它包含的元素就是我们真正需要响应的路由的key属性值。

当然，我们的下游服务也相应添加两个api接口。

// get api/ocelot/aggrwilling
[httpget("aggrwilling")]
public async task<iactionresult> aggrwilling(int id)
{
    var result = await task.run(() =>
    {
        return $"我是willing，还是多加工资最实际, path: {httpcontext.request.path}";
    });
    return ok(result);
}
// get api/ocelot/aggrjack
[httpget("aggrjack")]
public async task<iactionresult> aggrjack(int id)
{
    var result = await task.run(() =>
    {
        return $"我是jack，我非常珍惜现在的工作机会, path: {httpcontext.request.path}";
    });
    return ok(result);
}

下面我们一起来看看执行的结果。

我们按照案例一，先单独来问问jack。

然后再看看直接通过聚合路由访问

可以看到，在返回结果中同时包含了willing和jack的结果，并且是以json串的格式返回，以路由的key属性值作为返回json的属性。

（返回的结果好像哪里不太对，不知道你是否发现了，但暂时先不要着急，我在后面会为大家揭晓）

需要注意的是，ocelot仅支持get方式的请求聚合。ocelot总是以application/json的格式返回一个聚合请求的，当下游服务是返回404状态码，在返回结果中，其对应的值则为空值，即使聚合路由中所有的下游服务都返回404状态码，聚合路由的返回结果也不会是404状态码。

我们在不添加任何api接口的情况下，声明一组下游服务不存在的路由，并将它添加到聚合路由当中。

"reroutes": [
...,
{
    "downstreampathtemplate": "/api/ocelot/aggrerror/1",
    "downstreamscheme": "http",
    "downstreamhostandports": [
    {
        "host": "localhost",
        "port": 8001
    }
    ],
    "upstreampathtemplate": "/ocelot/aggrerror/1",
    "upstreamhttpmethod": [ "get" ],
    "key": "aggr_error",
    "priority": 2
}
],
"aggregates": [
{
    "reroutekeys": [
    "aggr_willing",
    "aggr_jack",
    "aggr_error"
    ],
    "upstreampathtemplate": "/aggrleader"
}
]

测试结果如下：

直接请求aggr_error

直接通过聚合路由访问

前面我说到返回结果好像有哪里不太对，那到底是哪里出错了呢？我来将返回的json串进行格式化一下。

{
    "aggr_willing":我是willing，还是多加工资最实际, path: /api/ocelot/aggrwilling,
    "aggr_jack":我是jack，我非常珍惜现在的工作机会, path: /api/ocelot/aggrjack,
    "aggr_error":
}

我们会发现这并不是一个正确的json串，那到底为什么会这样呢？既然ocelot是开源的，那我们就来深挖一下源码到底是怎么处理聚合请求返回结果的。
ocelot github:https://github.com/threemammals/ocelot
找到位于ocelot.middleware.multiplexer中的一个类simplejsonresponseaggregator，静态方法mapaggregatecontent。

var content = await contexts[0].downstreamresponse.content.readasstringasync();
contentbuilder.append($"\"{responsekeys[k]}\":{content}");

因为我的下游服务返回结果是一个字符串，然后被ocelot直接拼接到返回结果中，从而得到我们上面看到的结果。
因此，在我看来，当我们使用ocelot的聚合路由功能时，下游服务的返回结果必须要保证是一个json串，这样才能最终被正确识别。

我把下游服务改一改，添加一个类，然后将api返回结果格式更改为这个类型。

public class responseresult
{
    public string comment { get; set; }
}

// get api/ocelot/aggrwilling
[httpget("aggrwilling")]
public async task<iactionresult> aggrwilling(int id)
{
    var result = await task.run(() =>
    {
        responseresult response = new responseresult()
        { comment = $"我是willing，还是多加工资最实际, path: {httpcontext.request.path}" };
        return response;
        //return $"我是willing，还是多加工资最实际, path: {httpcontext.request.path}";
    });
    return ok(result);
}
// get api/ocelot/aggrjack
[httpget("aggrjack")]
public async task<iactionresult> aggrjack(int id)
{
    var result = await task.run(() =>
    {
        responseresult response = new responseresult()
        { comment = $"我是jack，我非常珍惜现在的工作机会, path: {httpcontext.request.path}" };
        return response;
        //return $"我是jack，我非常珍惜现在的工作机会, path: {httpcontext.request.path}";
    });
    return ok(result);
}

运行看执行结果

简单总结为以下三点注意：

仅支持get方式
下游服务返回类型要求为application/json
返回内容类型为application/json，不会返回404请求

进阶请求聚合

在上一个案例中，我已经可以通过willing和jack的领导得到我想要的结果，但在这个过程中，他们的领导（聚合）都只是在帮我获得结果，没有对得到的结果做任何的干预。那如果领导想着，既然老板想要了解情况，自己当然也要干点活，让老板知道在这个过程中自己也是有出力的，这就涉及到进阶的请求聚合了。

在网上搜了一下关于进阶请求聚合的资料，好像没有怎么见到有相关实例的demo，最全面的资料来自于官网文档说明，也许是在实际应用中这个功能不怎么被运用？或是我打开的方式不对？原因暂时未知，知道的朋友们可以在留言区给我说一下。那么我在这里就用实例给大家介绍一下。

ocelot支持在获得下游服务返回结果后，通过一个聚合器对返回结果进行再一步的加工处理，目前支持内容，头和状态代码的修改。我们来看配置文件

"aggregates": [
{
    "reroutekeys": [
    "aggr_willing",
    "aggr_jack",
    "aggr_error"
    ],
    "upstreampathtemplate": "/aggrleaderadvanced",
    "aggregator": "leaderadvancedaggregator"
}
]

因为是请求聚合的进阶，所以reroutes路由不需要任何更改。aggregates中一组配置增加了属性aggregator，表示当获得返回结果，由聚合器leaderadvancedaggregator进行处理。

然后我在ocelot项目中添加聚合器leaderadvancedaggregator，要实现这个聚合器，就必须实现来自ocelot.middleware.multiplexer提供的接口idefinedaggregator。

public class leaderadvancedaggregator : idefinedaggregator
{
    public async task<downstreamresponse> aggregate(list<downstreamresponse> responses)
    {
        list<string> results = new list<string>();
        var contentbuilder = new stringbuilder();

        contentbuilder.append("{");

        foreach (var down in responses)
        {
            string content = await down.content.readasstringasync();
            results.add($"\"{guid.newguid()}\":{content}");
        }
        //来自leader的声音
        results.add($"\"{guid.newguid()}\":{{comment:\"我是leader，我组织了他们两个进行调查\"}}");

        contentbuilder.append(string.join(",", results));
        contentbuilder.append("}");

        var stringcontent = new stringcontent(contentbuilder.tostring())
        {
            headers = { contenttype = new mediatypeheadervalue("application/json") }
        };
        
        var headers = responses.selectmany(x => x.headers).tolist();
        return new downstreamresponse(stringcontent, httpstatuscode.ok, headers, "some reason");
    }
}

当下游服务返回结果后，ocelot就会调用聚合器的aggregate方法，因此，我们的处理代码就写在这个方法中。

之后，我们就需要将聚合器在容器中进行注册
startup.cs

services
    .addocelot()
    .addsingletondefinedaggregator<leaderadvancedaggregator>();

运行，访问进阶请求聚合的urlhttp://localhost:4727/aggrleaderadvanced，得到如下结果：

也许大家已经留意到，我在处理返回结果是，并没有像ocelot内部返回结果一样使用路由的key作为属性，而是使用了guid。其实这也是我在做demo时候的一处疑惑，我似乎无法像ocelot内部一样处理。
在这个aggregate方法中提供的参数类型只有list<downstreamresponse>，但downstreamresponse中并没有关于reroutekeys的信息。我查看了ocelot的源码，reroutekeys只存在于downstreamreroute中，但我无法通过downstreamresponse获取到downstreamreroute。
希望有知道的朋友能在留言区告诉我一下，感谢。

另外，这个聚合器也能像一般服务一样，可以使用依赖注入的方式添加依赖。我也尝试在案例中添加了一个依赖leaderadvanceddependency。如何使用依赖注入，我这里就不细说了，大家可以搜索 .net core依赖注入的相关资料。
leaderadvancedaggregator.cs

public leaderadvanceddependency _dependency;

public leaderadvancedaggregator(leaderadvanceddependency dependency)
{
    _dependency = dependency;
}

startup.cs

services.addsingleton<leaderadvanceddependency>();

这样，我们就可以在聚合器中使用依赖了。

ocelot除了支持singleton的聚合器以外，还支持transient的聚合器，大家可以按需使用。
startup.cs

services
    .addocelot()
    .addtransientdefinedaggregator<leaderadvancedaggregator>();

案例三负载均衡

在前面的案例中，我们全部的路由配置中都是一组路由配置一个下游服务地址，也就意味着，当上游服务请求一个url，ocelot就必定转发给某一个固定的下游服务，但这样对于一个系统来说，这是不安全的，因为有可能某一个下游服务阻塞，甚至挂掉了，那就可能导致整个服务瘫痪了，对于当前快速运转的互联网时代，这是不允许的。

ocelot能够通过可用的下游服务对每个路由进行负载平衡。我们来看看具体的路由配置

{
    "downstreampathtemplate": "/api/ocelot/{postid}",
    "downstreamscheme": "http",
    "downstreamhostandports": [
    {
        "host": "localhost",
        "port": 8001
    },
    {
        "host": "localhost",
        "port": 8002
    }
    ],
    "upstreampathtemplate": "/ocelot/{postid}",
    "upstreamhttpmethod": [ "get" ],
    "loadbalanceroptions": {
    "type": "roundrobin"
    }
}

leadconnection负载均衡器算法共有4种：

leastconnection 把新请求发送到现有请求最少的服务上
roundrobin 轮询可用的服务并发送请求
noloadbalancer 不负载均衡，总是发往第一个可用的下游服务
cookiestickysessions 使用cookie关联所有相关的请求到制定的服务

为了能快速验证负载均衡器的有效性，我们这个案例中采用了roundrobin轮询算法。然后下游服务还是用了案例一中建立的基本服务，在iis中部署两套同样的下游服务，分别占用端口8001和8002。

当我们第一次请求http://localhost:4727/ocelot/5，得到的是端口8001的返回结果

而当我们再次请求http://localhost:4727/ocelot/5，得到的是端口8002的返回结果

再次请求则又是8001的返回结果，如此轮询下去。
但需要注意的是，当我尝试将8002端口服务停止时

我得到了这样的结果：第一次请求得到8001的返回结果，第二次请求得到的则是500的状态码

根据官网文档的说明

roundrobin - loops through available services and sends requests. the algorythm state is not distributed across a cluster of ocelot’s.

的确说的是轮询可用的服务，似乎与我的测试结果不相符。不知道是我的测试环境出了问题，还是我某个环节配置错误，亦或是这个算法真的没有避开不可用的服务。希望有知道的朋友在留言区给我解惑，感谢。

在本案例中，我就不再展开演示另外3种算法了，其中noloadbalancer会与服务发现的案例再进行深入探讨。

总结

本来今天是想给大家写多两个功能案例的，奈何这个进阶的资料实在不多，当然也有我自己一方面实力不足的原因，导致花了很长的时间进行消化。在本文中介绍了ocelot的请求聚合与负载均衡，其中请求聚合在使用的过程中还是有几点需要注意的，负载均衡则需要大家按需选择适合自己系统的算法。后续还会有ocelot的系列文章，希望大家持续关注。

黄山市民网：https://www.huangshanshimin.com/

ocelot（二）- 请求聚合与负载均衡

案例二 请求聚合

进阶请求聚合

案例三 负载均衡

总结

相关文章

案例二请求聚合

案例三负载均衡