协程可以看作一个轻量级的线程,能自己实现调度。有一些轻量的场景,如网络刷新、网络加载、UI刷新、IO读写操作等,可以不需要开启一个线程去执行;线程或进程的调度较重,只需要一个轻量级的线程来维护业务代码,使业务代码更加的轻便灵活;这就是协程的意义。协程,简单的说,就是一个具有异步的性能,却使用同步编程方式的组件。使用者调用协程可以很好的管理业务代码,整个执行过程清晰明了。
多线程异步操作,就是将不同的操作放到不同的线程中进行。异步带来的好处是子模块好规划、程序性能高;缺点是模块间的数据管理异常麻烦。
多线程异步简单示例代码:
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include #define ASYNC_EVENT_LENGTH 1024struct context {int epfd;pthread_t thid;
};void *asyn_callback(void * arg)
{struct context *ctx=(struct context*)arg;while(1){struct epoll_event events[ASYNC_EVENT_LENGTH] = { 0 };int nready=epoll_wait(ctx->epfd,events,ASYNC_EVENT_LENGTH,-1);if (nready < 0){if (errno == EINTR || errno == EAGAIN)continue;elsebreak;}else if (nready == 0)continue;int i = 0;for (i = 0; i < nready;i++){int clientfd = events[i].data.fd;if (events[i].events &EPOLLIN){char buffer[1024] = { 0 };struct sockaddr_in addr;size_t addr_len = sizeof(struct sockaddr_in);// 从读缓冲区中读取数据int n = recvfrom(clientfd, buffer, sizeof(buffer), 0, (struct sockaddr*)&addr, (socklen_t*)&addr_len);printf("recvfrom n : %d\n", n);// 解析数据parse_response(buffer);// 删除事件监听epoll_ctl(ctx->epfd, EPOLL_CTL_DEL, clientfd, NULL);// 关闭fdclose(clientfd);}}}return NULL;
}int asyn_commit(struct context *ctx)
{// 创建 socketint sockfd = socket(AF_INET, SOCK_DGRAM, 0);if (sockfd < 0) {perror("create socket failed\n");exit(-1);}// 配置socket相关信息struct sockaddr_in dest;bzero(&dest, sizeof(dest));dest.sin_family = AF_INET;dest.sin_port = htons(53);dest.sin_addr.s_addr = inet_addr(DNS_SVR);// connect目标,探路int ret = connect(sockfd, (struct sockaddr*)&dest, sizeof(dest));printf("connect :%d\n", ret);// 准备协议//......// 发送数据int slen = sendto(sockfd, request, req_len, 0, (struct sockaddr*)&dest, sizeof(struct sockaddr));// 加入epoll中,监测结果返回struct epoll_event ev;ev.events = EPOLLIN;ev.data.fd = sockfd;return epoll_ctl(ctx->epfd, EPOLL_CTL_ADD, sockfd, &ev);}int asyn_init(struct context *ctx)
{ctx->epfd=epoll_create(1);pthread_create(&ctx->thid,NULL,asyn_callback,ctx);
}int main(int argc;char *argv[])
{struct context ctx;asyn_init(&ctx);for(int i=0;i<100;i++){asyn_commit();}getchar();return 0;
}
协程就是要在一个线程中实现异步操作。
协程主要有几个操作:创建(create)、让出(yield)和恢复(resume)。这后两个操作使用一个关键的动作,switch,即切换。
(1)将socketfd添加到epoll中管理。
(2)然后切换上下文,由协程上下文切换到调度器上下文,这个过程称为让出(yield)。
(3)调度器获取下一个协程上下文,恢复(resume)新的协程。
如此达到异步的操作。
调度器与协程的上下文切换如下图:
epoll_ctl() add和del动作能够保证 sockfd 只在一个上下文中能够操作 IO ;不会出现在多个上下文同时对一个 IO 进行操作。
IO异步操作上下文切换时序图:
执行切换有三种方式:
(1)longjmp / setjmp
(2)ucontext
(3)汇编
”切换“不能使用goto。goto只能在栈内跳转,只能在函数内,不能跨函数。
汇编实现switch可以参考Linux kernel的任务调度方式,在“切换”前保存当前的上下文信息再加载要执行的上下文信息。x86_64 的寄存器有 16 个 64 位寄存器:rax,rbx,rdi,rsi,rdx,rcx,r8,r9,r10,r11,r12,r13,r14,r15,rbp,rsp。
其中:
rax:存储函数的返回值;
rdi,rsi,rdx,rcx,r8,r9:函数的六个参数,如果函数的参数超过六个,那么六个以后的参数会入栈。
rbp:栈指针寄存器,指向栈底;
rsp:栈指针寄存器,指向栈顶。
其余的用作数据存储。
eip:指令指针寄存器,指向CPU要执行的下一个指令。
例如,对于X86-64的汇编切换代码:
__asm__ (
" .text \n"
" .p2align 4,,15 \n"
".globl _switch \n"
".globl __switch \n"
"_switch: \n"
"__switch: \n"
" movq %rsp, 0(%rsi) # save stack_pointer \n"
" movq %rbp, 8(%rsi) # save frame_pointer \n"
" movq (%rsp), %rax # save insn_pointer \n"
" movq %rax, 16(%rsi) \n"
" movq %rbx, 24(%rsi) # save rbx,r12-r15 \n"
" movq %r12, 32(%rsi) \n"
" movq %r13, 40(%rsi) \n"
" movq %r14, 48(%rsi) \n"
" movq %r15, 56(%rsi) \n"
" movq 56(%rdi), %r15 \n"
" movq 48(%rdi), %r14 \n"
" movq 40(%rdi), %r13 # restore rbx,r12-r15 \n"
" movq 32(%rdi), %r12 \n"
" movq 24(%rdi), %rbx \n"
" movq 8(%rdi), %rbp # restore frame_pointer \n"
" movq 0(%rdi), %rsp # restore stack_pointer \n"
" movq 16(%rdi), %rax # restore insn_pointer \n"
" movq %rax, (%rsp) \n"
" ret \n"
);
(1)如果调度器不存在,则创建调度器。调度器作为全局实例。
(2)分配协程内存空间,并设置协程的数据项。如协程的栈空间、栈大小、子过程回调函数、子过程回调参数等等。
(3)将新创建的协程添加到就绪队列中。
切换到最近执行 resume 的上下文。
切换到运行协程实例的 yield 的位置。
resume 与 yield 是两个可逆过程的原子操作。
协程一般包含几个内容:
(1)协程ID
(2)协程上下文
(3)协程入口函数
(4)协程的状态
(5)协程的栈空间
(6)返回值
(7)状态集合
struct coroutine{uint64_t birth;//创建时间uint64_t id;//协程IDstruct context ctx;//上下文void *(*func) (void*);//子过程回调函数void *arg;//回调函数参数struct nty_coroutine_status status;// 协程的状态void *stack;// 栈size_t stack_length;//栈大小nty_schedule *sched;//调度器//状态集合struct rbtree_node wait;struct queue_node ready;struct rbtree_node sleep;
}
typedef struct _nty_coroutine_queue nty_coroutine_queue;
typedef struct _nty_coroutine_rbtree_sleep nty_coroutine_rbtree_sleep;
typedef struct _nty_coroutine_rbtree_wait nty_coroutine_rbtree_wait;typedef struct _nty_schedule {uint64_t birth;//创建时间nty_cpu_ctx ctx;//上下文struct _nty_coroutine *curr_thread;//当前运行的协程int page_size;// epoll 管理int poller_fd;int eventfd;struct epoll_event eventlist[NTY_CO_MAX_EVENTS];int nevents;int num_new_events;//状态集合nty_coroutine_queue ready;nty_coroutine_rbtree_sleep sleeping;nty_coroutine_rbtree_wait waiting;
} nty_schedule;
协程可以让业务代码易于管理,整个流程清晰;自己实现调度器,在单线程中实现异步调度。协程的底层还是使用epoll等IO多路复用器,性能上只能趋近reactor。
协程的单核运行过程:
本专栏知识点是通过<零声教育>的系统学习,进行梳理总结写下文章,对c/c++linux系统提升感兴趣的读者,可以点击链接,详细查看详细的服务:C/C++服务器课程