不管是做哪一种开发,都离不开网络编程,网络编程又经常会涉及套接字(socket)。Socket最初由加州大学伯克利分校开发,它是一种全双工的通信方式,不同于pipe这种单工方式,主要用于实现4.2BSD上的进程间通信。
我们常说的socket通信有以下二种,主要会说一下Unix domain socket
Internet domain socket
也叫IP socket,它要利用主机的传输层(tcp),可以用于同一台主机上不同进程间的通信,也可以用于网络上不同主机间的通信。就像聊QQ一样只要知道了对方的QQ号就可以聊天了。socket只要知道了对方的ip地址和端口就可以通信了所以这种socket通信是基于网络协议栈的。
Unix domain socket
Unix domain socket,也叫IPC socket(inter-precess communication socket,也就是进程间通信套接字),用于同一台主机上的不同进程间交换数据,是Posix系统的标准组件。
该socket用于一台主机的进程间通信,不需要基于网络协议,主要是基于文件系统的。与Internet domain socket类似,需要知道是基于哪一个文件(相同的文件路径)来通信的。unix domain socket有2种工作模式一种是SOCK_STREAM,类似于TCP,可靠的字节流。另一种是SOCK_DGRAM,类似于UDP,不可靠的字节流。除了传输数据以外,还可以使用Unix domain socket传输文件描述符(file descriptor)。
工作模型
socket通信有一个服务端,一个客服端
服务端:创建socket—绑定文件(端口)—监听—接受客户端连接—接收/发送数据—…—关闭
客户端:创建socket—绑定文件(端口)—连接—发送/接收数据—…—关闭
代码框架
server
sockaddr_un :为一个系统级的结构体,主要用于存储地址
#define NAME "socketAddr" main(){ ... struct sockaddr_un server; ... int sock = socket(AF_UNIX, SOCK_STREAM, 0); strcpy (server.sun_path, NAME); ... bind(sock, (structsockaddr *) &server, sizeof(struct sockaddr_un)); ... listen(sock, 5); ... while(1){ ... msgsock = accept(sock, 0, 0); ... rval = read(msgsock, buf, 1024)) ... } }
client
#define NAME "socketAddr" main(){ ... sock = socket(AF_UNIX, SOCK_STREAM, 0); strcpy(server.sun_path, NAME); ... if (connect(sock, (struct sockaddr *) &server, sizeof(struct sockaddr_un)) < 0) { close(sock); exit(1); } if (write(sock, DATA, sizeof(DATA)) < 0) perror("writing on stream socket"); close(sock); }
使用:
- gcc service.c -o service
- gcc client.c -o client
- linux下启动一个窗口运行 ./service
- 启动另一个窗口运行 ./client socket 【这个socket为service中绑定的地址】
运行后可以发现,在当前目录下会多一个名叫socket的文件,这2个进程就是基于该文件通信的
Unix domain socket vs Internet domain socket
先来看一个使用案例,配置php-fpm与Nginx交互的socket:
fastcgi_pass 127.0.0.1:9000 fastcgi_pass unix:/var/run/php-fpm/php-fpm.sock
这个案例中,运行在同一台机器上的php和Nginx需要通信,有2种实现方式:第一种是ip socket,通过本机回环地址127.0.0.1加端口实现;第二种是通过unix domain socket实现。哪一种效率更高呢?
基于localhost的ip socket需要实现跨网络主机通讯的全部环节,包括建立socket连接,ACk开销,tcp流控,封装/解封,路由。在这个过程中还会有2个context switch,因为使用网络层传输数据需要调用system call,而调用system call会产生中断,导致context switch的;另外一个进程接受到来自网络层的连接请求,也会产生系统中断,导致context switch。以上过程导致2个context switch的开销,外加其它各种开销(overhead)。
如何通过命令行访问unix socket文件
socket为什么不能用传统命令访问?
socket文件不能通过普通的文件读写命令操作(比如说echo "xxx" > socket.file)它。因为它是在网络层上面工作的。只能通过socket读写函数去操作它。
socat和ncat命令
其实通过的linux命令socat和ncat可以去操作socket。
其中-U指定了该文件是Unix域socket文件类型,ncat实现了类似于cat命令的访问unix socket。
ncat -U /tmp/tbsocket1
ncat也可以通过映射socket文件到监听的端口上。那么通过curl可以发送请求到该监听端口,实现写操作。
# 映射tcp的8080流量到unix socket ncat -vlk 8080 -c 'ncat -U /tmp/tbsocket1' # 通过curl发起http请求访问 curl http://localhost:8080
也可以使用功能更强大的socat来实现。
# 映射8080/tcp 到unix socket socat -d -d TCP-LISTEN:8080,fork UNIX:/tmp/tbsocket1
用 Curl 命令访问 Unix Socket 接口的方法
经常遇到一些监听地址不是 IP:Port 而是 unix socket 的程序,这些程序如果使用的是 HTTP 协议,unix socket 接口也可以用 curl 访问。
例如 ingress-nginx 的监听地址为 unix:/tmp/nginx-status-server.sock:
server { listen unix:/tmp/nginx-status-server.sock; set $proxy_upstream_name "internal"; keepalive_timeout 0; gzip off; access_log off; location /healthz { return 200; } location /nginx_status { stub_status on; } ... 省略... }
用 curl 访问它的 unix socket 的方法如下:
$ curl --unix-socket /tmp/nginx-status-server.sock http://localhost/nginx_status Active connections: 77 server accepts handled requests 64273 64273 971368 Reading: 0 Writing: 12 Waiting: 65
--unix-socket 指定 unix socket 文件的地址, http://localhost/nginx_status 是要请求的路径。
注意 localhost 可以根据实际情况更改成其它数值但不可省略,如果省略后变成 http://nginx_status,那么 nginx_status 会被认作是 Host,Path 被认为是 /:
$ curl -v --unix-socket /tmp/nginx-status-server.sock http://nginx_status * Expire in 0 ms for 6 (transfer 0xe464ab3dd0) * Trying /tmp/nginx-status-server.sock... * Expire in 200 ms for 4 (transfer 0xe464ab3dd0) * Connected to nginx_status (/tmp/nginx-status-server.sock) port 80 (#0) > GET / HTTP/1.1 > Host: nginx_status > User-Agent: curl/7.64.0 > Accept: */*
本文暂时没有评论,来添加一个吧(●'◡'●)