socket通信基础

秃头王

发布于：2022年6月17日

1.socket介绍

所谓 socket（套接字），就是对网络中不同主机上的应用进程之间进行双向通信的端点的抽象。一个套接字就是网络上进程通信的一端，提供了应用层进程利用网络协议交换数据的机制。从所处的地位来讲，套接字上联应用进程，下联网络协议栈，是应用程序通过网络协议进行通信的接口，是应用程序与网络协议根进行交互的接口。 socket 可以看成是两个网络应用程序进行通信时，各自通信连接中的端点，这是一个逻辑上的概念。它是网络环境中进程间通信的 API，也是可以被命名和寻址的通信端点，使用中的每一个套接字都有其类型和一个与之相连进程。通信时其中一个网络应用程序将要传输的一段信息写入它所在主机的 socket 中，该 socket 通过与网络接口卡（NIC）相连的传输介质将这段信息送到另外一台主机的 socket 中，使对方能够接收到这段信息。socket 是由 IP 地址和端口结合的，提供向应用层进程传送数据包的机制。 socket 本身有“插座”的意思，在 Linux 环境下，用于表示进程间网络通信的特殊文件类型。本质为内核借助缓冲区形成的伪文件。既然是文件，那么理所当然的，我们可以使用文件描述符引用套接字。与管道类似的，Linux 系统将其封装成文件的目的是为了统一接口，使得读写套接字和读写文件的操作一致。区别是管道主要应用于本地进程间通信，而套接字多应用于网络进程间数据的传递。

// 套接字通信分两部分：
- 服务器端：被动接受连接，一般不会主动发起连接
- 客户端：主动向服务器发起连接
socket是一套通信的接口，Linux 和 Windows 都有，但是有一些细微的差别

2. 字节序

简介

现代 CPU 的累加器一次都能装载（至少）4 字节（这里考虑 32 位机），即一个整数。那么这 4 字节在内存中排列的顺序将影响它被累加器装载成的整数的值，这就是字节序问题。在各种计算机体系结构中，对于字节、字等的存储机制有所不同，因而引发了计算机通信领域中一个很重要的问题，即通信双方交流的信息单元（比特、字节、字、双字等等）应该以什么样的顺序进行传送。如

果不达成一致的规则，通信双方将无法进行正确的编码/译码从而导致通信失败。字节序，顾名思义字节的顺序，就是大于一个字节类型的数据在内存中的存放顺序(一个字节的数据当然就无需谈顺序的问题了)。

字节序分为大端字节序（Big-Endian）和小端字节序（Little-Endian）。大端字节序是指一个整数的最高位字节（23 ~ 31 bit）存储在内存的低地址处，低位字节（0 ~ 7 bit）存储在内存的高地址处；小端字节序则是指整数的高位字节存储在内存的高地址处，而低位字节则存储在内存的低地址处。

字节序举例

小端字节序

0x 01 02 03 04 - ff = 255

内存的方向 —–>

内存的低位 —–> 内存的高位

04 03 02 01

0x 11 22 33 44 12 34 56 78

大端字节序

0x 01 02 03 04

内存的方向—– >

内存的低位 —–> 内存的高位

01 02 03 04

0x 12 34 56 78 11 22 33 44

查看本机是大端字节序 or 小端字节序

/*************************************************************************
        > File Name: byteorder.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月18日 星期六 14时51分19秒
 ************************************************************************/

/*
 *  字节序: 字节在内存中存储的顺序
 *  小端字节序: 数据的高位字节存储在内存的高位地址,低位字节
存储在内存的底位地址。
 *  大端字节序: 数据的底位字节存储在内存的高位地址,高位字节
存储在内存的底位地址。
 *
 */

//通过代码检测当前主机的字节序
#include <stdio.h>

int main() {


    union{
        // 2 字节
        short value;
        // 2 字节
        char bytes[sizeof(short)];
    } test;

    test.value = 0x0102;

    printf("%d\n", test.bytes[0]);

    if((test.bytes[0] == 1) && (test.bytes[1] == 2)) {
        printf("大端字节序\n");
    } else if((test.bytes[0] == 2) && (test.bytes[1] == 1)){
        printf("小端字节序\n");
    } else {
        printf("%d --- %d \n", test.bytes[0], test.bytes[1]);
        printf("未知\n");
    }

    return 0;
}

字节序转换函数

当格式化的数据在两台使用不同字节序的主机之间直接传递时，接收端必然错误的解释之。解决问题的方法是：发送端总是把要发送的数据转换成大端字节序数据后再发送，而接收端知道对方传送过来的数据总是采用大端字节序，所以接收端可以根据自身采用的字节序决定是否对接收到的数据进行转换（小端机转换，大端机不转换）。

网络字节顺序是 TCP/IP 中规定好的一种数据表示格式，它与具体的 CPU 类型、操作系统等无关，从而可以保证数据在不同主机之间传输时能够被正确解释，网络字节顺序采用大端排序方式。 BSD Socket提供了封装好的转换接口，方便程序员使用。包括从主机字节序到网络字节序的转换函数： htons、htonl；从网络字节序到主机字节序的转换函数：ntohs、ntohl。

h - host 主机，主机字节序
to - 转换成什么
n - network 网络字节序
s - short unsigned short
l - long unsigned int

#include <arpa/inet.h>
// 转换端口
uint16_t htons(uint16_t hostshort); // 主机字节序 - 网络字节序
uint16_t ntohs(uint16_t netshort); // 网络字节序 - 主机字节序 
// 转IP
uint32_t htonl(uint32_t hostlong); // 主机字节序 - 网络字节序
uint32_t ntohl(uint32_t netlong); // 网络字节序 - 主机字节序

代码实现网络字节序与主机字节序转换

/*************************************************************************
        > File Name: byterans.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月18日 星期六 22时47分04秒
 ************************************************************************/


/*

    网络通信时,需要将主机字节序转换成网络字节序(大端),另外一端获取到数据以后根据情况将网络字节序转换成主机字节序。
        #include <arpa/inet.h>
        // 转换端口
        uint16_t htons(uint16_t hostshort); // 主机字节序 - 网络字节序
        uint16_t ntohs(uint16_t netshort); // 网络字节序 - 主机字节序
        // 转IP
        uint32_t htonl(uint32_t hostlong); // 主机字节序 - 网络字节序
        uint32_t ntohl(uint32_t netlong); // 网络字节序 - 主机字节序

 */

#include <stdio.h>
#include <arpa/inet.h>

int main() {

    // htons 转换端口
    unsigned short a = 0x0102;
    unsigned short b = htons(a);

    printf("0xa = %x \n0xb = %x\n", a, b);


    printf("\n==================================\n\n");

    // htol 转换ID
    char buf[4] = {192, 168, 1, 100};
    int num = *(int *)buf;
    // printf("%d", num);
    int sum = htonl(num);
    unsigned char *p = (char *)&sum;
    printf("%d %d %d %d\n", *p, *(p + 1), *(p + 2), *(p + 3));

    printf("\n==================================\n\n");

    // ntohl
    unsigned char buf1[4] = {1, 1, 168, 192};
    int num1 = *(int *)buf1;
    int sum1 = ntohl(num1);
    unsigned char *p1 = (unsigned char *) &sum1;
    printf("%d %d %d %d\n", *p1, *(p1 + 1), *(p1 + 2), *(p1 + 3));

    printf("\n==================================\n\n");

    // ntohs
    unsigned short a1 = 0x0201;
    unsigned short b1 = ntohs(a1);
    printf("0xa1 = %x\n0xb1 = %x\n", a1, b1);

    return 0;
}

3. socket 地址

1
2
3

// socket地址其实是一个结构体，封装端口号和IP等信息。后面的socket相关的api中需要使用到这个
socket地址。
// 客户端 -> 服务器（IP, Port）

通用 socket 地址

socket 网络编程接口中表示 socket 地址的是结构体 sockaddr，其定义如下：

#include <bits/socket.h>
struct sockaddr {
    sa_family_t sa_family;
    char sa_data[14];
};
typedef unsigned short int sa_family_t;

sa_family 成员是地址族类型（sa_family_t）的变量。地址族类型通常与协议族类型对应。常见的协议族（protocol family，也称 domain）和对应的地址族入下所示：

协议族	地址族	描述
PF_UNIX	AF_UNIX	UNIX本地域协议族
PF_INET	AF_INET	TCP/IPv4协议族
PF_INET6	AF_INET6	TCP/IPv6协议族

宏 PF_* 和 AF_* 都定义在 bits/socket.h 头文件中，且后者与前者有完全相同的值，所以二者通常混用。

sa_data 成员用于存放 socket 地址值。但是，不同的协议族的地址值具有不同的含义和长度，如下所示：

协议族	地址值含义和长度
PF_UNIX	文件的路径名，长度可达到108字节
PF_INET	16bit端口号和32bitIPv4地址，共6字节
PF_INET6	16bit端口号，32bit流标识，128bitIPv6地址，32bit范围ID，共26字节

由上表可知，14 字节的 sa_data 根本无法容纳多数协议族的地址值。因此，Linux 定义了下面这个新的通用的 socket 地址结构体，这个结构体不仅提供了足够大的空间用于存放地址值，而且是内存对齐的。

#include <bits/socket.h>
struct sockaddr_storage {
    sa_family_t sa_family;
    unsigned long int __ss_align;
    char __ss_padding[ 128 - sizeof(__ss_align) ];
};
typedef unsigned short int sa_family_t;

专用 socket 地址

很多网络编程函数诞生早于 IPv4 协议，那时候都使用的是 struct sockaddr 结构体，为了向前兼容，现在sockaddr 退化成了（void *）的作用，传递一个地址给函数，至于这个函数是 sockaddr_in 还是 sockaddr_in6，由地址族确定，然后函数内部再强制类型转化为所需的地址类型。

UNIX 本地域协议族使用如下专用的 socket 地址结构体：

#include <sys/un.h>
struct sockaddr_un
{
    sa_family_t sin_family;
    char sun_path[108];
};

TCP/IP 协议族有 sockaddr_in 和 sockaddr_in6 两个专用的 socket 地址结构体，它们分别用于 IPv4 和 IPv6：

#include <netinet/in.h>
struct sockaddr_in
{
    sa_family_t sin_family; /* __SOCKADDR_COMMON(sin_) */
    in_port_t sin_port; /* Port number. */
    struct in_addr sin_addr; /* Internet address. */
    /* Pad to size of `struct sockaddr'. */
    unsigned char sin_zero[sizeof (struct sockaddr) - __SOCKADDR_COMMON_SIZE -
    sizeof (in_port_t) - sizeof (struct in_addr)];
};
struct in_addr
{
    in_addr_t s_addr;
};
struct sockaddr_in6
{
    sa_family_t sin6_family;
    in_port_t sin6_port; /* Transport layer port # */
    uint32_t sin6_flowinfo; /* IPv6 flow information */
    struct in6_addr sin6_addr; /* IPv6 address */
    uint32_t sin6_scope_id; /* IPv6 scope-id */
};
typedef unsigned short uint16_t;
typedef unsigned int uint32_t;
typedef uint16_t in_port_t;
typedef uint32_t in_addr_t;
#define __SOCKADDR_COMMON_SIZE (sizeof (unsigned short int))

所有专用 socket 地址（以及 sockaddr_storage）类型的变量在实际使用时都需要转化为通用 socket 地址类型 sockaddr（强制转化即可），因为所有 socket 编程接口使用的地址参数类型都是 sockaddr。

4. IP地址转换（字符串ip-整数，主机、网络字节序的转换）

通常，人们习惯用可读性好的字符串来表示 IP 地址，比如用点分十进制字符串表示 IPv4 地址，以及用十六进制字符串表示 IPv6 地址。但编程中我们需要先把它们转化为整数（二进制数）方能使用。而记录日志时则相反，我们要把整数表示的 IP 地址转化为可读的字符串。下面 3 个函数可用于用点分十进制字符串表示的 IPv4 地址和用网络字节序整数表示的 IPv4 地址之间的转换：

#include <arpa/inet.h>
in_addr_t inet_addr(const char *cp);
int inet_aton(const char *cp, struct in_addr *inp);
char *inet_ntoa(struct in_addr in);

下面这对更新的函数也能完成前面 3 个函数同样的功能，并且它们同时适用 IPv4 地址和 IPv6 地址：

#include <arpa/inet.h>
// p:点分十进制的IP字符串， n:表示network，网络字节序的整数
int inet_pton(int af, const char *src, void *dst);
    af:地址族： AF_INET AF_INET6
    src:需要转换的点分十进制的IP字符串
    dst:转换后的结果保存在这个里面
// 将网络字节序的整数，转换成点分十进制的IP地址字符串
const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);
    af:地址族： AF_INET AF_INET6
    src: 要转换的ip的整数的地址
    dst: 转换成IP地址字符串保存的地方
    size：第三个参数的大小（数组的大小）
    返回值：返回转换后的数据的地址（字符串），和 dst 是一样的

C代码-实现 IP地址转换函数

/*************************************************************************
        > File Name: iptrans.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月20日 星期一 19时45分21秒
 ************************************************************************/

/*

    #include <arpa/inet.h>

    // p:点分十进制的IP字符串， n:表示network，网络字节序 的整数
    int inet_pton(int af, const char *src, void *dst);
        af:地址族： AF_INET AF_INET6
        src:需要转换的点分十进制的IP字符串
        dst:转换后的结果保存在这个里面
    // 将网络字节序的整数，转换成点分十进制的IP地址字符串
    const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);
        af:地址族： AF_INET AF_INET6
        src: 要转换的ip的整数的地址
        dst: 转换成IP地址字符串保存的地方
        size：第三个参数的大小（数组的大小）
        返回值：返回转换后的数据的地址（字符串），和 dst  是一样的

 */

#include <stdio.h>
#include <string.h>
#include<arpa/inet.h>

int main() {

    // 创建一个ip字符串,点分十进制的
    char buf[] = "192.168.1.1";

    unsigned int num = 0;
    // 将点分十进制的IP字符串
    inet_pton(AF_INET, buf, &num);

    unsigned char *p = (unsigned char *)&num;
    printf("%d %d %d %d \n", *p, *(p + 1), *(p + 2), *(p + 3));


    // 将网络字节序的IP整数
    char ip[16] = "";
    const char *str = inet_ntop(AF_INET, &num, ip, sizeof(ip));

    printf("str : %s\n", str);
    printf("ip : %s\n", ip);
    printf("ip == str = %d\n", str == ip);
    return 0;
}

5. TCP通信流程

TCP - UDP 特点区别

1
2
3

// TCP 和 UDP -> 传输层的协议
UDP:用户数据报协议，面向无连接，可以单播，多播，广播， 面向数据报，不可靠
TCP:传输控制协议，面向连接的，可靠的，基于字节流，仅支持单播传输

	UDP	TCP
是否创建连接	无连接	面向连接
是否可靠	不可靠	可靠的
连接的对象个数	一对一、一对多、多对多、多对一	支持一对一
传输方式	面向数据报	面向字节流
首部开销	8个字节	最少20个字节
适用场景	实时应用（视频会议，直播）	可靠性高的应用（文件传输）

// TCP 通信的流程
// 服务器端 （被动接受连接的角色）
1. 创建一个用于监听的套接字
	- 监听: 监听有客户端的连接
	- 套接字: 这个套接字其实就是一个文件描述符
2. 将这个监听文件描述符和本地的IP和端口绑定（IP和端口就是服务器的地址信息）
	- 客户端连接服务器的时候使用的就是这个IP和端口
3. 设置监听，监听的fd开始工作
4. 阻塞等待，当有客户端发起连接，解除阻塞，接受客户端的连接，会得到一个和客户端通信的套接字（fd）
5. 通信
	- 接收数据
	- 发送数据
6. 通信结束，断开连接

// 客户端
1.创建一个用于通信的套接字(fd)
不需要绑定IP和端口
	客户端IP会有的但是端口是随机的、连接到服务器刚开始会进行3次握手、两端都记录了两端的IP和端口
2.连接服务器，需要指定的连接的服务器的 IP 和 端口
3. 连接成功，客户端可以和服务器直接铜线
	- 接受数据
	- 发送数据
6.通信结束，断开连接

6. 套接字函数

#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h> // 包含了这个头文件，上面两个就可以省略

int socket(int domain, int type, int protocol);
	- 功能：创建一个套接字
	- 参数：
		- domain: 协议族
			AF_INET : ipv4
			AF_INET6 : ipv6
			AF_UNIX, AF_LOCAL : 本地套接字通信（进程间通信）
			... ...
		- type: 通信过程中使用的协议类型
			SOCK_STREAM : 流式协议 - TCP
			SOCK_DGRAM : 报式协议 - UDP
			... ... 
		- protocol: 具体的一个协议。一般写 0 情况下
			- SOCK_STREAM : 流式协议默认使用 TCP
			- SOCK_DGRAM : 报式协议默认使用 UDP
		- 返回值: 
			- 成功：返回文件描述符，操作的就是内核缓冲区。
			- 失败：-1
                
// 绑定也叫 - socket命名
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
	- 功能: 绑定，将fd 和本地的IP + 端口进行绑定
	- 参数:
		- sockfd : 通过socket函数得到的文件描述符
		- addr : 需要绑定的socket地址，这个地址封装了ip和端口号的信息
		- addrlen : 第二个参数结构体占的内存大小
	- 返回值:
		- 成功: 返回 0
		- 失败: 返回 -1 并设置错误号
            
int listen(int sockfd, int backlog);
	- 功能：监听这个socket上的连接
	- 参数：
		- sockfd : 通过socket()函数得到的文件描述符
		- backlog : 未连接的和已经连接的和的最大值, 一般指定 5 就够了,不能超过下面查看的值
			查看最大连接  // cat /proc/sys/net/core/somaxconn   
	- 返回值:
		- 成功: 返回 0
		- 失败: 返回 -1 并设置错误号
            
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
	- 功能：接收客户端连接，默认是一个阻塞的函数，阻塞等待客户端连接
	- 参数：
		- sockfd : 用于监听的文件描述符
		- addr : 传出参数，记录了连接成功后客户端的地址信息（ip，port）
		- addrlenvv : 指定第二个参数的对应的内存大小
		- 返回值：
			- 成功: 用于通信的文件描述符
			- 失败: -1
                
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
	- 功能: 客户端连接服务器
	- 参数:
		- sockfd: 用于通信的文件描述符
		- addr: 客户端要连接的服务器的地址信息
		- addrlen: 第二个参数的内存大小
		- 返回值:
			- 成功: 0
			- 失败: -1
                
// 写数据
ssize_t write(int fd, const void *buf, size_t count); 

// 读数据
ssize_t read(int fd, void *buf, size_t count);

TCP - 手动输入消息 - 回射

服务器

/*************************************************************************
        > File Name: server.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月22日 星期三 18时45分38秒
 ************************************************************************/

#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <stdlib.h>
// TCP 通信的服务器端E

int main() {

    // 1.创建socket(用于监听套接字)
    int lfd = socket(AF_INET, SOCK_STREAM, 0);

    if(lfd == 1) {
        perror("socket");
        exit(-1);
    }

    // 2.绑定 IP 和 端口
    struct sockaddr_in saddr;
    saddr.sin_family = AF_INET;
    // inet_net_pton(AF_INET, "192.168.3.206", saddr.sin_addr.s_addr);
    saddr.sin_addr.s_addr = INADDR_ANY; // = 0; // 0.0.0.0 任意地址 客户端不能这面写
    saddr.sin_port = htons(9999);
    int ret = bind(lfd, (struct sockaddr *)&saddr, sizeof(saddr));
    if(ret == -1) {
        perror("bind");
        exit(-1);
    }

    // 3.监听
    ret = listen(lfd, 8);
    if(ret == -1) {
        perror("listen");
        exit(-1);
    }

    // 4.接受客户端的连接 - 阻塞
    struct sockaddr_in clientaddr;
    socklen_t len = sizeof(clientaddr);
    int cfd = accept(lfd, (struct sockaddr *)&clientaddr, &len);

    if(cfd == -1) {
        perror("accept");
        exit(-1);
    }

    // 输出客户端的信息
    char clientIP[16];
    inet_ntop(AF_INET, &clientaddr.sin_addr.s_addr, clientIP, sizeof(clientIP));
    unsigned short clientPort = ntohs(clientaddr.sin_port);
    printf("client ip is %s, prot is %d\n", clientIP, clientPort);


    while(1) {
        // 5.通信
        // 获取客户的数据
        char recvBuf[1024] = {0};
        int readLen = read(cfd, recvBuf, sizeof(recvBuf));
        if(readLen == -1) {
            perror("read");
            exit(-1);
        } else if(readLen > 0) {
            printf("recv client data : %s\n", recvBuf);
        } else if(readLen == 0) {
            // 客户端断开连接
            printf("client closed ... ...\n");
            break;
        }
         // 给客户端发送数据
        char *data = "hello, i am server";
        write(cfd, recvBuf, strlen(data));
    }



    // 关闭文件描述符
    close(cfd);
    close(lfd);

    return 0;
}

客户端

/*************************************************************************
        > File Name: client.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月23日 星期四 14时41分42秒
 ************************************************************************/

#include <stdio.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
// TCP 通信客户端

int main() {

    // 1.创建套接字
        int fd = socket(AF_INET, SOCK_STREAM, 0);
        if(fd == -1) {
                perror("socket");
                exit(-1);
        }

        // 2.连接服务
        struct sockaddr_in serveraddr;
        serveraddr.sin_family = AF_INET;
        serveraddr.sin_port = htons(9999);
        inet_pton(AF_INET, "192.168.222.139", &serveraddr.sin_addr.s_addr);
        int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));

        if(ret == -1) {
                perror("connect");
                exit(-1);
        }


        // 通信
        char recvBuf[1024] = {0};
        char data[1024];
        while (1) {
                memset(data, 0, sizeof(data));
                // 获取标准输入(stdin)的数据
                fgets(data, sizeof(data), stdin);
                write(fd, data, strlen(data));
                int readLen = read(fd, recvBuf, sizeof(recvBuf));
        if(readLen == -1) {
                perror("read");
                exit(-1);
        } else if(readLen > 0) {
                printf("recv server data : %s\n", recvBuf);
        } else if(readLen == 0) {
                // 表示服务端断开连接
                printf("server closed ... ...\n");
                        break;
        }
        }

        // 关闭
        close(fd);

        return 0;
}

7. TCP 三次握手

TCP 是一种面向连接的单播协议，在发送数据前，通信双方必须在彼此间建立一条连接。所谓的“连接”，其实是客户端和服务器的内存里保存的一份关于对方的信息，如 IP 地址、端口号等。

TCP 可以看成是一种字节流，它会处理 IP 层或以下的层的丢包、重复以及错误问题。在连接的建立过程中，双方需要交换一些连接的参数。这些参数可以放在 TCP 头部。

TCP 提供了一种可靠、面向连接、字节流、传输层的服务，采用三次握手建立一个连接。采用四次挥手来关闭一个连接。

三次握手的目的是保证双方互相之间建立了连接

三次握手发生在客户端连接的时候，当调用connect(),底层会通过TCP协议进行三次握手。

TCP三次握手四次挥手 - 图解

为社么不能2次握手

直接说你做我女朋友行吗？

回复好的

答:客户端要知道自己能发数据也能收数据服务端也是一样的

客户端给服务器发能确保的是客户端可以发送数据，但是不能确定服务端的收和发是否是好使的

服务端收到信息了服务端可以确定自己收是好的还能确定客户端的发是好的

(客) C -> S(服)

服务端回一个数据就能确定自己发也是没有问题的

客户端收到信息能确定自己的收是没有问题也能确定服务端的收发是没有问题的

(客) C <- S(服)

服务端收到客户发来的数据就知道客户端的收是好的

(客) C -> S(服)

ACK: 用来做确认的

SYN: 用来做连接的

FIN: 用来做四次挥手的断开连接的

16 位端口号（port number）：告知主机报文段是来自哪里（源端口）以及传给哪个上层协议或应用程序（目的端口）的。进行 TCP 通信时，客户端通常使用系统自动选择的临时端口号。
32 位序号（sequence number）：一次 TCP 通信（从 TCP 连接建立到断开）过程中某一个传输方向上的字节流的每个字节的编号。假设主机 A 和主机 B 进行 TCP 通信，A 发送给 B 的第一个 TCP 报文段中，序号值被系统初始化为某个随机值 ISN（Initial Sequence Number，初始序号值）。那么在该传输方向上（从 A 到 B），后续的 TCP 报文段中序号值将被系统设置成 ISN 加上该报文段所携带数据的第一个字节在整个字节流中的偏移。例如，某个 TCP 报文段传送的数据是字节流中的第 1025 ~ 2048 字节，那么该报文段的序号值就是 ISN + 1025。另外一个传输方向（从 B 到 A）的 TCP 报文段的序号值也具有相同的含义。
32 位确认号（acknowledgement number）：用作对另一方发送来的 TCP 报文段的响应。其值是收到的 TCP 报文段的序号值 + 标志位长度（SYN，FIN） + 数据长度。假设主机 A 和主机 B 进行 TCP 通信，那么 A 发送出的 TCP 报文段不仅携带自己的序号，而且包含对 B 发送来的 TCP 报文段的确认号。反之，B 发送出的 TCP 报文段也同样携带自己的序号和对 A 发送来的报文段的确认序号。
4 位头部长度（head length）：标识该 TCP 头部有多少个 32 bit(4 字节)。因为 4 位最大能表示 15，所以 TCP 头部最长是60 字节。 - 功能：客户端连接服务器 - 参数： - sockfd : 用于通信的文件描述符 - addr : 客户端要连接的服务器的地址信息 - addrlen : 第二个参数的内存大小 - 返回值：成功 0，失败 -1 ssize_t write(int fd, const void *buf, size_t count); // 写数据 ssize_t read(int fd, void *buf, size_t count); // 读数据
6 位标志位包含如下几项：
- URG 标志，表示紧急指针（urgent pointer）是否有效。
- ACK 标志，表示确认号是否有效。我们称携带 ACK 标志的 TCP 报文段为确认报文段。
- PSH 标志，提示接收端应用程序应该立即从 TCP 接收缓冲区中读走数据，为接收后续数据腾出空间（如果应用程序不将接收到的数据读走，它们就会一直停留在 TCP 接收缓冲区中）。
- RST 标志，表示要求对方重新建立连接。我们称携带 RST 标志的 TCP 报文段为复位报文段。
- SYN 标志，表示请求建立一个连接。我们称携带 SYN 标志的 TCP 报文段为同步报文段。
- FIN 标志，表示通知对方本端要关闭连接了。我们称携带 FIN 标志的 TCP 报文段为结束报文段。
- 16 位窗口大小（window size）：是 TCP 流量控制的一个手段。这里说的窗口，指的是接收通告窗口（Receiver Window，RWND）。它告诉对方本端的 TCP 接收缓冲区还能容纳多少字节的数据，这样对方就可以控制发送数据的速度。
- 16 位校验和（TCP checksum）：由发送端填充，接收端对 TCP 报文段执行 CRC 算法以校验 TCP 报文段在传输过程中是否损坏。注意，这个校验不仅包括 TCP 头部，也包括数据部分。这也是 TCP 可靠传输的一个重要保障。
- 16 位紧急指针（urgent pointer）：是一个正的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一个字节的序号。因此，确切地说，这个字段是紧急指针相对当前序号的偏移，不妨称之为紧急偏移。TCP 的紧急指针是发送端向接收端发送紧急数据的方法。

时序图

第一次握手:
	1.客户端将SYN标志为1
	2.生成一个随机的32位的序号seq = J，这序号后边是可以携带数据 (数据的大小)
第二个次握手:
	1.服务器端接收客户端的连接: ACK = 1
	2.服务器会回发一个确认序号: ack = 客户的序号 + 数据的长度 + SYN/FIN(按一个字节来算)
	3.服务器端会向客户端发起连接请求: SYN = 1
	4.服务器也会生成一个随机序号: seq = K
第三次握手:
	1.客户端应答服务器的连接请求: ACK = 1
	2.客户端回复收到了服务端的数据: ack = 服务端的序号 + 数据长度 + SYN/FIN(按一个字节算)

序号和确认序号通信的过程

8. TCP 滑动窗口

滑动窗口（Sliding window）是一种流量控制技术。早期的网络通信中，通信双方不会考虑网络的拥挤情况直接发送数据。由于大家不知道网络拥塞状况，同时发送数据，导致中间节点阻塞掉包，谁也发不了数据，所以就有了滑动窗口机制来解决此问题。滑动窗口协议是用来改善吞吐量的一种技术，即容许发送方在接收任何应答之前传送附加的包。接收方告诉发送方在某一时刻能送多少包（称窗口尺寸）。 TCP 中采用滑动窗口来进行传输控制，滑动窗口的大小意味着接收方还有多大的缓冲区可以用于接收数据。发送方可以通过滑动窗口的大小来确定应该发送多少字节的数据。当滑动窗口为 0 时，发送方一般不能再发送数据报。

滑动窗口是 TCP 中实现诸如 ACK 确认、流量控制、拥塞控制的承载结构。

窗口理为缓冲区的大小

滑动窗口的大小会随着发送数据和接受数据而变化

通信的双方都有发送的缓冲区和接收数据的缓冲区

服务器:

发送缓冲区 (发送缓冲区的窗口)

接受缓冲区 (接收缓冲区的窗口)

客户端

发送缓冲区 (发送缓冲区的窗口)

接受缓冲区

发送方的缓冲区:
	白色格子: 空闲的空间
	灰色格子: 数据已经被发送出去，但是还没有被接收,服务-回复ack确认收到那了
	紫色格子: 还没有发送出去的数据
        
接受收方的缓冲区:
	白色格子: 空闲空间
	紫色格子: 已经接收到的数据

# mss: Maximum Segment Size(一条数据的最大的数据量)
# win: 滑动窗口 
1. 客户端向服务器发起连接，客户端的滑动窗口是4096,一次发送的最大的数据是1460
2. 服务器接收连接情况,告诉客户端服务的窗口大小是6144，一次发送的最大的数据是1024
3. 第三次握手
4. 第4 - 9客户端连续给服务器发送了6k的数据, 每次发送1k
5. 第10次, 服务器告诉客户端: 发送的6k数据以及接收到, 存储在缓冲区中, 缓冲区数据已经处理了2k, 窗口大小是2k
6. 第11次, 服务器告诉客户端: 发送的6k数据以及接收到, 存储在缓冲区中, 缓冲区数据已经处理了4k, 窗口大小是4k
7. 第12次, 给服务器发送了1k数据
# 客户端发送请求断开连接 - 第一次挥手
8. 第13次, 客户端主动发起请求和服务器断开连接, 并且给服务器发送了1k数据
9. 第14次, 服务器回复ACK 8194  a:同意断开请求 b:告诉客户端已经接受到对方的才发的2k数据 c: 滑动窗口2k
# 客户端一方断开后是不能发送数据了,但是可以接受数据
10. 第15、16, 通知客户端
11. 第17次, 第三次挥手服务器给客户端发送FIN请求断开连接
12. 第18次, 第四次回收, 客户端同意了服务器的断开
# 第一次握手 不能携带数据
	因为: 三次握手还没建立连接就不能携带数据
# 第二次握手之后
	左边就可以给右面发送数据了, 但是右面不能给给左面发送数据, 只能等三次握手结束后右面才能给左面发送数据

9. TCP 四次挥手

1
2
3

四次挥手发生在断开连接的时候，在程序中调用了close()会使用TCP协议进行四次挥手。
客户端和服务器都可以主动发起断开连接,谁先调用close()谁就是发起。
因为在TCP连接的时候, 采用三次握手建立的连接是双向的, 在断开的时候也需要双向断开。

TCP 通信并发 - 进程

TCP多用户和服务器传输

要实现TCP通信服务器处理并发的任务, 使用多线程或者多进程来解决。

思路:
	1. 一个父进程, 多个子进程
	2. 父进程负责等待并接受客户端的连接
	3. 子进程: 完成通信, 接受一个客户端连接, 就创建一个子进程用于通信

server_process.c

/*************************************************************************
        > File Name: server_process.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月26日 星期日 21时33分58秒
 ************************************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <sys/types.h>
#include <signal.h>
#include <wait.h>
#include <errno.h>

void recyleChild(int arg) {
    while(1) {
        int ret = waitpid(-1, NULL, WNOHANG);
        if(ret == -1) {
            // 所有的子进程都回收了
            break;
        } else if(ret == 0) {
            // 还有子进程活着
            break;
        } else if(ret > 0){
            // 被回收的子进程的 PID
            printf("子进程: %d 被回收了\n", ret);
        }
    }
}

int main() {

    // 注册信号捕捉
    struct sigaction act;
    act.sa_flags = 0;
    sigemptyset(&act.sa_mask);
    act.sa_handler = recyleChild;

    sigaction(SIGCHLD, &act, NULL);

    int ret = -1;

    // 创建一个socket PF 和 AF 是一样的可以混用
    int lfd = socket(PF_INET, SOCK_STREAM, 0);

    if(lfd == -1) {
        perror("socket");
        exit(-1);
    }

    // 绑定
    struct sockaddr_in saddr;
    saddr.sin_family = AF_INET;
    saddr.sin_port = htons(5210);
    saddr.sin_addr.s_addr = INADDR_ANY;
    ret = bind(lfd, (struct sockaddr *)&saddr, sizeof(saddr));
    if(ret == -1) {
        perror("bind");
        exit(-1);
    }

    // 监听
    ret = listen(lfd, 128);
    if(ret == -1) {
        perror("listen");
        exit(-1);
    }

    // 不断循环 等待接受客户端
    while(1) {

        // 保存连接进来的客户端的信息
        struct sockaddr_in cliaddr;
        // int len = sizeof(cliaddr);
        socklen_t len = sizeof(cliaddr);
        // 接受连接
        int cfd = accept(lfd, (struct sockaddr *)&cliaddr, &len);
        if(cfd == -1) {
            if(errno == EINTR) {
                continue;
            }
            perror("accept");
            exit(-1);
        }

        // 每一个连接进来, 都创建一个子进程跟客户端通信
        pid_t pid = fork();
        if(pid == 0) {
            // 子进程
            // 获取客户端的信息
            char cliIP[16];
            inet_ntop(AF_INET, &cliaddr.sin_addr.s_addr, cliIP, sizeof(cliIP));
            unsigned short cliProt = ntohs(cliaddr.sin_port);
            printf("client ip is : %s, prot is : %d\n", cliIP, cliProt);

            // 接受客户端发来的数据
            char recvBuf[1024];
            while(1) {
                memset(recvBuf, 0, sizeof(recvBuf));
                int len = read(cfd, &recvBuf, sizeof(recvBuf));
                if(len == -1) {
                    perror("read");
                    exit(-1);
                } else if(len > 0) {
                    printf("IP : %s\n recv client Data : %s\n\n", cliIP, recvBuf);
                } else {
                    printf("client closed ... ...\n");
                    break;
                }

                // 回射
                write(cfd, recvBuf, strlen(recvBuf));
            }
            close(cfd);
            // 退出当前子进程
            exit(0);
        }
    }

    close(lfd);

    return 0;
}

client.c

/*************************************************************************
        > File Name: client.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月23日 星期四 14时41分42秒
 ************************************************************************/

#include <stdio.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
// TCP 通信客户端

int main() {

    // 1.创建套接字
        int fd = socket(AF_INET, SOCK_STREAM, 0);
        if(fd == -1) {
                perror("socket");
                exit(-1);
        }

        // 2.连接服务
        struct sockaddr_in serveraddr;
        serveraddr.sin_family = AF_INET;
        serveraddr.sin_port = htons(5210);
        inet_pton(AF_INET, "192.168.222.1", &serveraddr.sin_addr.s_addr);
        int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));

        if(ret == -1) {
                perror("connect");
                exit(-1);
        }


        // 通信
        char recvBuf[1024] = {0};
        char data[1024];
        while (1) {
                memset(data, 0, sizeof(data));
        memset(recvBuf, 0, sizeof(recvBuf));
                // 获取标准输入(stdin)的数据
                fgets(data, sizeof(data), stdin);
                write(fd, data, strlen(data));
                int readLen = read(fd, recvBuf, sizeof(recvBuf));
        if(readLen == -1) {
                perror("read");
                exit(-1);
        } else if(readLen > 0) {
                printf("recv server data : %s\n", recvBuf);
        } else if(readLen == 0) {
                // 表示服务端断开连接
                printf("server closed ... ...\n");
                        break;
        }
        }

        // 关闭
        close(fd);

        return 0;
}

TCP 通信并发 - 线程

server_thread.c

/*************************************************************************
        > File Name: server_thread.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月27日 星期一 18时00分07秒
 ************************************************************************/

#include <stdio.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <pthread.h>

struct sockInfo {
        // 通信的文件描述符
        int fd;
        // 线程号
        pthread_t tid;
        // 客户端的信息
        struct sockaddr_in addr;
};

struct sockInfo sockinfos[128];

void *working(void *arg) {
        // 子线程和客户端通信 cfd、客户端的信息、线程号
        // 获取客户端信息
        struct sockInfo *pinfo = (struct sockInfo *) arg;

        char cliIP[16];
        inet_ntop(AF_INET, &pinfo->addr.sin_addr.s_addr, cliIP, sizeof(cliIP));
        unsigned short cliPort = pinfo->addr.sin_port;
        printf("clien ip is : %s, prot is %d\n", cliIP, cliPort);
        char recvBuf[1024];
        while(1) {
                memset(recvBuf, 0, sizeof(recvBuf));
                int len = read(pinfo->fd, &recvBuf, sizeof(recvBuf));
                if(len == -1) {
                        perror("read");
                        exit(-1);
                } else if(len > 0) {
                        printf("IP : %s\n recv client Data : %s\n\n", cliIP, recvBuf);
                } else {
                        printf("client closed ... ...\n");
                        break;
                }
                // 回射
                write(pinfo->fd, recvBuf, strlen(recvBuf));
        }
        pinfo->fd = -1;
        pinfo->tid = -1;
        close(pinfo->fd);
    return NULL;
}

int main() {

    // 创建一个socket()
        int lfd = socket(AF_INET, SOCK_STREAM, 0);

        if(lfd == -1) {
                perror("socket");
                exit(-1);
        }

        // 绑定
        struct sockaddr_in saddr;
        saddr.sin_family = AF_INET;
        saddr.sin_port = htons(5200);
        saddr.sin_addr.s_addr = INADDR_ANY;
        int ret = bind(lfd, (struct sockaddr *)&saddr, sizeof(saddr));

        // 监听
        ret = listen(lfd, 128);
        if(ret == -1) {
                perror("listen");
                exit(-1);
        }

        // 初始化数据
        int max = sizeof(sockinfos) / sizeof(sockinfos[0]);
        for(int i = 0; i < max; i++) {
                bzero(&sockinfos[i], sizeof(sockinfos[i]));
                sockinfos[i].fd = -1;
                sockinfos[i].tid = -1;
        }

        // 循环等待客户端连接, 一旦一个客户端连接进来, 就创建一个线程进行通信

        while(1) {

                struct sockaddr_in cliaddr;
                socklen_t len = sizeof(cliaddr);

                int cfd = accept(lfd, (struct sockaddr *) &cliaddr, &len);

                // 文件描述符fd、客户端的信息addr、线程号tid
                struct sockInfo *pinfo;
                for(int i = 0; i < max; i++) {

                        // 从这个数组中找到一个可以用的sockInfo变量/元素
                        if(sockinfos[i].fd == -1) {
                                pinfo = &sockinfos[i];
                                break;
                        }
                        if(i == max - 1) {
                                sleep(1);
                                i--;
                        }
                }

                pinfo->fd = cfd;
                memcpy(&pinfo->addr, &cliaddr, len);

                // 创建子线程
                // pthread_t tid;
                pthread_create(&pinfo->tid, NULL, working, pinfo);

                // 线程分离 - 使线程在结束时候自动回收
                pthread_detach(pinfo->tid);

        }

        close(lfd);

    return 0;
}

gcc server_thread.c -o server_thread -pthread

client.c

/*************************************************************************
        > File Name: client.c
        > Author: 秃头王
        > Mail: 1658339000@qq.com
        > Created Time: 2022年06月23日 星期四 14时41分42秒
 ************************************************************************/

#include <stdio.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
// TCP 通信客户端

int main() {

    // 1.创建套接字
        int fd = socket(AF_INET, SOCK_STREAM, 0);
        if(fd == -1) {
                perror("socket");
                exit(-1);
        }

        // 2.连接服务
        struct sockaddr_in serveraddr;
        serveraddr.sin_family = AF_INET;
        serveraddr.sin_port = htons(5200);
        inet_pton(AF_INET, "192.168.222.1", &serveraddr.sin_addr.s_addr);
        int ret = connect(fd, (struct sockaddr *)&serveraddr, sizeof(serveraddr));

        if(ret == -1) {
                perror("connect");
                exit(-1);
        }


        // 通信
        char recvBuf[1024] = {0};
        char data[1024];
        while (1) {
                memset(data, 0, sizeof(data));
        memset(recvBuf, 0, sizeof(recvBuf));
                // 获取标准输入(stdin)的数据
                fgets(data, sizeof(data), stdin);
                write(fd, data, strlen(data));
                int readLen = read(fd, recvBuf, sizeof(recvBuf));
        if(readLen == -1) {
                perror("read");
                exit(-1);
        } else if(readLen > 0) {
                printf("recv server data : %s\n", recvBuf);
        } else if(readLen == 0) {
                // 表示服务端断开连接
                printf("server closed ... ...\n");
                        break;
        }
        }

        // 关闭
        close(fd);

        return 0;
}

11. TCP 状态转换

红色线: 客户端

绿色线: 服务器

2MSL（Maximum Segment Lifetime）

主动断开连接的一方, 最后进出入一个 TIME_WAIT状态, 这个状态会持续: 2ms
- msl: 官方建议: 2分钟, 实际是30s

当 TCP 连接主动关闭方接收到被动关闭方发送的 FIN 和最终的 ACK 后，连接的主动关闭方必须处于TIME_WAIT 状态并持续 2MSL 时间。

这样就能够让 TCP 连接的主动关闭方在它发送的 ACK 丢失的情况下重新发送最终的 ACK。主动关闭方重新发送的最终 ACK 并不是因为被动关闭方重传了 ACK（它们并不消耗序列号，被动关闭方也不会重传），而是因为被动关闭方重传了它的 FIN。事实上，被动关闭方总是重传 FIN 直到它收到一个最终的 ACK。

半关闭

当 TCP 链接中 A 向 B 发送 FIN 请求关闭，另一端 B 回应 ACK 之后（A 端进入 FIN_WAIT_2 状态），并没有立即发送 FIN 给 A，A 方处于半连接状态（半开关），此时 A 可以接收 B 发送的数据，但是 A 已经不能再向 B 发送数据。

从程序的角度，可以使用 API 来控制实现半连接状态

#include <sys/socket.h>
int shutdown(int sockfd, int how);
	sockfd: 需要关闭的socket的描述符
	how: 允许为shutdown操作选择以下几种方式:
		SHUT_RD(0)： 关闭sockfd上的读功能，此选项将不允许sockfd进行读操作。
		该套接字不再接收数据，任何当前在套接字接受缓冲区的数据将被无声的丢弃掉。
		SHUT_WR(1): 关闭sockfd的写功能，此选项将不允许sockfd进行写操作。进程不能在对此套接字发
出写操作。
		SHUT_RDWR(2):关闭sockfd的读写功能。相当于调用shutdown两次：首先是以SHUT_RD,然后以SHUT_WR。

使用 close 中止一个连接，但它只是减少描述符的引用计数，并不直接关闭连接，只有当描述符的引用计数为 0 时才关闭连接。shutdown 不考虑描述符的引用计数，直接关闭描述符。也可选择中止一个方向的连接，只中止读或只中止写。

注意:

如果有多个进程共享一个套接字，close 每被调用一次，计数减 1 ，直到计数为 0 时，也就是所用进程都调用了 close，套接字将被释放。
在多进程中如果一个进程调用了 shutdown(sfd, SHUT_RDWR) 后，其它的进程将无法进行通信。但如果一个进程 close(sfd) 将不会影响到其它进程。

12. 端口复用

端口复用最常用的用途是:

防止服务器重启时之前绑定的端口还未释放

程序突然退出而系统没有释放端口

#include <sys/types.h>
#include <sys/socket.h>
// 设置套接字的属性 (不仅仅能设置端口的复用)
int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen);
	参数:
		- socket: 要操作的文件描述符
		- level: 级别 - SOL_SOCKET (端口复用的级别)
		- optname: 选项的命称
			- SO_REUSEADDR
			- SO_REUSEPORT
		- optval: 端口复用的值(整形)
			- 1: 可以复用
			- 0: 不可以复用
		- oprlen: optval参数的大小
端口复用: 设置的时机是在服务器绑定端口之前。
	setsockopt();
	bind();

查看网络相关信息相关的命令

netstat

参数:
- -a 显示所有连接的socke
- -p 显示正在使用socket的程序的名称
- -n 直接使用IP
- -t 显示TCP
- -u 显示UDP

netstat -anp | grep 端口

TCP - 服务端和客户端 - 网络连接状态及其相关信息

正常通信下状态是不回改变

1
2
3

为什么有两个 server
	第一个是监听的
	第二个是建立连接的 ESTABLISHED

断开服务器端

可看上面图解 - 状态

更新于：2022年7月1日

IO多路复用

1. I/O多路复用（I/O多路转接）I/O 多路复用使得程序能同时监听多个文件描述符，能够提高程序的性能，Linux 下实现 I/O 多路复用的系统调...

网络基础

1.网络结构模式C/S结构简介服务器 - 客户机，即 Client - Server（C/S）结构。C/S 结构通常采取两层结构。服务器负责数据的管理，客户机负...

socket通信基础

1.socket介绍

2. 字节序

简介

字节序举例

查看本机是 大端字节序 or 小端字节序

字节序转换函数

代码实现 网络字节序 与 主机字节序 转换

3. socket 地址

通用 socket 地址

专用 socket 地址

4. IP地址转换（字符串ip-整数 ，主机、网络 字节序的转换）

C代码-实现 IP地址转换函数

5. TCP通信流程

TCP - UDP 特点区别

6. 套接字函数

TCP - 手动输入消息 - 回射

服务器

客户端

7. TCP 三次握手

TCP三次握手四次挥手 - 图解

为社么不能2次握手

时序图

序号 和 确认序号 通信的过程

8. TCP 滑动窗口

9. TCP 四次挥手

TCP 通信并发 - 进程

server_process.c

client.c

TCP 通信并发 - 线程

server_thread.c

client.c

11. TCP 状态转换

12. 端口复用

查看网络相关信息相关的命令

TCP - 服务端 和 客户端 - 网络连接状态及其相关信息

正常通信下状态是不回改变

断开服务器端

查看本机是大端字节序 or 小端字节序

代码实现网络字节序与主机字节序转换

4. IP地址转换（字符串ip-整数，主机、网络字节序的转换）

序号和确认序号通信的过程

TCP - 服务端和客户端 - 网络连接状态及其相关信息