项目上遇到一个这么的奇怪现象:一个包含有组播地址的对象,只能收到一次组播,不论这个组播是自己发送的还是别的客户端发送的,第二次变无法收到组播。
用tcpdump检查包发现这个对象不论发送多少次组播,底层协议栈只收到了一次组播包
注意第一行ubuntu.local.56752 > 239.0.0.5:12345,这是需要发送的组播地址与端口,从第一行以后再也没收到过相关的包了。
在这个发送流程中,经历了sendto,epoll_wait.recvfrom三个主要的操作。
把代码抠出来单独进行运行却没发现问题,但组合起来却无法收到组播,于是判断肯定是某些参数传输错误导致的。
在排除参数错误的时候,发现recvfrom和sendto同样使用了对象中同一个struct sockaddr,就是这个错误参数导致了第二次无法收到组播的问题。
在sendto中,函数接受struct sockaddr来对这个地址发送数据,而recvfrom里却接受struct sockaddr来存放数据包中的数据来源地址,所以导致第一次使用recvfrom接受数据后改写了地址对象,sendto再次使用此地址发送就会把数据发送到不知名的地方去了。
附上tcpdump的用法,这东西非常好用,通常网络方面的问题都可以看到,当然涉及丢包的问题还可以使用dropwatch来查看。
入门先可以man一下tcpdump的用法,比较常用的是其正则表达式功能与-vv等选项
有这么三种类型的关键字:
1.关于类型:指定host,net,port等,例如: tcpdump host 127.0.0.1 -vv 就是指名127.0.0.1这台主机
2.关于传输方向:指定传输方向如src,dst,dst or src, dst and src
3.关于协议:arp,rarp,ip,tcp,udp,如 tcpdump tcp -vv 就是收到默认网卡上tcp包的详细信息