go 分隔符处理粘包拆包问题

2023-07-12 21:45:01 +08:00
 awanganddong
定义一个 buffer 来临时存放消息
从 conn 里面读取固定字节大小内容,判断当前内容里面有没有分隔符
如果没有找到分隔符,把当前内容追加到 buffer 里面,然后重复第 2 步
如果找到分隔符,把当前内容里面分隔符之前的内容追加到 buffer 后输出
然后重置 buffer ,把分隔符之后的内容追加到 buffer ,重复第 2 步

把分隔符之后的内容追加到 buffer 这个环节我不知道处理


package main

import (
	"bufio"
	"io"
	"log"
	"net"
)

func main() {
	listener, err := net.Listen("tcp", "127.0.0.1:8866")
	if err != nil {
		log.Fatal(err)
	}
	defer listener.Close()

	for {
		con, err := listener.Accept()
		if err != nil {
			log.Println(err)
			continue
		}
		defer con.Close()
		reader := bufio.NewReader(con)
		for {
			data, err := reader.ReadSlice('\n')
			if err != nil {
				if err != io.EOF {
					// 分隔符之后
				} else {
					//读取结束
					break
				}
			}
			log.Println("received msg", len(data), "bytes:", string(data))
		}
	}
}

package main

import (
	"log"
	"net"
	"time"
)

func main() {
	conn, err := net.Dial("tcp", "127.0.0.1:8866")
	if err != nil {
		log.Fatal(err)
	}
	defer conn.Close()
	_, err = conn.Write([]byte("bbbb\ndfdfdfdfd"))
	if err != nil {
		panic(err)
	}
	time.Sleep(time.Second)
}

2157 次点击
所在节点    Go 编程语言
21 条回复
ggvoking
2023-07-12 21:47:20 +08:00
消息包头带个长度不就行了。
awanganddong
2023-07-12 21:53:05 +08:00
@ggvoking 主要是想搞明白采用分格符这种方式是怎么处理的
oneisall8955
2023-07-12 21:57:29 +08:00
粘包警察马上到!
awanganddong
2023-07-12 21:59:39 +08:00
TCP 流数据边界问题 这个没人吐槽了吧。
LeegoYih
2023-07-12 22:01:22 +08:00
粘包警察来咯!

可以参考一下这个项目处理边界的代码,他实现了好几种方式: https://github.com/go-netty/go-netty
awanganddong
2023-07-12 22:04:32 +08:00
bufio.NewReader 这个概念,理解错了。这个得出来的结果比较清晰一些
```
func main() {
conn, err := net.Dial("tcp", "127.0.0.1:8866")
if err != nil {
log.Fatal(err)
}
defer conn.Close()
_, err = conn.Write([]byte("bbbb\ndfdfdfdfd\nsdsdsd"))
_, err = conn.Write([]byte("aaa\n"))
if err != nil {
panic(err)
}
time.Sleep(time.Second)
}

```
Vegetable
2023-07-12 22:10:14 +08:00
你这个 TCP 结束之前,不会收到 EOF ,你就一直读不就行了吗,有什么需要处理的
awanganddong
2023-07-12 22:10:25 +08:00
这个文章可以参考

消息长度固定,提前确定包长度,读取的时候也安固定长度读取,适合定长消息包。
使用特殊的字符或字符串作为消息的边界,例如 HTTP 协议的 headers 以“\r\n”为字段的分隔符
自定义协议,将消息分为消息头和消息体,消息头中包含表示消息总长度

https://wangbjun.site/2019/coding/golang/golang-tcp-package.html

谢谢各位
Vegetable
2023-07-12 22:12:47 +08:00
最后 err==EOF 的时候,data 是有值的,你不能直接丢掉,其他没什么问题
awanganddong
2023-07-12 22:14:31 +08:00
@Vegetable 好的,谢谢了。
iceheart
2023-07-12 22:31:36 +08:00
一直收不到分隔符,内存不是要爆掉啦
nightwitch
2023-07-12 22:40:40 +08:00
这种方案也就在内网环境下用用,本质上和用换行符做分割没有什么区别。
一旦被人摸清楚方案,无限给你发不带分割符的包,轻轻松松 oom
deorth
2023-07-12 23:15:17 +08:00
出警怎么这么慢啊
rrfeng
2023-07-12 23:38:22 +08:00
这种适合搞一个 ringbuffer
MoYi123
2023-07-13 10:09:58 +08:00
@nightwitch OOM 是另一个问题, http 协议的 content-length 也没有机制保证你不 oom 吧.
oneisall8955
2023-07-13 12:42:28 +08:00
@MoYi123 类似 nginx 的 client_max_body_size ,默认 0 无限制,设置最大长度,超过了就拒绝?
mcfog
2023-07-13 12:57:51 +08:00
直接 bufio.NewScanner 搞定,用 https://pkg.go.dev/bufio#Scanner.Split 配置一个,分隔符策略几乎可以照抄默认的 ScanLines
trzzzz
2023-07-15 23:02:35 +08:00
@awanganddong 确实,像 scp 和 sftp 底层的实现都是基于 tcp 基础上自己规定客户端和服务端间的协议
voidmnwzp
2023-07-21 02:53:27 +08:00
建议用 CRLF 分割
wkong
2023-07-25 10:54:39 +08:00
分享一下我开源的单机百万的通用实时服务。里面有关于拆包分包这块。

https://github.com/WuKongIM/WuKongIM

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/956281

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX