原创分享 为什么 Go 的泛型一拖再拖?

EDDYCJY · 2020年11月22日 · 513 次阅读

大家好,我是煎鱼。

前段时间 Go 语言的泛型讨论频频出现在各微信群,且又冲上了国内外各大文章的 “头条”:

来自 p 神公众号的截图

信息汇总来看,Go 泛型这几年会出,但大体来讲现在 Go 泛型又又又推迟了,好家伙。我最早了解到时是考虑 Go1.16 释出,后面又推到了 Go1.17,接着现在又延期到了 Go1.18 了(2021 年底 Beta,正式预计是 2020 年 2 月)。

看到了信息的表象后,再想想为什么泛型 “这件事情” 突然醒目起来了,其原因之一是由官方 Go,11 岁 的博文所引爆的。

同时近日举办的 GopherCon2020 大会,Robert Griesemer 分享的 Typing [Generic] Go。更正式的让 Go 泛型更面向了大众,也侧面的说明官方认为其已经到达了一个新的阶段了,进入最终实现阶段。

事不宜迟,既然官方都已经摩拳擦掌了,我们的学习之路也得跟上,因此本文将会介绍 Go 泛型现在的情况,并通过在介绍过程中不断思考最后得出一个为什么。

什么是泛型

泛型程序设计(generic programming)是程序设计语言的一种风格或范式。泛型允许程序员在强类型语言中编写代码时,使用一些以后才确定的类型,其在真正实例化时才会为这些参数指确定类型。另外各语言和其编译器、运行环境对泛型的支持均不一样,因此需要针对来辩证。

简单来讲,泛型就是参数化多态。其可根据实参类型生成不同的版本,支持任意数量的调用:

func F(a, b T) T{ return a+b }

// T 为 int
F(1, 2)

// T 为 string
F("1", "2")

在编译时期编译器便确定其 T 的入参类型。这也是 Go 泛型实现的要求之一 “编译时类型安全”。

为什么需要泛型

这时候可能会有人说,没有泛型也可以啊...感觉写业务代码没什么影响,与其搞泛型不如搞好 errors(具体新消息可参见:重磅:Go errors 将不会有任何进一步的改进计划)。

但泛型是有其所需的场景,最常见的是像基础库在处理获取配置中心数据时,就要处理类型,时常遇到下述场景:

image

如果使用接口(interface)类型来做,也得 switch.(type) 枚举出所有的基础类型。这显然并不合理,也没法做太复杂的逻辑,而且所支持的类型还泄露。

另外同时单从语言层面来讲,泛型支持是一个必然事件了,因为泛型的存在对解决特定领域的问题存在一定的意义。

接口和泛型有什么区别

在上面我们有提到接口(interface)类型,这时候就出现了泛型的第二个经典问题。那就是 “接口和泛型有什么区别?”,为什么不用接口来实现 “泛型”:

type T interface { ... }
func F(a, b T) T { return a+b }

也像这么一回事,但在这里存在一个致命的缺陷。那就是接口的入参和出参均可以在运行时表现为不同的类型:

F("煎鱼", 233)

要做好,还得依靠内部去对参数进行断言,否则作为 string 类型的煎鱼又如何和 int 类型的 233 相加呢,那是必然报错的。

而反过来看真 “泛型” 的实际使用,编译器会保证泛型函数的入参和出参必须为同一类型,有强制性的检验:

// 报错:type checking failed for main
F("煎鱼", 233)

// 必须为同一类型,才能正常运行
F(666, 233)

两者存在本质上的区别,泛型会更安全,能够保证编译早期就发现错误,而不是等到运行时(并且可能会存在隐性的 BUG)。

总体来讲,泛型相较接口有如下优点:

  • 更安全:编译早期就能发现错误。

  • 性能好:静态类型。

过去:为什么那么久都没有泛型

前几段在社区的微信群看到一位小伙伴吐槽 “Go 语言居然没有泛型?”,变相来看,可能其会认为 ” Go 都已经 11 岁了,2020 年了居然还没有泛型?”。

这显然是不对的,因为泛型本质上并不是绝对的必需品,更不是 Go 语言的早期目标,因此在过往的发展阶段没有过多重视这一点,而是把精力放在了其他 feature 上。

另外 Go 语言在以往其实进行过大量的泛型 proposal 试验,基本时间线(via @changkun)如下:

简述 时间 作者
[Type Functions] 2010 年 Ian Lance Taylor
Generalized Types 2011 年 Ian Lance Taylor
Generalized Types v2 2013 年 Ian Lance Taylor
Type Parameters 2013 年 Ian Lance Taylor
go:generate 2014 年 Rob Pike
First Class Types 2015 年 Bryan C.Mills
Contracts 2018 年 Ian Lance Taylor, Robert Griesemer
Contracts 2019 年 Ian Lance Taylor, Robert Griesemer
Redundancy in Contracts(2019)'s Design 2019 年 Ian Lance Taylor, Robert Griesemer
Constrained Type Parameters(2020, v1) 2020 年 Ian Lance Taylor, Robert Griesemer
Constrained Type Parameters(2020, v2) 2020 年 Ian Lance Taylor, Robert Griesemer
Constrained Type Parameters(2020, v3) 2020 年 Ian Lance Taylor, Robert Griesemer

虽然偶有中断,但仔细一看,2010 年就尝试过,现在 2020 年了,也是很励志了,显然官方也是在寻路和尝试的过程中,但一直没有找到相较好的方案,争端过多了。

现在:Go 泛型

泛型尝鲜的方式有两种方式。线上 Ian Lance Taylor 提供了一个在线编译的 go2go

image

另外一种是线下,也就在本地安装 Go 的特定分支版本:

$ git clone https://github.com/golang/go
$ git checkout dev.go2go
$ cd src && ./all.bash

不过这种本地安装的方法会耗时比较久,初步尝试的话建议使用 go2go 就可以了。而在尝鲜时,可以看到在代码块中声明了一个 Print 方法,其函数签名主体分为三部分:

image

咋一看,变量 T 的这个关键字 any 是什么?早期泛型你可能有听说合约(Contract),难道这就是合约。其实严格意义上来讲并不是,因为为了更一步简化语法,合约在 2020.06.07 已经正式移除。

其已改头换面,现在只需要写参数化的 interface。而上述的 any 关键字是一个预定义的类型约束,声明后将允许任何类型用作类型实参,并且允许函数使用用于任何类型的操作。

从语法分析的角度来讲,Print 方法一共包含了如下属性(从左到右):

  • type list:声明了入参的类型列表为一个 T 变量,其可以传任意类型的参数。

  • parameter list:声明了入参的参数列表为 T 变量的切片,且形参为 s

  • return type list:声明了函数的返回参数列表。

上述函数签名便是一个 Go 泛型的基本样子,由于本文并不是 CRUD 泛型,便不展开案例,若大家有兴趣可以详细阅读提案:Type Parameters - Draft Design

泛型的战争

为什么不用尖括号

在社区中很多同学在讨论的一个问题,那就是 “为什么 Go 泛型不像 C++ 和 Java 那样使用尖括号?,也出现了 “Go 一直标榜业界工程实践类的榜样,为什么就是不用尖括号” 的言论?

思考问题我们不只看表面,官方说不行,那么我们可以倒推来看,看看 Go 语言就用尖括号:

func print<type T>(list []T) {

print<int>(numbers)
print<string>(strings)
print<float64>(floats)

普通的函数声明看上去似乎结构清晰,没有什么大问题的。接着往下看:

a := w < x
b := y > (z)

我们继续把代码演进一下,简洁一点:

a, b := w < x, y > (z)

这时候就犯难了,不仅编译器难以解析,人也很难判别,到底指的是:

a := w < x
b := y > (z)

又或是:

a, b := w<x, y>(z)

从上述代码来看,使用尖括号难以分别,因为没有类型信息,就无法确定赋值的右侧是一对表达式 w < x和y > (z),还是返回两个结果值 w<x, y>(z) 的泛型函数实例化和调用,其存在歧义。

要解决还要引入新的约束,会破坏 Go1 的兼容性承诺,这显然是不合理的。

为什么不用括号

其实最早 Go 泛型的版本是使用了括号的模式,虽然能用,但是用括号会引入新的解析歧义。例如:

var f func(x(T))

从语法上来讲,你无法识别他是未命名参数的 x(T) 函数,还是类型名为参数的 (T) 函数。同时 Go 语言还存在强制类型转换这一语法,假设代码是 []T(v1)[]T(v2){} ,那么你在开括号处,就无法得知其是否代表类型转换。

更甚至在函数的完整声明上,我们都会感到困惑:

func F(T any)(v T)(r1, r2 T)

函数入参、泛型、返回值声明均都是括号,造成了语义不清,这显然也是不合理的。

为什么不用书名号(«»)

想的美,并不想使用非 ASCII,未来更没打算支持。

总结

在本文中我们从多个维度介绍了 Go 泛型的相关内容,既了解到了上段时间 Go 泛型再度火爆的信息来源是什么。也知道了 Go 泛型是什么,与接口的区别。

同时我们还针对业界常见的一些疑问,例如接口和泛型的区别,泛型的历史,泛型的尖括号/括号/书名号之争进行了解释和说明。

最后我们回答一下最开始的疑问,” 为什么 Go 的泛型一拖再拖 “,主要如下:

  • Go 语言的早期目标(工作重点)并不是泛型。

  • Go 语言在 2010-2020 年都有间断在做 Go 泛型的 proposal,但总是 ” 失败 “,在不断地吸收经验。

  • Go 语言社区的意见反馈是真的多,单用什么符号表示泛型,不想要泛型都争论不休。

  • Go 语言的泛型现在还不成熟,很多​细节其实并没有支持好。

很显然,在保证 Go1 向后兼容性的同时,Go 官方也不想直接妥协出一个随便的方案,因此总是不断地在改进。随着 Go 语言的不断应用,泛型也和 errors 一样被推上风头浪尖。

到底拖到什么时候

那 Go 泛型到底什么时候出呢?

前段时间也向欧神(@changkun)了解到在 GopherCon 2020 Go Team AMA,russ cox 有聊到相关问题,表示在明年年底要能有生产环境的试用版上线,这是一个管理目标。

但具体真正的时间线肯定是要看泛型的实现者:robert 和 keith,可以多多关注他们,就能拿到一手信息,且可以确定的是 Go 泛型明年二月之前是不会有生产可用的试用版。

灵魂拷问:你对 Go 语言的泛型又有什么想法和意见呢,一起留言讨论吧。

我的公众号

分享 Go 语言、微服务架构和奇怪的系统设计,欢迎大家关注我的公众号和我进行交流和沟通。

最好的关系是互相成就,各位的点赞就是煎鱼创作的最大动力,感谢支持。

推荐阅读

更多原创文章干货分享,请关注公众号
  • 加微信实战群请加微信(注明:实战群):gocnio
moss GoCN 每日新闻 (2020-11-23) 中提及了此贴 11月23日 07:52
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册