前置技能:Python基础,ADT
很显然, ADT 可以构造任何树形的数据结构:树的节点内分支用和类型连接,层级间节点用积类型连接。
但是同样很显然 ADT 并不能搞出环形的数据结构或者说是无穷大小的数据结构。比如下面的代码:
ilist: IntList = IntList(1, ilist)
编译器会表示 list
在使用时未初始化。
为什么会这样呢? ADT 是归纳构造的,也就是说它必须从非递归的基本元素开始组合构造成更大的元素。
如果我们去掉这些基本元素那就没法凭空构造大的元素,也就是说如果去掉归纳的第一步那整个归纳过程毫无意义。
余代数数据类型(Coalgebraic Data Type)也就是余归纳数据类型(Coinductive Data Type),代表了自顶向下的数据类型构造思路,思考一个类型可以如何被分解从而构造数据类型。
这样在分解过程中再次使用自己这个数据类型本身就是一件非常自然的事情了。
不过在编程实现过程中使用自己需要加个惰性数据结构包裹,防止积极求值的语言无限递归生成数据。
比如一个列表可以被分解为第一项和剩余的列表:
from typing import Callable, TypeVar
T = TypeVar("T")
Supplier = Callable[[], T]
class InfIntList:
InfIntList = TypeVar("InfIntList")
head: int
next_one: Supplier[InfIntList]
def __init__(self, head: int, next_one: Supplier[InfIntList]):
self.head = head
self.next_one = next_one
这里的 Supplier
可以做到仅在需要 next_one
的时候才求值。使用的例子如下:
from typing import Callable, TypeVar
T = TypeVar("T")
Supplier = Callable[[], T]
class InfIntList:
InfIntList = TypeVar("InfIntList")
head: int
next_one: Supplier[InfIntList]
def __init__(self, head: int, next_one: Supplier[InfIntList]):
self.head = head
self.next_one = next_one
def inf_alt():
return InfIntList(1, lambda: InfIntList(2, inf_alt))
if __name__ == "__main__":
print(inf_alt().next_one().head)
运行会输出 2
。注意,这里的 inf_alt
从某种角度来看实际上就是个长度为 2 的环形结构。
用这样的思路可以构造出无限大的树、带环的图等数据结构。
不过以上都是对余代数数据类型的一种模拟,实际上在对其支持良好的语言都会自动加上 Supplier
来辅助构造,同时还能处理好对无限大(其实是环)的数据结构的无限递归变换(map
, fold
...)的操作。