capsule 希望说一个向量里可以囊括 pose (position, size, orientation), deformation, velocity, albedo, hue, texture, etc. 信息。个人以为,这些信息性质完全不同,这样的表示是无效的,应该有分立的系统分别处理这些信息,交互与整合。 下面两图基本阐释了 capsule 的原理 图1 此图很好的解释了文章中公式[图来自网络] 图2 此图来自原文[路由算法]