262 view times

Computing the Testing Error without a Testing Set(待重读)

Contribution:

Generalization gap is a function of the inner-workings of the network, represented by its functional topology. Regression of this function can be used to estimate test performance based only on training data.

overview

backgroud:
在拓扑世界中,对称性尤为重要。一般我们说的“对称”是旋转对称,比如将一个正方形旋转90°以后仍然保持不变。但是,还有另外一类对称,数学家把这些对称称为“持续同调对称”(symmetries persistent homologies)。

持续同调(PH)能让我们在不降维的情况下,寻找刻画数据全貌的方法。假设有一个100 x 900的数组,列(100)是各种参数,行(900)是独立的数据点,以Excel表格形式储存。在三维空间中,我们无法描述数据的全貌,而通过降维的方法表示数据,或多或少都会损失一些有潜在价值的信息。因为拓扑学在数学空间性质的研究中主要关注的是点与点之间的关系,忽略点与线的关系(比如距离和角度)。因此,PH能让我们以可靠的、不掺杂任何数据挖掘和加工扭曲的方式,提出关于数据的拓扑性问题。

从理论上讲,这些对称性可以通过计算数据结构中的空洞和空洞的数量来表征。由此得到的数字被称为“贝蒂数”(Betti number),具有相同贝蒂数的结构在拓扑学上是等价的。

Thoughts: interesting work, getting a regression curve of the erorr gap without test set by persistent homology analysis. Because of lack of relative topology, discrete math background, I can not understand well about underlying motivation inthis paper. After a year when I will study topology, I will review this paper and I hope I could understand well about this paper~

…复习完数分就该刷拓扑和群论了。。

reference:
1. https://developer.aliyun.com/article/423164
2. https://arxiv.org/pdf/2005.00450.pdf

发表评论

电子邮件地址不会被公开。 必填项已用*标注