第757章 流形学习(第2页)

 1、对原始高维数据进行压缩,降低原始高维数据的维度,进而节省存储空间,同时也降低高维数据的计算复杂度。

 十五分钟后,三人已经围坐在了食堂二层的一个圆桌旁边。

 回到办公室的常浩南重新找到了刚才那张纸。

 不如先放松一下,换个思路。

 在近70年前,美国统计学家哈罗德霍特林就已经提出过将高维数据进行降维的主成分分析法。

 不知不觉间,常浩南就在办公桌前枯坐到了快要吃午饭的时候。

 给方便面里面塞调料包和给飞机打铆钉,在数学模型上其实是差不多的。

 实际上,在常浩南重生之前,飞机设计和制造领域已经开始应用这方面的技术,他本人也接触过不少。

 他认为方差越大提供的信息越多反之提供的信息越少,于是通过原分量的线性组合构造方差大、含信息量多的若干主分量,再进行矩阵奇异值分解,实现数据维数的降低。

 没有灵感,说啥都没用。

 常浩南摇摇头否定道。

 这里算是个点餐制的小灶,价格比下面的大食堂贵一些,加上还要多上一层楼,因此来这里吃饭的人并不算多。

 常浩南不是那种死钻牛角尖的人。

 而生产方便面的企业,显然不太可能有多么高大上的设备和技术。

 在三个基本条件下方又写下了几行字。

 “生产方便面的企业,是怎么保证不漏装或者多装调料包的?”

 其核心目的是从海量数据库和大量繁杂信息中提取出有价值的知识,并进一步提高信息的利用率。

 餐桌周围又恢复了平静,只剩下偶尔发出的微弱咀嚼声。

 但到了99年这会,大学生在宿舍备上几袋甚至一箱,都不算什么稀罕事了。

 仍然没能想出一个很好的思路。

 “大概……称重?”

 但主成分分析法只相当于找到投影距离最小的意义下的最佳线性映射,而现实中却没有那么多简单的线性问题。

 确实有点饿了。

 “换句话说,具有高维数的外部信息必定潜在于一个低维空间中的非线性流形结构上……”

 姚梦娜看了看纸上的一个名词和三句话,也知道常浩南大概是没什么思路,干脆站起身道:

 “要不先去吃个饭?”

 倒是旁边的小超市,来来往往的人流量不少。

 不过,这个思路却是可以被借鉴的。

 也就是一维数据。

 显然,这并不能被算作是“完整且可行”的思路。

 要想在数学上描述这种一组数据对应多个含义的现象,就需要将一组数据在不同的维度上进行展开。