这个例子利用几个无监督的技术从历史报价的变动中提取股票市场结构。
使用报价的日变化数据进行试验。
Learning a graph structure
首先使用sparse inverse(相反) covariance(协方差) estimation来找到相关联的报价。
sparse inverse covariance可以提供一个graph,是一组connection的列表。
Clustering
选用scikit-learn中的Affinity Propagation聚类方法进行聚类。原因主要有2点:第一,它不要求类簇有相同的大小,
第二,它可以自动决定类簇的数目。
Embedding in 2D space
为在一个2D图上可视化不同的symbols(股票代码),需要使用Manifold learning(流形学习)进行2D的embedding。
Visualization
模型的输出如下2D图,其中nodes表示股票。
不同的类簇节点有不同的颜色,
the sparse(稀疏的) covariance(协方差) model用来显示边的强度。
2D的embedding用来在平面图中表示node位置。
可视化相当重要,其中的一个挑战是怎么放置labels来最小化重叠。我们使用anheuristic(启发式的) based on the direction of the nearest neighbor along each axis(轴)方法解决。