猛然发现排序最难的不是什么,快排,堆排这些解决效率问题的算法。
而是什么,准确问题,就是如何让数据按照预期排序。
问题描述:
让n个词按照与某信息的相关性从高到底排序,没有正确排序结果
已经计算出了每个词与信息的一系列维度的指标,假设有m个指标。
由于是词,指标的计算本身就带有一定的不确定性。
那么如何计算出一个综合指标来反映相关性。
相关:
涉及到的问题
词相关性度量:什么相同字符个数等等
数据拟合:人工排序,人工给分,拟合,害怕局限性和指标不精准
分档排序:提升准确率