本文共 183 字,大约阅读时间需要 1 分钟。
我们会通过一系列的测试数据来确认算法的性能。关于性能测试流程的更多细节可以参见附录A。一般来说,为了更加精确地评估性能,所使用的测试集会包含k个独立的测试单元(一般k≥10)。最好和最坏的结果将被作为异常值抛弃,剩余的k - 2次实验结果会综合在一起,然后计算出平均值和标准差。我们会列出一张表,标明测试单元的规模n(n的范围从2~220)。
转载地址:http://idroa.baihongyu.com/