朱慧博士生,本文的第一作者。

近年来,机器学习(包括深度学习)打分函数被广泛用于预测蛋白-小分子结合自由能,并且在某些benchmark数据集上表现出优异的预测能力。但如果测试集含有与训练集相似的蛋白-小分子复合体,那么机器学习可能仅通过“学习”训练集的特定分布,就能在类似分布的测试集上取得优异表现。但这只是一种表面现象,因为这类模型往往在异分布的数据集上表现不理想,即不具备泛化能力(Generalization ability)。