Focal loss对于极大不平衡的数据集确实有奇效,其中gamma因子可以成10倍数衰减 Loss function是Model和数据之外,第三重要的参数。具体使用MSE、Cross entropy、Focal还是其他自定义,需要具体问题具体分析。