Skip to content

老师,请问对分类问题划分训练、验证集时进行分层抽样是否有必要呢? #1

@NOTGOOOOD

Description

@NOTGOOOOD

train_test_split()中提供了stratify参数可以根据标签列进行分层采样,使各类样本占比保持一致,比如
image
image

以前看到过有说分层抽样会对分类的准确性造成较大的影响,但是自己又用别的二分类数据集验证了一下,好像对准确率召回率没什么大的影响。。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions