构建自己的图像分类数据集【两天搞定AI毕设】_哔哩哔哩_bilibili
数据科学中有一句话:Garbage in, garbage out。
数据分布:
多样性、代表性、一致性
其他注意事项:
删除无关图片。
删除多余文件。
find . -iname '...'。
for i in `find . -iname '...'`; do rm -rf $i; done
for label in os.listdir(DATASET_DIR):
for imgfile in tqdm(os.listdir(os.path.join(DATASET_DIR, label))):
imgpath = os.path.join(DATASET_DIR, label, imgfile)
img = cv2.imread(imgpath)
if img is None:
print(imgpath + "无法读取,予以删除")
os.remove(imgpath)
有的是傻瓜式的(但是你要给钱)。
