植物叶片病害检测数据集 5100张 29类 带标注 voc yolo

 植物叶片病害检测数据集 5100张 29类 带标注 voc yolo

植物叶片病害检测数据集

名称

植物叶片病害检测数据集 (Plant Leaf Disease Detection Dataset)

规模

  • 图像数量:5154张图像。
  • 类别:29种病害类型。
  • 分类名: (图片张数,标注个数)
    Tomato leaf bacterial spot: (157. 424)
    Potato leaf early blight: (164. 477)
    Bell_ pepper leaf spot: (89. 362)
    Strawberry leaf: (132. 674)
    grape leaf black rot: (261. 467)
    grape leaf: (83, 277)
    Tomato leaf: (120, 600)
    Bell pepper leaf: (72. 409)
    Potato leaf: (4, 18)
    Peach leaf: (156, 899)
    Corn leaf blight: (284, 543)
    Apple rust leaf: (355, 721)
    Cherry leaf: (73. 298)
    Tomato Early blight leaf: (360, 862)
    Apple Scab Leaf: (371, 627)
    Tomato leaf yellow virus: (100, 1095)
    Corn Gray leaf spot :
    (259, 304)
    Corn rust leaf: (477. 516)
    Soyabean leaf: (80, 314)
    Raspberry leaf: (173, 811)
    Blueberry leaf: (153. 1106)
    Squash Powdery mi Idew leaf: (180, 338)
    Tomato mold leaf: (116, 386)
    Tomato leaf late blight: (462. 925)
    Tomato Septoria leaf spot :
    196, 549)
    Tomato leaf mosaic virus: (82, 382)
    Potato leaf late blight: (137. 324)
    Apple leaf: (117. 320)
    Tomato two spotted spider mites leaf: (9, 9)
    总数:
    (5154, 15037)
    总类(nc)
    29类
     
  • 标注个数:15037个标注。
数据划分

  • 训练集 (Train):通常占总数据的80%左右,约4123张图像。
  • 验证集 (Validation):通常占总数据的20%左右,约1031张图像。
类别和数量
  • Tomato leaf bacterial spot:157张图像,424个标注。
  • Potato leaf early blight:89张图像,362个标注。
  • Bell pepper leaf spot:164张图像,674个标注。
  • Grape leaf black rot:261张图像,467个标注。
  • Strawberry leaf:132张图像,649个标注。
  • ...:其他各类病害对应的图像数量和标注数量。
数据特点
  • 高质量与高分辨率:所有图像均为高分辨率,适合进行详细的目标检测任务。
  • 多样性和复杂性:图像覆盖了多种植物叶片病害类型,增加了模型的泛化能力。
  • 详尽标注:每个图像都附有准确的边界框标注信息,确保了训练数据的质量。
应用领域
  • 农业监测:帮助农民及时发现并治疗作物病害,减少农作物损失。
  • 智能农业:结合无人机或机器人技术实现自动化病害检测和防治。
  • 科研应用:为植物病理学和农业科学研究提供数据支持。
1. 安装依赖库

首先,确保安装了必要的依赖库。可以在项目目录中的requirements.txt文件中列出这些依赖库,然后运行以下命令进行安装:

pip install -r requirements.txt

requirements.txt 文件内容示例:

torch==1.10.0
torchvision==0.11.1
pandas==1.3.4
cv2
albumentations==1.1.0
2. 创建数据集

定义一个自定义的数据集类,并创建数据加载器。

import os
import pandas as pd
import cv2
from torch.utils.data import Dataset, DataLoader
from torchvision.transforms import Compose, ToTensor, Normalize, Resize
from albumentations import HorizontalFlip, RandomBrightnessContrast, ShiftScaleRotate, BboxFromMasks, BBoxFormatPASCAL
from albumentations.pytorch import ToTensorV2

# 自定义数据集类
class PlantDiseaseDataset(Dataset):
    def __init__(self, data_root, annotations_file, transforms=None):
        self.data_root = data_root
        self.annotations = pd.read_csv(annotations_file)
        self.transforms = transforms

    def __len__(self):
        return len(self.annotations)

    def __getitem__(1, idx):
        img_path = os.path.join(self.data_root, self.annotations.iloc[idx, 0])
        image = cv2.imread(img_path)
        bboxes = self.annotations.iloc[idx, 1:].values.reshape(-1, 4)  # bounding box coordinates
        labels = self.annotations.columns[1:]

        if self.transforms:
            augmented = self.transforms(image=image, bboxes=bboxes)
            image = augmented['image']
            bboxes = augmented['bboxes']

        return image, bboxes, labels

# 图像预处理
def get_transforms():
    """构建预处理函数"""
    _transform = [
        Resize(height=416, width=416, interpolation=cv2.INTER_LINEAR),
        HorizontalFlip(p=0.5),
        RandomBrightnessContrast(p=0.2),
        ShiftScaleRotate(p=0.5, shift_limit=0.0625, scale_limit=0.2, rotate_limit=15),
        Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
        ToTensorV2(),
        BboxFromMasks(format=BBoxFormatPASCAL)
    ]
    return Compose(_transform)

# 创建数据加载器
train_dataset = PlantDiseaseDataset(
    data_root='path_to_your_data_directory',
    annotations_file='path_to_your_annotations.csv',
    transforms=get_transforms()
)
val_dataset = PlantDiseaseDataset(
    data_root='path_to_your_data_directory',
    annotations_file='path_to_your_annotations.csv',
    transforms=get_transforms()
)

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)
3. 训练YOLOv5模型

使用YOLOv5进行训练。

!git clone https://github.com/ultralytics/yolov5  # 下载YOLOv5代码仓库
cd yolov5

# 使用YOLOv5训练模型
python train.py --weights yolov5s.pt --data path_to_your_data.yaml --name plant_disease_detection --img 416 --batch 16 --epochs 100 --device 0
  • 数据配置文件:创建一个名为data.yaml的数据配置文件,其中包含训练和验证数据集的信息。
train: path_to_your_train_images
val: path_to_your_val_images
nc: 29  # 类别数量
names: [Tomato leaf bacterial spot, Potato leaf early blight, Bell pepper leaf spot, Grape leaf black rot, Strawberry leaf, ...]
4. 调整模型
  • 超参数调整:根据实际情况调整模型的超参数,例如学习率、批大小等。
  • 数据增强:增加数据增强策略,如旋转、缩放

http://www.niftyadmin.cn/n/5688126.html

相关文章

在WPF中实现多语言切换的四种方式

在WPF中有多种方式可以实现多语言,这里提供几种常用的方式。 一、使用XML实现多语言切换 使用XML实现多语言的思路就是使用XML作为绑定的数据源。主要用到XmlDataProvider类. 使用XmlDataProvider.Source属性指定XML文件的路径或通过XmlDataProvider.Document指定…

Pytorch基本知识

model.state_dict()、model.parameters()和model.named_parameters()的区别 parameters()只包含模块的参数,即weight和bias(包括BN的)。 named_parameters()返回包含模块名和模块的参数的列表,列表的每个元素均是包含layer name和layer param的元组。layer param就是param…

Python | Leetcode Python题解之第451题根据字符出现频率排序

题目: 题解: class Solution:def frequencySort(self, s: str) -> str:count {}for c in s:count[c] count.get(c, 0) 1items [(-val, key) for key, val in count.items()]heapq.heapify(items)res ""while items:val, key heapq.h…

开放式耳机是什么意思?哪个品牌好?开放式蓝牙耳机测评分享

开放式耳机是目前比较流行的一种蓝牙耳机类型,它凭借佩戴舒适、安全性高、透气性好以及健康卫生等等特点成为了很多人的耳机选择。但其实并没有太多人了解开放式耳机,不知道什么是开放式耳机、开放式耳机是否比封闭式耳机强、什么样的人适合开放式耳机以…

分页查询前后端代码

一、前端 在table表格下&#xff0c;写样式 <div style"margin: 10px 0"><el-paginationcurrent-change"handleCurrentChange":current-page"pageNum":page-sizes"[100, 200, 300, 400]":page-size"pageSize"layo…

Street View Synthesis with Gaussian Splatting and Diffusion Prior 学习笔记

使用高斯散点和扩散先验进行街景合成 街景中的驾驶模拟在自动驾驶系统的发展中具有至关重要的作用。通过构建城市街道的数字孪生体&#xff0c;我们可以持续使用模拟数据增强自动驾驶系统&#xff0c;从而显著减少对真实场景中数据收集的依赖&#xff0c;使得构建一个强大的自动…

ISP Pipeline

系列文章目录 文章目录 系列文章目录前言一、RAW域二、RGB域三、YUV域总结 前言 一、RAW域 黑电平校正&#xff08;BLC&#xff09;数字增益调整&#xff08;DGain&#xff09;自动白平衡&#xff08;AWB&#xff09;局部色调映射&#xff08;LTM&#xff09;坏点修复&#xf…

文章资讯职场话题网站源码整站资源自带2000+数据

介绍&#xff1a; 数据有点多&#xff0c;数据资源包比较大&#xff0c;压缩后还有250m左右。值钱的是数据&#xff0c;网站上传后直接可用&#xff0c;爽飞了 环境&#xff1a;NGINX1.18 mysql5.6 php7.2 代码下载