Сравнителна таблица
Основа за сравнение | класификация | регресия |
---|---|---|
Основен | Откриването на модел или функции, при които картографирането на обекти се извършва в предварително дефинирани класове. | Разработен модел, при който картографирането на обектите се извършва в стойности. |
Включва прогнозиране на | Дискретни стойности | Непрекъснати стойности |
алгоритми | Дърво на решенията, логистична регресия и др. | Регресионно дърво (Случайна гора), Линейна регресия и др. |
Естество на прогнозираните данни | неподреден | поръчан |
Метод на изчисление | Точност на измерване | Измерване на средната квадратична грешка |
Определение за класификация
Класификацията е процесът на намиране или откриване на модел (функция), който помага да се разделят данните в множество категориални класове. При класификацията се идентифицира груповото членство на проблема, което означава, че данните се категоризират под различни етикети според някои параметри и след това етикетите се прогнозират за данните.
Изведените модели могат да бъдат демонстрирани под формата на правила "IF-THEN", дървета за вземане на решения или невронни мрежи и т.н. Дърво на решения е фундаментална схема, която прилича на дървовидна структура, където всеки вътрешен възел изобразява тест за атрибут, и неговите клони показват резултата от теста. Процесът на класификация се занимава с проблемите, при които данните могат да бъдат разделени на две или повече дискретни етикети, с други думи, две или повече несъвпадащи множества.
Да вземем един пример, да предположим, че искаме да предвидим възможността за дъжд в някои региони въз основа на някои параметри. Тогава ще има два етикета дъжд и няма дъжд, под който различни региони могат да бъдат класифицирани.
Определение на регресия
Регресията е процесът на намиране на модел или функция за разграничаване на данните в непрекъснати реални стойности вместо използване на класове. Математически, с регресионен проблем, се опитваме да намерим апроксимацията на функцията с минималното отклонение на грешката. При регресия се предвижда цифровата зависимост на данните да се различава.
Регресионният анализ е статистически модел, който се използва за предсказване на цифровите данни вместо етикети. Тя може също така да идентифицира движението на разпределението в зависимост от наличните данни или исторически данни.
Да вземем подобен пример и в регресия, където откриваме възможността за дъжд в някои конкретни региони с помощта на някои параметри. В този случай има вероятност, свързана с дъжда. Тук ние не класифицираме регионите в рамките на дъжд и няма етикети за дъжд, а ги класифицираме с тяхната свързана вероятност.
Основни разлики между класификацията и регресията
- Процесът на класификация моделира функция, чрез която данните се прогнозират в дискретни етикети на класове. От друга страна, регресията е процес на създаване на модел, който предвижда непрекъснато количество.
- Алгоритмите за класифициране включват дърво на решенията, логистична регресия и т.н. За разлика от това, регресионното дърво (напр. Случайната гора) и линейната регресия са примери за регресионни алгоритми.
- Класификацията предсказва неподредени данни, докато регресията предсказва подредени данни.
- Регресията може да бъде оценена с помощта на средна квадратична грешка. Напротив, класификацията се оценява чрез точност на измерване.
заключение
Техниката на класификация осигурява предсказуем модел или функция, която прогнозира новите данни в отделни категории или етикети с помощта на историческите данни. Обратно, регресионният метод моделира непрекъснати функции, което означава, че прогнозира данните в непрекъснати цифрови данни.