Препоръчано, 2024

Избор На Редактора

Разлика между класификация и регресия

Класификация и регресия са два основни проблема за прогнозиране, които обикновено се разглеждат в Data mining. Предсказващото моделиране е техниката за разработване на модел или функция, използвайки историческите данни за прогнозиране на новите данни. Значителната разлика между класификацията и регресията е, че класификацията преобразува обекта на входните данни в някои дискретни етикети. От друга страна, регресионното изображение на обекта на входните данни към непрекъснатите реални стойности.

Сравнителна таблица

Основа за сравнениекласификациярегресия
Основен
Откриването на модел или функции, при които картографирането на обекти се извършва в предварително дефинирани класове.Разработен модел, при който картографирането на обектите се извършва в стойности.
Включва прогнозиране наДискретни стойностиНепрекъснати стойности
алгоритмиДърво на решенията, логистична регресия и др.Регресионно дърво (Случайна гора), Линейна регресия и др.
Естество на прогнозираните даннинеподреденпоръчан
Метод на изчислениеТочност на измерванеИзмерване на средната квадратична грешка

Определение за класификация

Класификацията е процесът на намиране или откриване на модел (функция), който помага да се разделят данните в множество категориални класове. При класификацията се идентифицира груповото членство на проблема, което означава, че данните се категоризират под различни етикети според някои параметри и след това етикетите се прогнозират за данните.

Изведените модели могат да бъдат демонстрирани под формата на правила "IF-THEN", дървета за вземане на решения или невронни мрежи и т.н. Дърво на решения е фундаментална схема, която прилича на дървовидна структура, където всеки вътрешен възел изобразява тест за атрибут, и неговите клони показват резултата от теста. Процесът на класификация се занимава с проблемите, при които данните могат да бъдат разделени на две или повече дискретни етикети, с други думи, две или повече несъвпадащи множества.

Да вземем един пример, да предположим, че искаме да предвидим възможността за дъжд в някои региони въз основа на някои параметри. Тогава ще има два етикета дъжд и няма дъжд, под който различни региони могат да бъдат класифицирани.

Определение на регресия

Регресията е процесът на намиране на модел или функция за разграничаване на данните в непрекъснати реални стойности вместо използване на класове. Математически, с регресионен проблем, се опитваме да намерим апроксимацията на функцията с минималното отклонение на грешката. При регресия се предвижда цифровата зависимост на данните да се различава.

Регресионният анализ е статистически модел, който се използва за предсказване на цифровите данни вместо етикети. Тя може също така да идентифицира движението на разпределението в зависимост от наличните данни или исторически данни.

Да вземем подобен пример и в регресия, където откриваме възможността за дъжд в някои конкретни региони с помощта на някои параметри. В този случай има вероятност, свързана с дъжда. Тук ние не класифицираме регионите в рамките на дъжд и няма етикети за дъжд, а ги класифицираме с тяхната свързана вероятност.

Основни разлики между класификацията и регресията

  1. Процесът на класификация моделира функция, чрез която данните се прогнозират в дискретни етикети на класове. От друга страна, регресията е процес на създаване на модел, който предвижда непрекъснато количество.
  2. Алгоритмите за класифициране включват дърво на решенията, логистична регресия и т.н. За разлика от това, регресионното дърво (напр. Случайната гора) и линейната регресия са примери за регресионни алгоритми.
  3. Класификацията предсказва неподредени данни, докато регресията предсказва подредени данни.
  4. Регресията може да бъде оценена с помощта на средна квадратична грешка. Напротив, класификацията се оценява чрез точност на измерване.

заключение

Техниката на класификация осигурява предсказуем модел или функция, която прогнозира новите данни в отделни категории или етикети с помощта на историческите данни. Обратно, регресионният метод моделира непрекъснати функции, което означава, че прогнозира данните в непрекъснати цифрови данни.

Top