Definición del modelo de regresión estadística

La regresión es una técnica de minería de datos utilizada para predecir un rango de valores numéricos (también conocidos como valores continuos) dado un conjunto de datos determinado. Por ejemplo, la regresión se puede usar para predecir el costo de un producto o servicio considerando otras variables.

La regresión se utiliza en todas las industrias en la planificación comercial y de marketing, la previsión financiera, el modelado ambiental y el análisis de tendencias.

Índice
  1. Regresión y clasificación
  2. Tipos de técnicas de regresión

Regresión y clasificación

La regresión y la clasificación son técnicas de minería de datos que se utilizan para resolver problemas similares, pero a menudo se confunden. Ambos se usan para el análisis predictivo, pero la regresión se usa para predecir valores continuos o numéricos, mientras que la clasificación divide los datos en categorías discretas.

Por ejemplo, la regresión se utiliza para predecir el valor de una vivienda en función de su ubicación, tamaño, último precio de venta, precios de viviendas similares y otros factores. Si elige clasificar las casas por categorías, como la accesibilidad para peatones, el tamaño del lote o la tasa de criminalidad, las calificaciones se ordenarán.

Tipos de técnicas de regresión

La forma de regresión más simple y antigua es la regresión lineal, que estima la relación entre dos variables. Esta técnica utiliza la fórmula matemática de una línea recta (y = mx + b). En términos sencillos, esto solo significa que en un gráfico con un eje Y y un eje X, la relación entre X e Y es una línea recta con pocos valores atípicos. Por ejemplo, podemos suponer que la producción de alimentos aumentará al mismo ritmo que aumenta la población; esto requiere una fuerte relación lineal entre los dos números. Para ilustrar, considere un gráfico donde el eje Y es el crecimiento de la población y el eje X es la producción de alimentos. A medida que aumenta el valor de Y, el valor de X aumenta a la misma velocidad,

Técnicas avanzadas como la regresión múltiple predicen relaciones entre múltiples variables; Por ejemplo, ¿existe una conexión entre ingresos, educación y lugar de residencia? Agregar más variables aumenta en gran medida la complejidad de las predicciones. Existen diferentes tipos de métodos de regresión múltiple, incluidos los métodos estándar, jerárquico, de conjunto y escalonado, cada uno con sus propias aplicaciones.

En este punto, es importante comprender qué estamos tratando de predecir (dependiente o predictor) y qué datos estamos usando para hacer predicciones (independiente o predictor). En nuestro ejemplo, queremos predecir dónde quiere vivir una persona (predictores) en función de los ingresos y la educación (dos predictores).

  • Regresión múltiple estándar Ver todos los predictores a la vez. Por ejemplo 1) ¿Cuál es la relación entre ingreso y educación (esperado) y elección de barrio (esperado) 2) ¿Cuánto contribuye cada predictor individual a esta relación?
  • Pasos de regresión múltiple Paso a paso responde una pregunta completamente diferente. Un algoritmo de regresión por pasos analiza qué predictores son los más adecuados para seleccionar la vecindad pronosticada, lo que significa que el modelo por pasos evalúa el orden de importancia de los predictores y luego selecciona el subconjunto relevante. Este tipo de problema de regresión utiliza "pasos" para desarrollar ecuaciones de regresión. Con este tipo de regresión, es posible que no todos los predictores aparezcan en la ecuación de regresión final.
  • regresión jerárquica Al igual que el paso a paso, es un proceso secuencial, pero los predictores se ingresan en el modelo en un orden predefinido y predeterminado, es decir, el algoritmo no contiene un predictor incorporado para el sistema de ecuaciones que determina el orden de la entrada. Esto se usa más comúnmente cuando la persona que crea la ecuación de regresión tiene experiencia en el campo.
  • regresar La regresión de conjunto también es similar a la regresión por pasos, pero analiza grupos de variables en lugar de una sola variable.

Entradas relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir