Introducción y explicación de los archivos de datos de casos que vienen con SPSS
Introducción y explicación de los archivos de datos de casos que vienen con SPSS
Introducción y explicación de los archivos de datos de casos que vienen con SPSS Los principiantes de SPSS tienen una gran demanda de archivos de datos de casos. De hecho, durante la instalación del paquete de software SPSS Durante el proceso, estos archivos se han colocado automáticamente en el disco duro de su computadora. Entonces, ¿cómo encontrarlo? Presenté antes "Dónde descargar los datos del caso que vienen con SPSS". Los estudiantes que los necesiten pueden buscarlos o descargarlos ellos mismos. Hoy compartiré la descripción del archivo de datos de casos que viene con SPSS. Consulte los detalles a continuación:
accidents.sav
Este archivo de datos hipotéticos involucra a una compañía de seguros que está estudiando los factores de riesgo de edad y género para accidentes automovilísticos en un área determinada. Cada caso corresponde a una clasificación cruzada de categoría de edad y categoría de género.
adl.sav
Este archivo de datos hipotéticos se refiere a iniciativas para determinar los méritos de los tipos de tratamiento recomendados para pacientes con accidente cerebrovascular. Los médicos asignaron aleatoriamente a pacientes femeninas con accidente cerebrovascular a uno de dos grupos. Los pacientes del primer grupo recibieron fisioterapia estándar, mientras que los pacientes del segundo grupo recibieron terapia emocional adicional. Durante los tres meses de tratamiento, se calificó y utilizó como variable bruta la capacidad de cada paciente para realizar actividades generales de la vida diaria.
advert.sav
Este archivo de datos hipotéticos implica los esfuerzos de un minorista para examinar la relación entre el gasto en publicidad y el rendimiento de las ventas. Para ello, recopilaron cifras de ventas anteriores y los costes publicitarios asociados.
aflatoxina.sav
Este archivo de datos hipotéticos implica la detección de aflatoxinas en cereales. La concentración de la toxina variará dependiendo del rendimiento del cereal (entre diferentes cereales y dentro del mismo). mismo cereal entre ellos) y hay un gran cambio. El procesador de granos recibió 16 muestras de cada uno de los ocho rendimientos de granos y midió los niveles de aflatoxinas en partes por mil millones (PPB).
anorectic.sav
Al estudiar las referencias de síntomas estándar para el comportamiento de anorexia/bulimia, los investigadores1 encuestaron a 55 adolescentes con trastornos alimentarios conocidos. Cada uno de estos pacientes será examinado cuatro veces al año, por lo que el número total de observaciones es 220. Durante cada observación, estos pacientes recibirán una puntuación en cada uno de los 16 síntomas. Sin embargo, las puntuaciones de los síntomas de los pacientes n.° 71 y 76 faltan en el momento 2 y las puntuaciones de los síntomas del paciente n.° 47 faltan en el momento 3, por lo que el número de observaciones efectivas es 217.
bankloan.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de un banco para reducir las tasas de morosidad de los préstamos. El archivo contenía información financiera y demográfica de 850 clientes pasados y potenciales. Los primeros 700 casos eran clientes que habían recibido préstamos anteriormente. Los 150 casos restantes son clientes potenciales y el banco debe clasificarlos como de alto o bajo riesgo crediticio.
bankloan_binning.sav
Este archivo de datos hipotéticos contiene información financiera y demográfica de 5.000 clientes anteriores.
behavior.sav
En un ejemplo clásico2, se pidió a 52 estudiantes que calificaran una combinación de 15 situaciones y 15 comportamientos en una escala de 10 puntos. La escala de puntos oscila entre 0 =. "extremadamente inapropiado" a 9 = "extremadamente inapropiado". La media está por encima de los valores individuales y los valores se consideran diferentes.
behavior_ini.sav
Este archivo de datos contiene la configuración inicial de la solución bidimensional de conduct.sav.
brakes.sav
Este archivo de datos hipotéticos implica el control de calidad en una fábrica que produce frenos de disco para automóviles de alto rendimiento. El archivo de datos contiene mediciones de diámetro de 16 frenos de disco en cada una de ocho máquinas herramienta especializadas. El diámetro objetivo de los frenos de disco es de 322 mm.
breakfast.sav
En un estudio clásico3, se pidió a 21 estudiantes de MBA de Wharton School y a sus cónyuges que calificaran 15 alimentos para el desayuno en orden de preferencia, desde 1 =Se registraron sus preferencias en seis categorías diferentes, que van desde "como todos" hasta "comida rápida con solo una bebida".
breakfast-overall.sav
Este archivo de datos solo contiene el primer caso de preferencias de alimentos para el desayuno, que es "como todos".
broadband_1.sav
Este archivo de datos hipotéticos contiene el número de clientes suscritos a servicios nacionales de banda ancha por región. El archivo de datos contiene recuentos mensuales de suscriptores para 85 regiones durante un período de 4 años.
broadband_2.sav
Este archivo de datos es el mismo que broadband_1.sav, pero contiene tres meses adicionales de datos.
car_insurance_claims.sav
4 conjuntos de datos sobre reclamaciones por daños a automóviles presentados y analizados en otros lugares. El monto promedio de la reclamación se puede modelar como si tuviera una distribución gamma, utilizando una función de enlace inverso para relacionar la media de la variable dependiente con una combinación lineal de edad del asegurado, tipo de vehículo y antigüedad del vehículo. El número de reclamaciones presentadas puede servir como peso de la balanza.
car_sales.sav
Este archivo de datos contiene estimaciones de ventas hipotéticas, precios y especificaciones físicas para varias marcas y modelos de vehículos. Los precios y las especificaciones físicas están disponibles en edmunds.com y en el fabricante.
car_sales_uprepared.sav
Esta es una versión modificada de car_sales.sav y no contiene ninguna versión transformada de los campos.
carpet.sav
En un ejemplo común5, una empresa está poniendo gran énfasis en comercializar un nuevo producto de limpieza de alfombras y quiere examinar el impacto de los cinco factores siguientes en las preferencias de los consumidores. : Diseño de empaque, marca, precio, excelente logo de artículos para el hogar y garantía de devolución. El diseño del empaque tiene tres niveles de factores, cada nivel de factor difiere según la posición del cepillo hay tres marcas (K2R, Glory y Bissell hay tres niveles de precio y los dos últimos factores tienen dos niveles cada uno; ). Diez consumidores clasificaron 22 características definidas por estos factores. La variable contiene preferentemente una clasificación de la clasificación media de cada perfil. Los niveles bajos corresponden a preferencias altas. Esta variable refleja una medida general de preferencia por cada perfil.
carpet_prefs.sav
Este archivo de datos se basa en la misma muestra que se describe en carpet.sav, pero también contiene datos recopilados de cada uno de los 10 consumidores según el orden de clasificación real. Se pidió a los consumidores que clasificaran 22 perfiles de productos del más al menos preferido. Las variables PREF1 a PREF22 definidas en carpet_plan.sav contienen la identificación de características relevantes.
catalog.sav
Este archivo de datos contiene datos hipotéticos de ventas mensuales de tres productos vendidos por una empresa de catalogación. También se incluyen datos de 5 posibles variables predictivas.
catalog_seasfac.sav
Este archivo de datos es el mismo que catalog.sav, excepto que se agrega un conjunto de factores estacionales calculados a partir del proceso de descomposición estacional y las variables de fecha que lo acompañan. mismo.
celular.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de una compañía de telefonía celular para reducir la pérdida de clientes. Se aplica a la cuenta una puntuación de propensión a la deserción, con una puntuación que oscila entre 0 y 100. Las cuentas con una puntuación de 50 o más pueden cambiar de proveedor.
ceramics.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de un fabricante para determinar si una nueva aleación premium tiene mayor resistencia al calor que una aleación estándar. Cada caso representa un examen individual de una aleación; el límite de resistencia al calor de la aleación se registra en el caso.
cereal.sav
Este archivo de datos hipotéticos implica una encuesta de 880 personas sobre las preferencias de desayuno. La encuesta registró la edad, el sexo, el estado civil y la vida de los participantes. manera (según si hacen ejercicio al menos dos veces por semana). Cada caso representa a un encuestado individual.
clothing_defects.sav
Este es un archivo de datos hipotéticos sobre el proceso de control de calidad de una fábrica de ropa. Los inspectores deben tomar muestras e inspeccionar cada lote de ropa producida en la fábrica y contar la cantidad de prendas no calificadas.
coffee.sav
Este es un archivo de datos sobre la imagen de marca percibida 6 de seis tipos de café helado. Para cada uno de los 23 atributos característicos del café helado, las personas seleccionaron todas las marcas descritas por ese atributo. Por motivos de confidencialidad, las seis marcas están representadas por AA, BB, CC, DD, EE y FF.
contacts.sav
Este archivo de datos hipotético incluye una lista de información de contacto de un grupo de representantes de ventas de computadoras de una empresa. Clasifique cada contacto según la división de la empresa en la que trabajan esos representantes de ventas y su nivel dentro de la empresa. También se registra el volumen de ventas más reciente, el tiempo transcurrido desde la última venta y el tamaño de la empresa contactada.
creditpromo.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de una tienda departamental para evaluar la efectividad de su última promoción de tarjetas de crédito. Para ello se seleccionaron aleatoriamente 500 titulares de tarjetas. La mitad de ellos recibieron anuncios que promocionaban tarifas más bajas para los consumidores durante los próximos tres meses. La otra mitad recibió publicidad estacional estándar.
customer_dbase.sav
Este archivo de datos hipotético implica los esfuerzos de una empresa por utilizar información en un almacén de datos para ofrecer ofertas especiales a los clientes que tienen más probabilidades de responder. Seleccione aleatoriamente un subconjunto de su base de clientes y ofrézcales ofertas especiales, mientras registra sus respuestas.
customer_information.sav
Este archivo de datos hipotéticos contiene información de correo del cliente, como el nombre y la dirección.
customer_subset.sav
Un subconjunto de 80 casos de customer_dbase.sav.
debate.sav
Este archivo de datos hipotéticos incluye respuestas emparejadas a una encuesta de participantes en un debate político antes y después del debate. Cada caso corresponde a un encuestado distinto.
debate_aggregate.sav
Este archivo de datos hipotéticos agrega las respuestas en debate.sav. Cada caso corresponde a una clasificación cruzada de preferencias previas y posteriores al debate.
demo.sav
Este es un archivo de datos hipotético para una base de datos de clientes de compras utilizada para enviar artículos mensuales. Se registrará si el cliente respondió al artículo y diversa información demográfica.
demo_cs_1.sav
Este archivo de datos hipotéticos se refiere a los primeros pasos en la iniciativa de una empresa de compilar una base de datos de información de encuestas. Cada caso corresponde a una ciudad diferente, y se registran identificadores regionales, provinciales, distritales y de ciudad.
demo_cs_2.sav
Este archivo de datos hipotéticos se relaciona con el segundo paso de la iniciativa de una empresa de compilar una base de datos de información de encuestas. Cada caso corresponde a una celda de hogar diferente de la ciudad seleccionada en el primer paso, y se registra la región, provincia, distrito, ciudad, subdistrito y el identificador de la celda. También se incluye información de muestreo para las dos primeras etapas del diseño.
demo_cs.sav
Este archivo de datos hipotéticos contiene información de encuesta recopilada mediante un diseño de muestreo complejo. Cada caso corresponde a una célula de hogar diferente y se registra diversa información demográfica y muestral.
dmdata.sav
Este archivo de datos hipotéticos contiene información demográfica y de compras para una empresa de venta directa. dmdata2.sav contiene información para el subconjunto de contactos que recibieron el correo de prueba y dmdata3.sav contiene información para los contactos restantes que no recibieron el correo de prueba.
dietstudy.sav
Este archivo de datos hipotéticos contiene los resultados del estudio "Dieta Stillman" 7. Cada caso corresponde a un sujeto individual y se registra su peso (en libras) y niveles de triglicéridos (mg/100 ml) antes y después del régimen dietético.
dvdplayer.sav
Este es un archivo de datos hipotéticos sobre el desarrollo de un nuevo reproductor de DVD. El equipo de marketing recopiló datos de grupos focales utilizando el prototipo. Cada caso corresponde a un usuario individual encuestado, y se registra su información demográfica y sus respuestas a preguntas prototipo.
german_credit.sav
Este archivo de datos se tomó del conjunto de datos de "crédito alemán" en el Repositorio de bases de datos de aprendizaje automático 8 de la Universidad de California, Irvine.
grocery_1month.sav
Este archivo de datos hipotético se basa en el archivo de datos comestibles_coupons.sav más la "acumulación" de compras semanales, por lo que cada caso corresponde a un cliente independiente. Por lo tanto, algunas de las variables que cambiaban de una semana a otra desaparecieron y la cantidad de consumo registrada ahora es la suma de la cantidad gastada durante el transcurso del estudio de cuatro semanas.
grocery_coupons.sav
Este archivo de datos hipotéticos contiene datos de encuestas recopilados por una cadena de supermercados que valora los hábitos de compra de los clientes. Cada cliente es encuestado durante cuatro semanas, correspondiendo cada caso a una semana de cliente separada, y se registra información sobre dónde y cómo compró el cliente (incluido cuánto gastó en comestibles durante esa semana).
guttman.sav
Bell 9 crea una tabla que ilustra posibles grupos sociales. Guttman 10 cita una parte de esta tabla, que incluye cinco variables que describen la interacción social, el sentido de pertenencia al grupo, la proximidad física de los miembros y la formalidad de las relaciones en siete grupos sociales teóricos: Espectadores (por ejemplo, personas presentes en los partidos de fútbol), audiencia (como personas en un teatro o escuchando una conferencia en el aula), público (como una audiencia de periódico o televisión), grupo organizacional (similar a la audiencia pero con una relación cercana), grupo primario (relación cercana), grupo secundario ( organizaciones espontáneas) y comunidades modernas (la proximidad física conduce a relaciones relajadas y a la necesidad de servicios especializados).
health_funding.sav
Este archivo de datos hipotéticos contiene información sobre financiación de la salud (cantidad por 100 personas), tasas de incidencia (tasa por 10 000 personas) y tasas de visitas a proveedores de salud (por 10 000 relación) datos. Cada caso representa una ciudad diferente.
hivassay.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de un laboratorio farmacéutico para desarrollar un ensayo rápido para la detección de la infección por VIH. Los resultados de la prueba son ocho tonos de rojo más oscuros, y los tonos más oscuros indican una mayor probabilidad de infección. Se realizaron pruebas de laboratorio a 2.000 muestras de sangre, la mitad de las cuales estaban infectadas con el VIH y la otra mitad no.
hourlywagedata.sav
Este archivo de datos hipotéticos se refiere a los salarios por hora de enfermeras con distintos niveles de experiencia que trabajan en agencias gubernamentales y hospitales.
insurance_claims.sav
Este archivo de datos hipotéticos se refiere a una compañía de seguros que quiere crear un modelo para detectar reclamaciones sospechosas y potencialmente fraudulentas. Cada caso representa un reclamo separado.
insure.sav
Este archivo de datos hipotéticos involucra a una compañía de seguros que está estudiando factores de riesgo que indican si los clientes presentarán un reclamo bajo un contrato de seguro de vida de 10 años. Cada caso en el archivo de datos representa un par de contratos emparejados por edad y género, uno de los cuales registra un reclamo y el otro no.
judges.sav
Este archivo de datos hipotéticos incluye puntuaciones dadas por jueces capacitados (más un entusiasta de la gimnasia) para 300 actuaciones de gimnasia.
Cada fila representa una actuación separada; los jueces observan la misma actuación.
kinship_dat.sav
Rosenberg y Kim 11 comenzaron a analizar 15 términos de parentesco (tía, hermano, prima, hija, padre, nieta, abuelo, abuela, nieto, madre, sobrinos, sobrinas, hermanas, hijos y tíos). Pidieron a cuatro grupos de estudiantes universitarios (dos grupos de estudiantes mujeres, dos grupos de estudiantes hombres) que clasificaran los elementos según su grado de similitud. Pidieron que dos grupos de estudiantes (un grupo de estudiantes mujeres y un grupo de estudiantes hombres) fueran clasificados dos veces. Los criterios utilizados para la segunda clasificación fueron diferentes a los de la primera clasificación. De esta forma, un *** obtiene seis grupos de "fuentes". Cada fuente corresponde a una matriz de aproximaciones de 15 x 15 cuyas celdas contienen valores iguales al número de personas en la fuente menos el número de veces que se ha dividido el objeto en la fuente.
kinship_ini.sav
Este archivo de datos contiene la configuración inicial de la solución tridimensional de kinship_dat.sav.
kinship_var.sav
Este archivo de datos contiene las variables independientes género, generación y grado (de separación), que pueden usarse para explicar la dimensionalidad de la solución a parentesco_dat.sav. Específicamente, se pueden utilizar para restringir el espacio de soluciones a combinaciones lineales de estas variables.
marketvalues.sav
Este archivo de datos cubre las ventas de viviendas en nuevos desarrollos de viviendas en el área de Algonquin, Illinois, durante 1999–2000. Estas ventas se derivan únicamente de registros públicos.
nhis2000_subset.sav
La Encuesta Nacional de Entrevistas de Salud (NHIS) es una gran encuesta poblacional de todos los ciudadanos de los Estados Unidos. La encuesta realizó entrevistas cara a cara con una muestra de hogares representativa a nivel nacional en los Estados Unidos y capturó datos demográficos y de observación sobre los comportamientos de salud y el estado de salud de los miembros de cada hogar. Este archivo de datos contiene un subconjunto de información extraída de la encuesta de 2000. Centro Nacional de Estadísticas de Salud. Encuesta de entrevistas de salud estadounidense de 2000. Archivos y documentos públicos de datos. ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/Datasets/NHIS/2000/. Lanzado en 2003.
ozone.sav
Los datos contienen 330 observaciones de seis variables meteorológicas utilizadas para predecir las concentraciones de ozono a partir de las variables restantes. Entre investigadores anteriores, 12, 13 encontraron no linealidades entre estas variables, lo que obstaculizó los métodos de regresión estándar.
pain_medication.sav
Este archivo de datos hipotéticos contiene los resultados de un ensayo clínico de un fármaco antiinflamatorio utilizado para tratar el dolor crónico de la artritis. Nos interesa saber cuánto tiempo tarda el fármaco en actuar y cómo se compara con los fármacos existentes.
patient_los.sav
Este archivo de datos hipotéticos contiene los registros de tratamiento de un paciente diagnosticado por un hospital con sospecha de infarto de miocardio (es decir, un infarto de miocardio o "ataque cardíaco"). Cada caso corresponde a un paciente individual y se registran una serie de variables relacionadas con su hospitalización.
patlos_sample.sav
Este archivo de datos hipotéticos contiene ejemplos de registros de tratamiento para un paciente que recibió un agente trombolítico durante el tratamiento de un infarto de miocardio (es decir, infarto de miocardio o "ataque cardíaco"). Cada caso corresponde a un paciente individual y se registran una serie de variables relacionadas con su hospitalización.
poll_cs.sav
Este archivo de datos hipotéticos se refiere a las acciones de los encuestadores para determinar el nivel de apoyo público a un proyecto de ley antes de que se promulgue formalmente. Los casos corresponden a electores registrados. Cada caso registra el condado, ciudad y distrito donde vive el votante.
poll_cs_sample.sav
Este archivo de datos hipotéticos contiene una muestra de los votantes enumerados en poll_cs.sav. La muestra se selecciona según el diseño especificado en poll.csplan y el registro del archivo de datos contiene probabilidades y ponderaciones de muestra.
Tenga en cuenta que dado que este plan de muestreo utiliza el método proporcional al tamaño (PPS), también hay un archivo (poll_jointprob.sav) que contiene las probabilidades de selección conjunta. Una vez seleccionada la muestra, se recopilan y agregan al archivo de datos variables adicionales correspondientes a la demografía de los votantes y sus opiniones sobre los proyectos de ley presentados.
property_assess.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos del tasador de propiedades de un condado para actualizar continuamente las evaluaciones del valor de las propiedades utilizando recursos limitados. Los casos corresponden a propiedades vendidas en el condado durante el último año. Cada caso en el archivo de datos registra la localidad en la que se encuentra la propiedad, el tasador que tasó la propiedad por última vez, el tiempo transcurrido desde esa tasación, la valoración en ese momento y el precio por el que se vendió la propiedad.
property_assess_cs.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de un tasador de propiedades de un estado para actualizar continuamente las evaluaciones del valor de las propiedades utilizando recursos limitados. Los casos corresponden a bienes en el estado. Cada caso en el archivo de datos registra el condado, ciudad y distrito en el que se encuentra la propiedad, hace cuánto tiempo fue tasada por última vez y su valor estimado en ese momento.
property_assess_cs_sample.sav
Este archivo de datos hipotéticos contiene una muestra de los activos enumerados en property_assess_cs.sav. La muestra se selecciona según el diseño especificado en property_assess.csplan y los registros del archivo de datos contienen probabilidades y ponderaciones de muestra. Después de seleccionar la muestra, se recopilará la variable adicional Valor actual y se agregará al archivo de datos.
recidivism.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de una agencia gubernamental encargada de hacer cumplir la ley para comprender las tasas de reincidencia dentro de su jurisdicción. Cada caso corresponde a un delincuente anterior y se registra su información demográfica y detalles del primer delito, si se produce un segundo arresto dentro de los dos años posteriores al primer arresto, ambos arrestos también se registran por intervalo de tiempo;
recidivism_cs_sample.sav
Este archivo de datos hipotéticos se refiere a los esfuerzos de una agencia gubernamental encargada de hacer cumplir la ley para comprender las tasas de reincidencia dentro de su jurisdicción. Cada caso corresponde a un delincuente anterior que fue arrestado por primera vez y liberado durante junio de 2003, con información demográfica y detalles del primer delito registrado, así como datos sobre su segundo arresto (si lo hubo antes de finales de junio de 2006). Los infractores se seleccionan de las unidades de muestreo de acuerdo con el plan de muestreo especificado en recidivism_cs.csplan; este plan utiliza el método Proporcional al tamaño (PPS), por lo tanto, también hay un archivo (recidivism_cs_jointprob.sav) que contiene las probabilidades de selección conjunta.
rfm_transactions.sav
Este archivo de datos hipotéticos contiene datos de transacciones de compra, es decir, la fecha de compra, el artículo comprado y el monto gastado en cada transacción.
salesperformance.sav
Este es un archivo de datos hipotéticos sobre la evaluación de dos nuevos cursos de capacitación en ventas. Los 60 empleados se dividieron en 3 grupos y todos recibieron una formación estándar. Además, el Grupo 2 recibió formación técnica; el Grupo 3 recibió tutorías prácticas. Al final de la sesión de formación, realice una prueba a cada empleado y registre sus puntuaciones. Cada caso en el archivo de datos representa a un alumno individual y registra el grupo al que fue asignado y su puntuación en la prueba.
satisf.sav
Este archivo de datos hipotéticos implica una encuesta de satisfacción realizada por una empresa minorista en cuatro tiendas. En total*** encuestó a 582 clientes, y cada caso representa las respuestas de un cliente individual.
tornillos.sav
Este archivo de datos contiene información sobre las características de tornillos, pernos, tuercas y chinchetas14.
shampoo_ph.sav
Este es un archivo de datos hipotéticos sobre el control de calidad en una fábrica de productos para el cabello. Se probaron seis lotes de salida independientes a intervalos específicos y se registraron sus valores de pH. El rango objetivo es 4,5–5,5.
barcos.sav
<