La Red de Conocimientos Pedagógicos - Conocimientos sobre estudiar en el extranjero - Hola. ¿Podrías enviarme las respuestas a tus ejercicios extraescolares de Estadísticas de la cuarta edición? Gracias. 571949353

Hola. ¿Podrías enviarme las respuestas a tus ejercicios extraescolares de Estadísticas de la cuarta edición? Gracias. 571949353

Respuestas a la Estadística Cuarta Edición

Capítulo 1

¿Qué es la Estadística? ¿Cómo entender la relación entre estadística y datos estadísticos?

Respuesta: La estadística es la ciencia de recopilar, organizar, mostrar y analizar datos estadísticos. Existe una estrecha relación entre estadística y datos estadísticos. Los métodos estadísticos descritos en estadística se originan en el estudio de datos estadísticos y están destinados a estudiar datos estadísticos. Sin datos estadísticos, los métodos estadísticos y las estadísticas pierden su significado.

2. Explique brevemente la fuente de los datos estadísticos.

Respuesta: Los datos estadísticos provienen de dos vertientes: los datos directos: encuestas, observaciones y experimentos científicos directamente organizados. En el ámbito de la gestión social y económica, se obtiene principalmente a través de encuestas estadísticas, como censos y encuestas por muestreo. Datos indirectos: Obtenidos de periódicos, libros, revistas, anuarios estadísticos, Internet y otros canales.

3. Explique brevemente el error muestral y el error no muestral.

Respuesta: Los errores de las encuestas estadísticas se pueden dividir en errores no muestrales y errores muestrales. Los errores ajenos al muestreo se deben a errores en diversos aspectos durante el proceso de la encuesta y, en teoría, pueden evitarse. El error de muestreo es el error que se produce al utilizar muestras para inferir la población. Es inevitable pero puede controlarse.

4. Respuesta: (1) Hay dos poblaciones: todos los productos de la marca A y todos los productos de la marca b.

(2) Variable: sabor (por ejemplo, se puede expresar como 10 puntos)

(3) Muestra coincidente: se extraen 65.438+0.000 botellas de dos marcas de productos, respectivamente calificados por 65,438+0,000 consumidores para formar una muestra coincidente.

(4) Inferir el sabor relativo de dos marcas a partir de observaciones de muestras coincidentes.

Capítulo 2, Descripción de datos estadísticos

Preguntas para reflexionar

1 describe el proceso de preparación de la tabla de asignación de frecuencias.

Respuesta: Hay dos pasos:

Utilizar marcadores de agrupación para agrupar los datos según el propósito de la investigación estadística.

Al agrupar según marcas de calidad, cada actuación específica puede considerarse como un grupo, o se pueden combinar varias actuaciones en un grupo, dependiendo del grosor del grupo.

La agrupación por marca de cantidad se puede dividir en agrupación de un solo artículo y agrupación por espacio de grupo.

La agrupación de un solo elemento utiliza cada valor de variable como un grupo; la agrupación de intervalo utiliza el rango (intervalo) de la variable como un grupo.

La agrupación estadística debe seguir el principio de "sin repetición, sin omisión".

Distribuya los datos a cada grupo, cuente los tiempos de cada grupo y prepare una tabla de distribución de frecuencias.

2. Explicar la curva de Lorenz y sus usos.

Respuesta: La curva de Lorenz es una línea que describe el ingreso trazada por Lorenz, un economista y estadístico estadounidense de principios del siglo XX, basándose en la fórmula de distribución del ingreso propuesta por el economista italiano Pareto y la naturaleza de la distribución de la riqueza. . La curva de Lorenz se puede utilizar para observar y analizar el grado promedio de distribución del ingreso en países y regiones.

3. ¿En qué aspectos se pueden medir las características de distribución de un conjunto de datos?

Respuesta: Las características de la distribución de datos generalmente se pueden medir en términos de tendencia central, grado de dispersión, asimetría, curtosis, etc. Los indicadores comúnmente utilizados incluyen media, mediana, moda, rango, varianza, desviación estándar, coeficiente de dispersión, coeficiente de asimetría y coeficiente de curtosis.

4¿Cómo entender el estatus de la media en estadística?

Respuesta: El valor promedio es el valor representativo del nivel general calculado promediando todos los datos, lo que extrae la información de datos más completa.

Tiene buenas propiedades matemáticas. Es un reflejo de las características cuantitativas de la inevitabilidad de las cosas objetivas después de que los errores de datos se cancelen entre sí. Muestra excelentes características en la inferencia estadística, por lo que la media tiene una importancia muy importante. fundamento en el estado de las estadísticas. El efecto de los valores extremos supone un problema en su uso.

5 Para promediar datos de proporciones, ¿por qué deberíamos utilizar la media geométrica?

Respuesta: Los datos de proporciones a menudo presentan la característica de que el producto continuo es la proporción total, lo cual es diferente de los datos generales donde la suma es el total, por lo que se requiere una media geométrica.

6. Describe brevemente las características y aplicaciones de la moda, la mediana y la media.

Respuesta: La moda, la mediana y la media son las tres medidas principales de la tendencia de concentración de la distribución. La moda y la mediana se consideran en términos de la forma y ubicación de la distribución de datos, mientras que la media se calcula a partir de todos los datos. La moda es fácil de calcular, pero no siempre existe, por lo que tiene pocas aplicaciones.

La mediana es intuitiva y no se ve afectada por los datos extremos, pero la información de los datos no se utiliza por completo; los datos medios extraen la mayor parte de la información, pero se ven afectados por los datos extremos.

7¿Por qué necesitamos calcular el coeficiente discreto?

Respuesta: Al comparar las diferencias entre dos conjuntos de datos, debido a la influencia de los niveles de valores variables y las unidades de medida, la varianza y la desviación estándar no se pueden comparar directamente y el coeficiente de dispersión debe calcularse como un índice de comparación.

Preguntas del ejercicio:

1. La tabla de distribución de frecuencias es la siguiente:

Distribución de frecuencias de la evaluación del nivel de calidad del servicio

Calidad del servicio nivel (frecuencia) frecuencia porcentaje número de hogares

a 14 14

b 21 21

32 32

d 18 18

e 15 15

Total 100

Gráfico de barras (omitido)

2 (1) Usar agrupación equidistante:

N=40Distancia completa=152-88=64 la distancia del grupo es 10.

El número de grupos es 64/10=6,4, elige 6 grupos.

La tabla de distribución de frecuencias es la siguiente:

Se agrupan 40 empresas según los ingresos por ventas de productos.

Grupo por ingresos por ventas

Número de empresas (10.000 yuanes)

Frecuencia

(%) se acumula hacia arriba y hacia abajo.

Frecuencia del número empresarial

Inferior a 100

100~110

110~120

120~130

130~140

140 y más 5

Nueve

12

Siete

Cuatro

3 12,5

22,5

30,0

17,5

10,0

7,5 5

14

26

33

37

40 12,5

35,0

65,0

82,5

92,5

100,0 40

35

26

14

Siete

3 100,0

87,5

65,0

35,0< / p>

17.5

7.5

Total 40 100.0 ——

(2) Tabla de agrupación de 40 empresas en una determinada oficina.

Número de empresas agrupadas por frecuencia de los ingresos por ventas (10.000 yuanes) (%)

Empresas avanzadas

Buenas empresas

Empresas generales

Empresas atrasadas 11

11

Nueve

9 27,5

27,5

22,5

22,5

Total 40 100,0

3 Utilice agrupaciones igualmente espaciadas.

Rango completo=49-25=24

N=40, si el intervalo entre grupos es 5, entonces el número de grupos es 24/5=4.8, elija 5 grupos.

Tabla de distribución de frecuencia:

Agrupar por frecuencia de ventas (10.000 yuanes) (número de días)

25-30

30- 35

35-40

40-45

45-50 4

Seis

15

Nueve

Seis

Total 40

Cuatro.. (1) Ligeramente ordenados.

(2) La tabla de distribución de frecuencias es la siguiente:

Distribución sin frecuencia de la vida útil de 100 bombillas

Agrupar por vida útil (horas) Número de bombillas ( solamente) Frecuencia (%)

650~660 2 2

660~670 5 5

670~680 6 6

680 ~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

Total 100

Histograma (omitido).

(3) El diagrama esquemático de tallos y hojas es el siguiente:

65 1 8

66 1 4 5 6 8

67 1 3 4 6 7 9

68 1 1 2 3 3 3 4 5 5 5 8 8 9 9

69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9

70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9

71 0 0 2 2 3 3 5 6 7 7 8 8 9

72 0 1 2 2 5 6 7 8 9 9

73 3 5 6

74 1 4 7

5 grupos igualmente espaciados

N=65Intervalo completo=9-(-25)=34 Tome la distancia del grupo como 5, el número de grupos=34/5=6.8, y tomar 7 grupos.

Tabla de distribución de frecuencias:

Días agrupados por temperatura

-25 - -20

-20 - -15

-15 - -10

-10 - -5

-5 - 0

0 - 5

5 - 10 8

Ocho

10

14

14

Cuatro

Siete

Total 65

7 (1) El diagrama de tallo y hoja es el siguiente:

Nivel a nivel de tronco b

Número de datos y número de hojas

0 3 59 2

1 4 4 0448 4

2 97 5 122456677789 12

11 97665332110 6 011234688 9

23 98877766555554443332100 7 00113449 8

7 6655200 8 123345 6

6 632220 9 011456 6

0 10 000 3

La distribución de las puntuaciones de las pruebas de la Clase A está relativamente concentrada, con una puntuación media alta; la distribución de las puntuaciones de las pruebas de la Clase B está más dispersa que la de la Clase A, con una puntuación media más baja que la de la Clase A.

8. El diagrama de bloques es el siguiente: (analice las características usted mismo)

9. (1) = 274,1 (diez mil yuanes); ; QU = 291,25.

p>

(2)(10.000 yuanes).

10. El costo promedio de la empresa A = 19,45438+0 (yuanes),

El costo promedio de la empresa B = 18,29 (yuanes); : Aunque los costos unitarios de las dos empresas son los mismos, los productos con costos unitarios más bajos representan una proporción mayor de la producción de la empresa B, lo que reduce el costo promedio total.

11.= 426,67 (diez mil yuanes);

= 116,48 (diez mil yuanes)

13 (1) Coeficiente de dispersión, porque elimina diferentes grupos del nivel de impacto de los datos.

(2) El coeficiente de dispersión de la altura de los adultos:

El coeficiente de dispersión de la altura de los niños:;

Porque el coeficiente de dispersión de la altura de los niños es mayor que ese de los adultos, significa que la altura de los niños El grado de dispersión es relativamente grande.

14. La tabla proporciona algunas estadísticas descriptivas principales.

Método a, método b y método c

Promedio 165,6 Promedio 128,73 Promedio 125,53

Mediana 165 Mediana 129 Mediana 126

Moda 164 Modo 128 Modo 126

Desviación estándar 2,13 Desviación estándar 1,75 Desviación estándar 2,77

Rango extremo 8 Rango extremo 7 Rango extremo 12

Valor mínimo 162 Valor mínimo 125 Valor mínimo 116

Valor máximo 170 Valor máximo 132 Valor máximo 128

Primero, considere el índice promedio. Cuando el índice promedio es similar, considere el índice de dispersión.

Se debe seleccionar el método A. Su valor promedio es mucho mayor que los otros dos métodos y su dispersión es similar a la de los otros dos grupos.

15. (1) La medición del riesgo es un tema en evolución. En la teoría financiera clásica, la desviación estándar se refleja principalmente como una estadística, mientras que en las finanzas modernas se utiliza el valor en riesgo.

(2) Las acciones comerciales son más pequeñas independientemente de la medida de riesgo utilizada.

(3) La elección de acciones por parte de un individuo está relacionada con factores como su preferencia por el riesgo.

Capítulo 4

1. La distribución global se refiere a la distribución formada por el valor de una determinada variable sobre cada individuo de la población. Se desconoce y es objeto de inferencia estadística. Se selecciona aleatoriamente una muestra de capacidad n de la población y su distribución se denomina distribución muestral. La distribución de estadísticas formada por una función de la muestra se llama distribución muestral (como la distribución de la media muestral y la varianza muestral).

2. En el caso de muestreo repetido y no repetitivo, la desviación estándar de la media muestral es:

Por lo tanto, la desviación estándar en el caso de muestreo no repetitivo es menor que la desviación estándar en el caso de muestreo no repetitivo. muestreo repetido Ambos La diferencia es un coeficiente de ajuste.

3. Explique el significado del teorema del límite central

Respuesta: En la inferencia de muestreo, el teorema del límite central establece que no importa qué distribución obedezca la población, siempre que se cumpla su expectativa matemática. y existe varianza, cuando la muestra Cuando la cantidad es lo suficientemente grande, la media muestral tiende a distribuirse normalmente. El teorema del límite central sienta las bases teóricas para la inferencia muestral de la media.

Capítulo 4, Estimación de parámetros

Describa brevemente los criterios para evaluar la calidad de los estimadores

Respuesta: Los principales criterios para evaluar la calidad de los estimadores son: equidad y validez sexo y consistencia. Supongamos que el estimador del parámetro poblacional tiene y, de ser así, se llama estimador insesgado si la suma es un estimador insesgado y es menor que, entonces la razón es más efectiva si el tamaño de la muestra es 0; estimador consistente.

2. Explicar los principios básicos de la estimación de intervalos.

Respuesta: La estimación por intervalo del parámetro poblacional se basa en la distribución muestral de la estadística muestral bajo un cierto nivel de confianza, calculando el intervalo de estimación representado por el error muestral positivo y negativo de la estadística muestral, por lo que que el intervalo contenga la probabilidad del parámetro poblacional es el nivel de confianza. El nivel de confianza refleja la confiabilidad de la estimación, mientras que la duración del intervalo refleja la precisión de la estimación.

3. Explique el significado de los intervalos de confianza utilizando un nivel de confianza del 95%.

Respuesta: Los parámetros generales son fijos y desconocidos, y el intervalo de confianza es un intervalo aleatorio. Un intervalo de confianza con un nivel de confianza del 95% significa que aproximadamente el 95% de todos los intervalos de confianza construidos contienen el valor real del parámetro poblacional en las mismas condiciones.

4. Describa brevemente la relación entre el tamaño de la muestra y el nivel de confianza, la varianza poblacional y el error permitido.

Respuesta: Tome como ejemplo la fórmula para determinar el tamaño de la muestra al estimar la media poblacional:

El tamaño de la muestra es directamente proporcional al nivel de confianza, la varianza de la población y el error permitido.

2. Respuesta: Significado de la pregunta: El tamaño de la muestra es

Si

Si

Solución: De la pregunta:

Aunque se utiliza un muestreo no repetido, dado que la proporción de la muestra es muy pequeña (menos del 0,5%), el error de muestreo es aproximadamente el mismo que el del muestreo repetido y se calcula utilizando la fórmula de error de muestreo del muestreo repetido. .

Para una muestra grande, el intervalo de confianza en el nivel de significancia es:

Cuando, el intervalo de confianza es (2,88, 3,76)

Cuándo, el intervalo de confianza intervalo es (2.80, 3.84)

Cuando, el intervalo de confianza es (2.63, 4.01)

Solución 5: suponga que la distancia obedece a la distribución normal,

95% de la distancia promedio Intervalo de confianza = (7,18, 11,57).

7 Solución: Del significado de la pregunta:.

Al ser más de 5, es una muestra grande.

(1) El intervalo de confianza del nivel de significancia de la tasa de acuerdo en la población es

En ese momento,

El intervalo de confianza es (50,7% , 77,3%)

p>

(2) Si el error permitido no supera el 10% y el nivel de confianza es del 95%, el número de hogares seleccionados debe ser:

8. Esta pregunta requiere probar si las varianzas de las dos poblaciones son iguales:

Al nivel de significancia del 5 %,

, no rechace la hipótesis original.

Las varianzas de las dos poblaciones son las mismas.

(1)

Es decir (1.93, 17.669)

(2)

Es decir (0.27, 19.32)

11. Situación de muestra grande

(1) Nivel de confianza del 90%

(3,021%,16,979)

(2) Al 95% Bajo el nivel de confianza

(1,684%, 18,316%)

12. Respuesta: El problema se puede calcular:

El intervalo de confianza del 95% de los dos. el índice de varianza de la población es:

14 Solución: Del significado de la pregunta:

El número de clientes que se deben extraer es:

Capítulo 5, Prueba de hipótesis

Preguntas para pensar

1.1 Comprender el significado de la hipótesis nula y la hipótesis alternativa, y resumir varios principios comunes para establecer la hipótesis nula y la hipótesis alternativa.

Respuesta: La hipótesis nula suele ser una hipótesis que los investigadores quieren recopilar evidencia para rechazar; la hipótesis alternativa suele ser una hipótesis que los investigadores quieren recopilar evidencia para respaldar. Los principios para establecer dos hipótesis son:

(1) La hipótesis nula y la hipótesis alternativa son un grupo de eventos completo. (2) Generalmente determine primero la hipótesis alternativa. Luego determine la hipótesis inicial. (3) El signo igual "=" siempre se coloca en la hipótesis nula. (4) El juicio de hipótesis es algo subjetivo. (5) El propósito de la prueba de hipótesis es principalmente recopilar evidencia para negar la hipótesis original.

2. ¿Qué son los errores de tipo I y tipo II? ¿Cuál es la relación entre su probabilidad de ocurrencia?

Respuesta: El error tipo I se refiere al error que se comete cuando la hipótesis nula es verdadera, con probabilidad. El error tipo II se refiere al error que ocurre cuando la hipótesis nula es falsa, con probabilidad . Cuando otras condiciones permanecen sin cambios, aumentan o disminuyen;

3. ¿Cuál es el nivel de significancia? ¿Cuáles son sus implicaciones para las decisiones de prueba de hipótesis?

Respuesta: La probabilidad de cometer un error de tipo I en la prueba de hipótesis se llama nivel de significancia. El nivel de significancia suele ser un valor dado de antemano por las personas para probar la confiabilidad de los resultados. Sin embargo, se determina que el nivel de significancia es igual a la probabilidad de cometer un error de tipo I, mientras que la probabilidad de cometer un error de tipo. II error es incierto, por lo que "rechazo" La confiabilidad de la conclusión "hipótesis nula" es segura, pero la confiabilidad de la conclusión "no rechazar la hipótesis nula" es difícil de controlar.

4. ¿Cuál es el valor P? ¿Cuál es la diferencia entre la prueba del valor P y la prueba estadística?

Respuesta: El valor P es la probabilidad de que cuando la hipótesis nula es verdadera, el estadístico de prueba sea menor o igual al estadístico de prueba calculado con base en los datos de la muestra observados reales. El valor p se utiliza a menudo para medir la inconsistencia entre los datos observados y la hipótesis original. Las pruebas estadísticas utilizan un nivel de significancia predeterminado para controlar el límite superior de cometer errores de Tipo I, y el valor P puede complementar eficazmente la información limitada proporcionada sobre la confiabilidad de la prueba. La ventaja de las pruebas de valor es que proporciona más información, lo que permite a las personas elegir un cierto nivel para evaluar si los resultados son estadísticamente significativos.

5. ¿Qué es la significación estadística?

Respuesta: Una prueba es estadísticamente significativa (rechazo de la hipótesis nula), lo que significa que dicho resultado (muestra) no se obtiene por casualidad, o no se puede obtener por casualidad. El significado del significado radica en "no accidental"

Ejercicio

3. El primer error es que el peso promedio de las papas fritas proporcionadas por el proveedor no es menor. de 60 gramos, pero la tienda se negó y se quejó.

(2) El segundo error es que el peso medio de las patatas chips que proporciona el proveedor es inferior a 60 gramos, pero la tienda no las rechaza.

(3) Los clientes considerarán que los errores de Tipo II son graves, mientras que los proveedores considerarán que los errores de Tipo I son más graves.

4. Solución: Proponer una hipótesis

Conocida

Las estadísticas de la prueba son las siguientes

La regla de rechazo es: si, rechazar ; De lo contrario, no te niegues.

De:, se negó, pensando que mejorando la tecnología se puede mejorar su fuerza promedio.

Opción 5: Establecer como el tiempo promedio (horas) dedicado a ver televisión por familia por día.

La hipótesis a probar es:

La muestra investigada es:

El estadístico de prueba bajo una muestra grande es:

En 0,01 En el nivel de significancia de , el valor crítico de la prueba de la mano derecha es

Porque no, se puede considerar que el tiempo medio por hogar viendo televisión al día ha aumentado.

6. Solución: Plantee una hipótesis

Conocida:

Estadística de prueba

Rechace, puede juzgar la variación del servicio de TV. vida Significativamente más grande que una videograbadora.

7. Solución: Plantee una hipótesis:

, muestra grande e independiente, el estadístico de prueba es:

Y 2,33 debido al rechazo, el tiempo promedio de ensamblaje. La diferencia no es igual a 5 minutos.

8. Solución: Relaciona muestras pequeñas y propone hipótesis:

Calculadora:, las estadísticas de la prueba son

Si no la rechazas, no puedes pensar eso. el anuncio ha mejorado Puntuación media de poder adquisitivo potencial.

9. Solución: Proponga una hipótesis:

Conocida:

Para muestras grandes, las estadísticas de prueba son:

Pero debido a rechazo, se puede argumentar que quienes buscan información tienen tasas de licencia pasiva significativamente más bajas que quienes no buscan información.

10. Solución: Proponer una hipótesis:

Calcular según el problema:

Las estadísticas de la prueba son:, y

Entonces Lo rechacé, argumentando que había una diferencia significativa en la variación entre las dos máquinas.

Análisis de correlación y regresión

Preguntas para pensar

¿Cuáles son las diferencias y conexiones entre el análisis de correlación y el análisis de regresión?

Respuesta: El análisis de correlación y regresión son métodos importantes para estudiar la relación estadística de incertidumbre entre variables. El análisis de correlación determina principalmente si existe una correlación entre dos o más variables y analiza la forma y el grado de correlación entre variables. El análisis de regresión mide principalmente la regularidad de los cambios cuantitativos entre fenómenos relacionados. Sin embargo, existen diferencias obvias entre los dos en cuanto a los propósitos de investigación y el procesamiento de variables. Todos ellos son métodos estadísticos y no pueden revelar la relación esencial entre los fenómenos.

3. ¿Qué son la función de regresión general y la función de regresión muestral? ¿Cuál es la diferencia entre los dos?

Respuesta: Tomemos como ejemplo el modelo de regresión lineal simple. La función de regresión general es una función que expresa la expectativa condicional de la variable dependiente general como variable independiente. La función de regresión poblacional está determinada y se desconoce, y es objeto de análisis de regresión. La función de regresión muestral es la relación funcional entre la variable dependiente y la variable independiente estimada con base en los datos de la muestra: o. El propósito del análisis de regresión es estimar la función de regresión poblacional utilizando la función de regresión muestral. La diferencia entre los dos es que la función de regresión general se desconoce pero se determina, mientras que la función de regresión muestral cambia con la fluctuación de la muestra y se determinan los parámetros de la función de regresión muestral, mientras que los coeficientes de la función de regresión muestral son variables aleatorias; . El término de error en la función de regresión poblacional no es observable, mientras que el término residual en la función de regresión muestral es observable.

4. ¿Qué son los términos de error aleatorio y los residuos? ¿Cuál es la diferencia entre los dos?

Respuesta: El término de error aleatorio representa el impacto de variables distintas de la variable independiente sobre la variable dependiente. No es observable y generalmente se supone. El término residual se refiere a la desviación observable entre el valor observado real de la variable dependiente y el valor estimado calculado por la función de regresión muestral. La diferencia entre los dos radica en los diferentes significados de reflexión y diferente observabilidad. Su relación puede ser:

5. ¿Por qué necesitamos hacer algunos supuestos básicos sobre el modelo al estimar parámetros utilizando el método de mínimos cuadrados? ?

Respuesta: El método de mínimos cuadrados es solo un método para encontrar estimadores. Que el estimador que encuentre tenga buenas propiedades depende de algunos supuestos básicos del modelo. El estimador de mínimos cuadrados es azul sólo bajo un conjunto de supuestos clásicos.

15.. ¿Por qué es necesario modificar el coeficiente determinable en regresión múltiple?

Respuesta: Bajo un cierto tamaño de muestra, a medida que aumenta el número de variables independientes en el modelo, el coeficiente determinable aumentará y el grado de ajuste del modelo aumentará, pero se perderá el grado de libertad. reduciendo así la precisión de la inferencia. Por lo tanto, es necesario utilizar grados de libertad para corregir el coeficiente de determinabilidad y utilizar el coeficiente de determinabilidad corregido para juzgar si es apropiado agregar variables independientes.

16. En regresión lineal múltiple, ¿por qué necesitamos hacer análisis de varianza y prueba f después de prueba T?

Respuesta: La prueba T sólo prueba la significancia de un único coeficiente. Debido a la compleja relación entre variables independientes, los coeficientes de regresión deben probarse en su conjunto. El análisis de varianza y la prueba f son métodos para probar la significancia estadística general de la ecuación de regresión.

Ejercicio

Solución: Sea la ecuación de regresión lineal simple:

Utilice la estimación MCO:

La importancia económica del coeficiente de regresión : ventas Por cada aumento en los ingresos de 6,5438+0 millones de yuanes, el costo de ventas aumenta en 0,786 millones de yuanes.

El coeficiente determinable es:

Error estándar de regresión:

El estadístico de prueba es el siguiente:

Por lo tanto, claramente no es cero. .

Predicción:

El intervalo de predicción del 95% es:

Es decir (664.579, 674.153)

2.

(1)

(2) Correlación negativa

(3)

(4) La pendiente estimada es -7.0414, lo que significa que el vuelo tasa de puntualidad cada Con un aumento del 1%, el número de quejas por millón de pasajeros disminuirá: 7,0414 * 0,01 = 0,070414.

(5) Si, entonces multiplicado

3.

Resultados de regresión múltiple de y

Medidas resumidas

Múltiple R 0.9521

r al cuadrado 0.9065

Ajustar la coordenada rectangular 0.8910

StErr de Est 3.3313

Tabla ANOVA

Valor fuentedfSSMSFp

Explicado 3 1937,7485 645,9162 58,2048 0,0000

Inexplicado 18 199,7515 11,0973

Coeficiente de regresión

Error estándar del coeficiente. valor p valor límite inferior y límite superior

Constante 32.9931 3.1386 10.5121 0.0000 26.3991 39.5870

x 1 0.0716 0.0148 4.8539 0.0001 0.0406 0.1026

x2 16 .8727 3.9956 4.2228 0.0005 8.4782 25.2671

x3 17.9042 4.8869 3.6637 0.0018 7.6372 28.1711

4.

5.

7. p>( 1) Tamaño de la muestra:

(2)

(3)

(4),

(5) F prueba:

El efecto general tiene un impacto significativo en Y, pero no se puede determinar la contribución individual a Y.