ESTADÍSTICA - Mario F. Triola - DECIMOOOOOOOOOOSSEEEEGGUUUUUNDDDDAAA EEDDICCCCIIÓÓNN
←
→
Transcripción del contenido de la página
Si su navegador no muestra la página correctamente, lea el contenido de la página a continuación
12A EDICIÓN 4 ESTADÍSTICA PROBABILITY MARIO F. TRIOLA Con la colaboración especial de Laura Lossi, Broward College Traducción Jesús Elmer Murrieta Murrieta Maestro en Investigación de Operaciones Tecnológico de Monterrey Revisión técnica Gerardo Montes Sifuentes Universidad Regiomontana Instituto de Especialización de Ejecutivos – Campus Monterrey Alberto de la Rosa Elizalde Facultad de Contaduría y Administración Facultad de Ciencias Universidad Nacional Autónoma de México Julio Sergio Acosta Rodríguez Facultad de Contaduría y Administración Universidad Nacional Autónoma de México
Datos de catalogación bibliográ!ca MARIO F. TRIOLA Estadística Decimosegunda edición Pearson Educación de México, S.A. de C.V., 2018 ISBN: 978-607-32-4378-0 Área: Matemáticas Formato: 21 × 27 cm Páginas: 784 Estadística Authorized translation from the English Language edition entitled Elementary Statistics, 13th Edition, by Mario F. Triola, pu- blished by Pearson Education, Inc., Copyright © 2018. All rights reserved. ISBN 9780134462455 Traducción autorizada de la edición en idioma inglés titulada Elementary Statistics, 13th Edition, por Mario F. Triola, publi- cada por Pearson Education, Inc., Copyright © 2018. Todos los derechos reservados. Edición en español Director general: Sergio Fonseca Q Director de innovación y servicios educativos: Alan David Palau Q Gerente de contenidos y servicios editoriales: Jorge Luis Íñiguez Q Coordinador de desarrollo de contenidos: Lilia Moreno Q Editora especialista en contenidos de aprendizaje: Rosa Díaz Sandoval Q Coordinador de arte y diseño: Mónica Galván Q Editor de desarrollo: Bernardino Gutiérrez Hernández Q Traductor: Jesús Elmer Murrieta Murrieta Q Corrector de estilo: César Romero Q Gestor de arte y diseño: José Hernández Garduño Q Lector de pruebas: Felipe Martínez Q Composición y diagramación: Servicios Editoriales 6Ns. Esta edición en español es la única autorizada. Contacto: soporte@pearson.com Decimosegunda edición, 2018 ISBN LIBRO IMPRESO: 978-607-32-4378-0 D.R. © 2018 por Pearson Educación de México, S.A. de C.V. ISBN LIBRO E-BOOK: 978-607-32-4377-3 Avenida Antonio Dovalí Jaime núm. 70 Torre B, Piso 6, Colonia Zedec, Ed. Plaza Santa Fe Delegación Álvaro Obregón, México, Ciudad de México, C. P. 01210 Impreso en México. Printed in Mexico. 1 2 3 4 5 6 7 8 9 0 – 21 20 19 18 www.pearsonenespañol.com Reservados todos los derechos. Ni la totalidad ni parte de esta publicación pueden repro- ducirse, registrarse o transmitirse, por un sistema de recuperación de información, en ninguna forma ni por ningún medio, sea electrónico, mecánico, fotoquímico, magnético o electroóptico, fotocopia, grabación o cualquier otro, sin permiso previo por escrito del editor. Pearson Hispanoamérica Argentina Q Belice Q Bolivia Q Chile Q Colombia Q Costa Rica Q Cuba Q República Dominicana Q Ecuador Q El Salvador Q Guatemala Q Honduras Q México Q Nicaragua Q Panamá Q Paraguay Q Perú Q Uruguay Q Venezuela
3-1 Medidas de tendencia central 3-2 Medidas de variación 3-3 Medidas de posición relativa y gráficas de caja 3 DESCRIPCIÓN, EXPLORACIÓN Y COMPARACIÓN DE DATOS PROBLEMA DEL ¿Qué compañía tiene la mejor velocidad (de transferencia) CAPÍTULO de datos para teléfonos inteligentes en los aeropuertos? El conjunto de datos 32, “Velocidades de datos en aeropuertos” de puntos con los datos no modificados serían un poco compli- del apéndice B, lista las velocidades (de transferencia) de datos cadas y no tan útiles, pero si redondeamos todos los conjuntos medidos por RootMetrics en 50 aeropuertos de Estados Unidos de datos originales, obtendremos la gráfica de puntos mostrada considerando las cuatro principales compañías proveedoras del en la figura 3-1. (Una observación de la escala horizontal en la servicio en ese país (Verizon, Sprint, AT&T y T-Mobile). Todas figura 3-1 revela que las velocidades de datos originales han sido las velocidades se dan en unidades de megabits (o 1 millón de redondeadas al entero par más cercano por el software utilizado bits) por segundo, expresados como Mbps. Debido a que las para crear las gráficas de puntos). Si se utilizan las mismas cuatro velocidades de datos originales listadas en el conjunto de datos escalas horizontales y se apilan las cuatro gráficas de puntos, las 32 incluyen números decimales como 38.5 Mbps, las gráficas comparaciones resultan mucho más sencillas. 80
Objetivos del capítulo 81 El análisis de la figura 3-1 sugiere que Verizon tiene el mejor des- Verizon empeño global, con velocidades de datos que tienden a ser más altas que las de las otras tres compañías. Pero en vez de confiar únicamente en interpretaciones subjetivas de una gráfica como Sprint la de la figura 3-1, este capítulo introduce medidas que son esen- ciales para cualquier estudio de estadística: la media, la mediana, AT&T la desviación estándar y la varianza, que se encuentran entre los T-Mobile datos estadísticos más importantes en el estudio de esta materia. 0 10 20 30 40 50 60 70 80 Éstos se usarán para describir, explorar y comparar las velocida- Velocidad de transferencia de datos (megabits por segundo) des de datos medidos de Verizon, Sprint, AT&T y T-Mobile como FIGURA 3-1 Gráfica de puntos de las velocidades de da- se listan en el conjunto de datos 32. tos para Smartphone OBJETIVOS DEL CAPÍTULO Pensamiento crítico e interpretación: más allá de las fórmulas y la aritmética En este curso moderno de estadística no es tan importante memorizar fórmulas o efectuar cálculos manuales de aritmética. Es posible obtener resultados con una calculadora o software para que podamos concentrarnos en el sentido práctico de los resultados a través del pensamiento crítico. Aunque el presente capítulo incluye pasos detallados para proce- dimientos importantes, no siempre es necesario dominarlos. No obstante, a menudo es útil llevar a cabo unos cuantos cálculos manuales antes de usar la computadora, con el fin de incentivar la comprensión. Los métodos y herramientas presentados en este capítulo se llaman con frecuencia métodos de estadística descriptiva, puesto que resumen o describen las características relevantes de los datos. En los capítulos subsecuentes usamos la estadística inferencial para hacer inferencias , o generalizaciones, sobre las poblaciones. Los siguientes son los objetivos del capítulo: 3-1 Medidas de tendencia central • Desarrollar la capacidad de medir el centro de los datos mediante la determinación de la media, la mediana, la moda y la mitad del rango. • Determinar si un valor atípico tiene un efecto sustancial sobre la media y la mediana. 3-2 Medidas de variación • Desarrollar la capacidad de medir la variación en un conjunto de datos muestrales me- diante la determinación de los valores del rango, la varianza y la desviación estándar. • Desarrollar la capacidad de interpretar los valores de la desviación estándar aplicando la regla práctica del rango para determinar si un valor particular es significativamente bajo o significativamente alto. 3-3 Medidas de posición relativa y gráficas de caja • Desarrollar la capacidad de calcular una puntuación z y utilizar el resultado para determi- nar si un valor dado x es significativamente bajo o significativamente alto. • Identificar valores de los percentiles y cuartiles de un conjunto de datos. • Desarrollar la capacidad de construir una gráfica de caja a partir de un conjunto de datos.
82 CAPÍTULO 3 Descripción, exploración y comparación de datos 3-1 Medidas de tendencia central Concepto clave El enfoque de esta sección está en obtener un valor que mida el centro de un conjunto de datos. En particular, se presentan medidas de tendencia central, incluyendo la media y la mediana. El objetivo aquí no es sólo encontrar el valor de cada medida de tenden- cia central, sino también interpretar esos valores. La parte 1 de la presente sección incluye conceptos básicos que deben ser entendidos antes de considerar la parte 2. PARTE 1 Conceptos básicos de las medidas de tendencia central En la parte 1 de esta sección introducimos la media, la mediana, la moda y la mitad del rango como diferentes medidas de tendencia central. Tales medidas se utilizan ampliamente para proporcionar valores representativos que “resumen” los conjuntos de datos. DEFINICIÓN En cifras Una medida de tendencia central es un valor en medio o en el centro de un conjunto $3.19: Monto medio dejado por de datos. el ratón de los dientes, con base en una encuesta realizada por Visa. El 10% de los niños con Existen diferentes métodos para medir el centro, por lo que tenemos distintas definicio- menos suerte no obtiene nada. nes para ellos. Comenzamos con la media. Media Por lo general, la media (o media aritmética) es la más importante de las mediciones numéri- cas usadas para describir datos, y es lo que la mayoría de las personas llama promedio. DEFINICIÓN La media (o media aritmética) de un conjunto de datos es la medida de tendencia cen- tral que se encuentra al sumar todos los valores de los datos y dividir el total por el nú- mero de datos. Propiedades importantes de la media ■ Las medias muestrales de una misma población tienden a variar menos que otras medidas de tendencia central. ■ La media de un conjunto de datos utiliza todos los valores de los datos. ■ Una desventaja de la media es que un solo valor extremo (atípico) puede cambiar el valor de la media en forma sustancial. (Con base en la siguiente definición, puede decirse que la media no es resistente). DEFINICIÓN Un dato estadístico es resistente si la presencia de valores extremos (atípicos) no ocasiona que éste cambie mucho.
3-1 Medidas de tendencia central 83 Cálculo y notación de la media La definición de la media puede expresarse como en la fórmula 3-1, donde la letra ra Paradoja del tamaño de griega Σ (sigma mayúscula) indica que los valores de los datos deben sumarse, por lo que ue la clase Σx representa la suma de todos los valores de los datos. El símbolo n expresa el tamaño ño de la muestra, que es el número de valores de datos. Existen al menos dos formas de FÓRMULA 3-1 obtener el tamaño de Σx d suma de todos los valores de datos Media 5 una clase n d número de valores de datos promedio, y Si los datos son una muestra de una población, la media se expresa con x (que se pronuncia ambas pueden dar resultados “x barra”); si los datos son la población entera, la media se expresa mediante m (letra griega muy diferentes. En una mu minúscula). universidad, si tomamos la cantidad de estudiantes de 737 clases, obtenemos una media de 40 estudiantes. Sin NOTACIÓN Sugerencia: Los estadísticos muestrales se representan usualmente mediante embargo, si reunimos una lista caracteres latinos, como x, y los parámetros de población por medio de letras griegas, como m. del tamaño de las clases para Σ expresa la suma de un conjunto de valores de datos. cada estudiante y utilizamos esta x es la variable que generalmente se usa para representar los valores de datos lista, obtendríamos una media individuales. de 147. Esta gran discrepancia se debe al hecho de que existen n representa el número de valores de datos en una muestra. muchos estudiantes en clases N representa el número de valores de datos en una población. grandes, en tanto que hay pocos Σx estudiantes en clases pequeñas. x5 es la media de un conjunto de valores muestrales. n Sin cambiar el número de clases Σx o de profesores, podríamos m5 es la media de todos los valores en una población. reducir el tamaño de clase N promedio para los estudiantes haciendo que todas las clases tengan un tamaño similar. Esto EJEMPLO 1 Media también aumentaría la asistencia, El conjunto de datos 32 “Velocidades de datos en aeropuertos” del apéndice B incluye me- que es más alta en las clases con menor número de alumnos. didas de las velocidades de datos para teléfonos inteligentes en cuatro compañías. Encuen- tre la media de los cinco primeros datos de velocidad para Verizon: 38.5, 55.6, 22.4, 14.1 y 23.1 (todos en megabits por segundo, o Mbps). SOLUCIÓN La media se calcula mediante la fórmula 3-1. Primero sume los valores de datos, luego divida por el número de valores: Σx 38.5 + 55.6 + 22.4 + 14.1 + 23.1 153.7 x = = = n 5 5 = 30.74 Mbps La media de las cinco primeras velocidades de datos para Verizon es de 30.74 Mbps. SU TURNO Encuentre la media en el ejercicio 5 “Números de jugadores de fútbol americano”. PRECAUCIÓN Nunca utilice el término promedio cuando se refiera a una medida de tendencia central. Esa palabra se utiliza a menudo para la media, pero en ocasiones se usa para otras medidas del centro. Los estadísticos no emplean el término promedio y en el resto de este libro no se usará para hacer referencia a una medida de tendencia central específica. El término promedio tampoco es utilizado por la comunidad estadística o las revistas profesionales.
84 CAPÍTULO 3 Descripción, exploración y comparación de datos Mediana M Lo que la mediana no es La mediana se puede considerar de manera general como un “valor medio” en el sentido de que aproximadamente la mitad de los valores en un conjunto de datos son menores y la mitad qu El biólogo son mayores que la mediana. La siguiente definición es más precisa. so de Harvard, Stephen Jay Gould escribió: “La mediana DEFINICIÓN no es el La mediana de un conjunto de datos es la medida de tendencia central que indica el valor mensaje”. Así intermedio, cuando los datos originales se presentan en orden de magnitud creciente describe lo que aprendió cuando (o decreciente). se enteró que tenía mesotelioma abdominal, una forma de cáncer. Fue a la biblioteca para aprender más y se sorprendió al descubrir Propiedades importantes de la mediana que el mesotelioma era incurable ■ La mediana no cambia por mucho cuando se incluyen sólo unos pocos valores extre- (la mediana de supervivencia es mos, por lo que la mediana es una medida de tendencia central resistente. de sólo ocho meses después de ser descubierto). Gould escribió ■ La mediana no utiliza directamente todos los valores de datos. (Por ejemplo, si el valor lo siguiente: “Sospecho que la mayor se cambia por uno mucho más grande, la mediana no cambia). mayor parte de las personas, sin formación en estadística, Cálculo y notación de la mediana leería esta afirmación como ‘probablemente estaré muerto La mediana de una muestra se denomina a veces x (que se pronuncia “x tilde”) o M en ocho meses’; conclusión que o Med; no existe una notación generalmente aceptada y no hay un símbolo especial para debe evitarse, ya que no es así, y la mediana de una población. Para encontrar la mediana, primero ordene los valores (pón- más considerando que la actitud galos en orden) y luego siga uno de los siguientes dos procedimientos: (en la lucha contra el cáncer) 1. Si el número de valores de datos es impar, la mediana es el número ubicado en el in- importa tanto”. Gould procedió termedio exacto de la lista ordenada. a interpretar cuidadosamente el valor de la mediana. Sabía 2. Si el número de valores de datos es par, la mediana se obtiene calculando la media de que su oportunidad de vivir más los dos números intermedios de la lista ordenada. tiempo que la mediana era buena porque era joven, su cáncer fue diagnosticado de manera temprana y tendría el mejor EJEMPLO 2 Mediana con un número impar de valores de datos tratamiento médico. También Encuentre la mediana de las cinco primeras velocidades de datos para Verizon: 38.5, 55.6, razonó que algunas personas 22.4, 14.1 y 23.1 (todas en megabits por segundo, o Mbps). podrían vivir mucho más de ocho meses, y no vio ninguna SOLUCIÓN razón por la que no pudiera Primero ordene en forma ascendente los valores de datos, como se muestra a continuación: estar en ese grupo. Armado con esta interpretación reflexiva de 14.1 22.4 23.1 38.5 55.6 la mediana y una fuerte actitud positiva, Gould vivió 20 años Como hay 5 valores de datos, tal cantidad es un número impar (5), por lo que la mediana después de su diagnóstico. es el número intermedio exacto de la lista ordenada, que es 23.1 Mbps. Por lo tanto, la me- Murió de otro cáncer no diana es 23.10 Mbps. Observe que la mediana de 23.10 Mbps es diferente de la media de relacionado con el mesotelioma. 30.74 Mbps que se encontró en el ejemplo 1. Note también que el resultado de 23.10 Mbps sigue la regla de redondeo que se proporciona más adelante en esta sección. SU TURNO Encuentre la mediana en el ejercicio 5 “Números de jugadores de fútbol americano”. EJEMPLO 3 Mediana con un número par de valores de datos Repita el ejemplo 2 después de incluir la sexta velocidad de datos de 24.5 Mbps. Es decir, encuentre la mediana de las siguientes velocidades de datos: 38.5, 55.6, 22.4, 14.1, 23.1, 24.5 (todo en Mbps).
3-1 Medidas de tendencia central 85 SOLUCIÓN Primero ordene los valores de manera ascendente: 14.1 22.4 23.1 24.5 38.5 55.6 Debido a que el número de valores de datos es par (6), la mediana se obtiene calculando la media de los dos números intermedios, que son 23.1 y 24.5. 23.1 1 24.5 47.6 Mediana 5 5 5 23.80 Mbps 2 2 La mediana es 23.80 Mbps. SU TURNO Encuentre la mediana en el ejercicio 7 “Valor neto de celebridades”. Moda La moda no se utiliza mucho con datos cuantitativos, pero es la única medida de tendencia ia En cifras central que puede usarse con datos cualitativos (que consisten solamente en nombres, etique- e- Mohammed: El nombre más tas o categorías). común en el mundo. DEFINICIÓN La moda de un conjunto de datos es el (los) valor(es) que ocurre(n) con mayor frecuencia. Propiedades importantes de la moda ■ La moda se puede encontrar con datos cualitativos. ■ Un conjunto de datos puede tener una moda, o múltiples modas, o no tener ninguna. Determinación de la moda: Un conjunto de datos puede tener una moda, más de una moda, o ninguna moda. ■ Cuando dos valores de datos ocurren con la misma mayor frecuencia, cada uno es una moda y se dice que el conjunto de datos es bimodal. ■ Cuando más de dos valores de datos ocurren con la misma mayor frecuencia, cada uno es una moda y se dice que el conjunto de datos es multimodal. ■ Cuando ningún valor de datos se repite, se dice que no hay moda. ■ Cuando usted pide helado con su pastel, se dice que está “a la moda”. EJEMPLO 4 Moda Encuentre la moda de las siguientes velocidades de datos para Sprint (en Mbps): 0.2 0.3 0.3 0.3 0.6 0.6 1.2 SOLUCIÓN La moda es de 0.3 Mbps, porque es la velocidad de datos que ocurre con más frecuencia (tres veces). SU TURNO Encuentre la moda en el ejercicio 7 “Valor neto de celebridades”. En el ejemplo 4, la moda es un valor único. A continuación se presentan otras circun- stancias posibles: Dos modas: Las velocidades de datos (Mbps) de 0.3, 0.3, 0.6, 4.0 y 4.0 tienen dos modas: 0.3 Mbps y 4.0 Mbps. Sin moda: Las velocidades de datos (Mbps) de 0.3, 1.1, 2.4, 4.0 y 5.0 no tienen moda porque ningún valor se repite.
86 CAPÍTULO 3 Descripción, exploración y comparación de datos Mitad del rango Otra medida de tendencia central es la mitad del rango. DEFINICIÓN La mitad del rango de un conjunto de datos es la medida de tendencia central que consiste en el valor que está a la mitad entre los valores máximo y mínimo del conjunto de datos original. Se encuentra al sumar el valor máximo y el valor mínimo de los datos y después dividir esa suma entre 2, como se muestra en la siguiente fórmula: valor máximo de datos 1 valor mínimo de datos Mitad del rango 5 2 Propiedades importantes de la mitad del rango ■ Debido a que la mitad del rango utiliza sólo los valores máximo y mínimo, es muy sensible a esos extremos y, por lo tanto, no es resistente. ■ En la práctica, la mitad del rango se utiliza con poca frecuencia, pero tiene tres caracte- rísticas redentoras: 1. Es muy fácil de calcular. 2. Ayuda a reforzar la muy importante idea de que hay varias maneras de definir el centro de un conjunto de datos. 3. En ocasiones, su valor se utiliza incorrectamente para la mediana, así que la confu- sión puede reducirse al definir claramente la mitad del rango junto con la mediana. EJEMPLO 5 Mitad del rango Encuentre la mitad del rango de las siguientes velocidades de datos para Verizon del ejem- plo 1: 38.5, 55.6, 22.4, 14.1 y 23.l (todas en Mbps) SOLUCIÓN La mitad del rango se encuentra de la siguiente manera: valor máximo de datos 1 valor mínimo de datos Mitad del rango 5 2 55.6 1 14.1 5 5 34.85 Mbps 2 La mitad del rango es 34.85 Mbps. SU TURNO Encuentre la mitad del rango en el ejercicio 5 “Números de jugadores de fútbol americano”. Redondeo de medidas de tendencia central A menudo, cuando se calculan medidas de tendencia central, es necesario redondear el resul- tado. Se utiliza la siguiente regla. Reglas de redondeo para medidas de tendencia central • Para la media, la mediana y la mitad del rango, incluya un decimal más que los presentes en el conjunto original de valores. • Para la moda, deje el valor sin redondear (porque los valores de la moda son iguales que algunos de los valores de los datos originales).
3-1 Medidas de tendencia central 87 Cuando aplique las reglas de redondeo, redondee sólo la respuesta final, no los valoreses intermedios producidos durante los cálculos. Por ejemplo, la media de 2, 3 y 5 es 3.333333..., .., Un error de redondeo que se redondea a 3.3; esto es, con un decimal más que los valores originales de 2, 3 y 5. cambia un récord Otro ejemplo es: la media de 80.4 y 80.6 es 80.50 (un decimal más que los usados para los os mundial valores originales). Debido a que la moda es uno o más de los valores originales, no la redon- n- deamos; simplemente usamos los mismos valores originales que resultaron ser modas. Los errores de redondeo a menudo pueden Pensamiento crítico tener resultados desastrosos. Siempre es posible calcular las medidas de tendencia central a partir de una muestra de nú- Justin Gatlin meros, pero es necesario considerar si hacerlo tiene sentido. En la sección 1-2 se estableció estaba eufórico cuando que no tiene sentido hacer cálculos numéricos con datos al nivel nominal de medición, estableció el récord mundial ya que estos datos constan sólo de nombres, etiquetas o categorías, por lo que los datos es- como la persona en correr los tadísticos como la media y la mediana carecen de significado. También se debe pensar en el 100 metros en el menor tiempo método de muestreo utilizado para recopilar los datos. Si el método de muestreo no es sólido, (9.76 segundos). Sin embargo, los datos estadísticos obtenidos pueden ser muy engañosos. su tiempo récord duró sólo cinco días, cuando se corrigió a 9.77 segundos y empató el récord mundial en lugar de EJEMPLO 6 Pensamiento crítico y medidas de tendencia central romperlo. Su tiempo real fue Considere cada una de las siguientes situaciones ilustrativas en las que la media y la me- de 9.766 segundos, y debería diana no son estadísticos significativos. haberse redondeado a 9.77 segundos, pero la persona que a. Códigos postales del Gateway Arch en San Luis, la Casa Blanca, la División de la tomó el tiempo no sabía que Fuerza Aérea del Pentágono, el Edificio Empire State y la Estatua de la Libertad: tenía que presionar un botón 63102, 20500, 20330, 10118, 10004. (Los códigos postales no miden ni cuentan para obtener el redondeo. El nada. Los números son sólo etiquetas para ubicaciones geográficas). representante de Gatlin dijo que el atleta estaba muy perturbado b. Clasificaciones de universidades nacionales seleccionadas: Harvard, Yale, Duke, y que el incidente era una Dartmouth y Brown (por US News & World Report): 2, 3, 7, 10, 14. (Las clasifica- “gran vergüenza para la IAAF ciones reflejan una ordenación, pero no miden ni cuentan nada). (International Association of c. Números en las camisetas de la defensiva titular de los Halcones marinos de Seattle Athletics Federations) y para nuestro deporte”. cuando ganaron el Súper Tazón XLVIII: 31, 28, 41, 56, 25, 54, 69, 50, 91, 72, 29. (Los números en las camisetas de fútbol americano no miden ni cuentan nada, son sólo sustitutos de los nombres). d. Primeros cinco ingresos de directores de empresa (en millones de dólares): 131.2, 66.7, 64.4, 53.3, 51.5. (Estas listas de “los primeros 5” o “los primeros 10” incluyen datos que no son en absoluto representativos de toda la población). e. Las 50 edades medias calculadas a partir de las medias en cada uno de los 50 esta- dos. (Si se calcula la media de esos 50 valores, el resultado no es la edad media de las personas en todo el territorio de Estados Unidos y se debe tener en cuenta los tamaños de la población de los 50 estados, como se describe en la introducción de la media ponderada en la parte 2 de esta sección). SU TURNO Para el ejercicio 5 “Números de jugadores de fútbol americano”, determine por qué la media y la mediana no son significativas. Con la idea de describir, explorar y comparar datos, proporcionamos la tabla 3-1 en la página 88, que resume las diferentes medidas de tendencia central para las velocidades de datos para teléfonos inteligentes que se mencionan en el problema del capítulo. Los datos se listan en el conjunto de datos 32 “Velocidades de datos en aeropuertos” del apéndice B. La figura 3-1 de la página 81 sugiere que Verizon tiene las mayores velocidades y la compara- ción de medias y medianas en la tabla 3-1 también lo indica. En los siguientes capítulos se describen otras herramientas que pueden utilizarse para una comparación efectiva.
88 CAPÍTULO 3 Descripción, exploración y comparación de datos TABLA 3-1 Comparación de las velocidades de datos para teléfonos inteligentes (Mbps) en los aeropuertos Verizon Sprint AT&T T-Mobile Media 17.60 3.71 10.70 10.99 Mediana 13.90 1.60 8.65 9.70 Moda 4.5, 11.1 0.3 2.7 3.2, 4.4, 5.1, 13.3, 15.0, 16.7, 27.3 Mitad del rango 39.30 15.30 19.80 14.00 PARTE 2 Más allá de lo básico en las medidas de tendencia central Cálculo de la media a partir de una distribución de frecuencias La fórmula 3-2 es el mismo cálculo para la media que se presentó en la parte 1, pero incor- pora el siguiente método: cuando trabajamos con datos resumidos en una distribución de fre- cuencias, hacemos posibles los cálculos asumiendo que todos los valores muestrales en cada clase son iguales al punto medio de dicha clase. La fórmula 3-2 no es realmente un concepto nuevo; es simplemente una variación de la fórmula 3-1 (media). FÓRMULA 3-2 MEDIA A PARTIR DE UNA DISTRIBUCION DE FRECUENCIAS Primero multiplique cada frecuencia y el punto medio de la clase; luego sume los productos. T Σ1 f # x2 x = (El resultado es una aproximación) Σf c Suma de frecuencias (igual a n) El ejemplo 7 ilustra el procedimiento para encontrar la media a partir de una distribución de frecuencias. EJEMPLO 7 Cálculo de la media a partir de una distribución de frecuencias Las dos primeras columnas de la tabla 3-2 mostradas aquí son las mismas de la distribu- ción de frecuencias de la tabla 2-2 del capítulo 2. Utilice la distribución de frecuencias en las dos primeras columnas de la tabla 3-2 para encontrar la media. TABLA 3-2 Tiempos de servicio para el almuerzo en McDonald’s Tiempo (segundos) Frecuencia f Punto medio de la clase x f !x 75 -124 11 99.5 1094.5 125 - 174 24 149.5 3588.0 175 - 224 10 199.5 1995.0 225 - 274 3 249.5 748.5 275 - 324 2 299.5 599.0 Totales: Σƒ 5 50 Σ(ƒ x) 5 8025.0
3-1 Medidas de tendencia central 89 SOLUCIÓN Recuerde que al trabajar con datos resumidos en una distribución de frecuencias, se hacen posibles los cálculos asumiendo que todos los valores muestrales en cada clase son iguales al punto medio de dicha clase. Por ejemplo, considere el intervalo de la primera clase de 75 a 124 con una frecuencia de 11. Asumimos que cada uno de los 11 tiempos de servicio es de 99.5 segundos (el punto medio de la clase). Con el tiempo de servicio de 99.5 se- gundos repetido 11 veces, tenemos un total de 99.5 ~ 11 5 1094.5, como se muestra en la última columna de la tabla 3-2. Después sumamos los resultados para encontrar la sumato- ria de todos los valores muestrales. La fila inferior de la tabla 3-2 muestra los dos componentes que se requieren para calcular la media (como en la fórmula 3-2) Σf 5 50 y Σ (f ~ x) 5 8025.0. Calculamos la media usando la fórmula 3-2 como sigue: Σ1 f # x2 8025.0 x = = = 160.5 segundos Σf 50 El resultado de x 5 160.5 segundos es una aproximación porque se basa en el uso de los valores de los puntos medios de las clases en lugar de la lista original de tiempos de ser- vicio. La media de 160.2 segundos encontrada mediante el uso de todos los tiempos de servicio originales es un resultado más preciso. SU TURNO Resuelva el ejercicio 29 “Edades de las mejores actrices”. Cálculo de una media ponderada Cuando a los diferentes valores de datos x se les asignan pesos w distintos, podemos calcular la media ponderada, que está dada por la fórmula 3-3. FÓRMULA 3-3 Σ(w # x) Media ponderada: x = Σw La fórmula 3-3 implica primero multiplicar cada peso w por el valor correspondiente x, luego sumar los productos, y finalmente dividir el total por la suma de los pesos, Σw. EJEMPLO 8 Cálculo del promedio de calificaciones En su primer semestre de la universidad, una alumna del autor tomó cinco cursos. Sus cali- ficaciones finales, junto con el número de créditos para cada curso, fueron A (3 créditos), A (4 créditos), B (3 créditos), C (3 créditos) y F (1 crédito). El sistema de clasificación asigna puntos de calidad a las calificaciones con letras de la siguiente manera: A 5 4; B 5 3; C 5 2; D 5 1; F 5 0. Calcule su promedio de calificaciones. SOLUCIÓN Use los números de créditos como pesos: w 5 3, 4, 3, 3, 1. Reemplace las calificaciones con letras de A, A, B, C y F con los puntos de calidad correspondientes: x 5 4, 4, 3, 2, 0. Ahora usamos la fórmula 3-3 como se muestra a continuación. El resultado es un promedio de 3.07 en el primer semestre. (Al utilizar la regla de redondeo precedente, el resultado debe redon- dearse a 3.1, pero es común que los promedios de calificaciones se redondeen a dos decimales). Σ1w # x2 x = Σw 13 * 42 + 14 * 42 + 13 * 32 + 13 * 22 + 11 * 02 = 3 + 4 + 3 + 3 + 1 43 = = 3.07 14 SU TURNO Resuelva el ejercicio 33 “Media ponderada”.
90 CAPÍTULO 3 Descripción, exploración y comparación de datos CENTRO DE TECNOLOGÍA Ejemplos de pantallas de estadística descriptiva Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola Las siguientes pantallas se basan en las velocidades de datos de Verizon dentro del conjunto de datos 32 “Velocidades de datos en aeropuertos”. Statdisk TI-83 , 4 Plus Minitab StatCrunch Herramienta de análisis de datos de Excel Suplemento XLSTAT Excel
3-1 Medidas de tendencia central 91 CENTRO DE TECNOLOGÍA Estadística descriptiva Acceda a los complementos tecnológicos, videos y conjuntos de datos de Elementary Statistic, 13E en www.pearsonenespañol.com/triola Statdisk Minitab StatCrunch 1. Haga clic en Data en el 1. Haga clic en Stat en el menú superior. 1. Haga clic en Stat en el menú superior. menú superior. 2. Seleccione Basic Statistics en el menú 2. Seleccione Summary Stats en el 2. Seleccione Explore Data- desplegable y después elija Display menú desplegable y después elija Descriptive Statistics en Descriptive Statistics. Columns. el menú desplegable. 3. Haga doble clic en la columna de datos 3. Seleccione la columna de datos de- 3. Seleccione la columna de deseada para que aparezca en la ven- seada. datos deseada. tana Variables. 4. Haga clic en Compute! para ver los 4. Haga clic en Evaluate 4. Haga clic en OK para ver los estadísticos estadísticos descriptivos. para ver los estadísticos descriptivos. SUGERENCIA: Personalice los estadísticos descriptivos. descriptivos al seleccionar los elementos SUGERENCIA: Haga clic en el botón Statistics arriba de OK para seleccionar los estadísticos in- bajo Statistics. dividuales que desea mostrar. Calculadora T1-83/84 Plus Excel 1. Presione e STAT , luego seleccione Complemento XLSTAT CALC en el menú superior. 1. Haga clic en la ficha XLSTAT de la barra de opciones y después haga clic en 2. Seleccione 1-Var Stats y pulse Describing Data. ENTER . 2. Seleccione Descriptive Statistics en el menú desplegable. 3. Introduzca el nombre de la lista que 3. Marque la casilla Quantitative Data e introduzca el intervalo de datos de- incluye los datos deseados (por seado. Si la primera fila de datos contiene una etiqueta, también marque la ejemplo, L1). casilla Sample labels. 4. Seleccione Calculate y pulse ENTER 4. Haga clic en OK para ver los estadísticos descriptivos. para ver los estadísticos descripti- vos. Complemento Excel Data Analysis 1. Haga clic en la ficha Data de la barra de opciones y después seleccione Data SUGERENCIA: Presione para ver los Analysis en el menú superior. estadísticos adicionales que no se desple- garon en la pantalla inicial. 2. Seleccione Descriptive Statistics bajo Analysis Tools. 3. Introduzca el rango de datos deseado para el Inpute Range. Si la primera fila de datos contiene una etiqueta, también marque la casilla Labels in First Row. 4. Marque la etiqueta Summary Statistics y haga clic en OK para ver los es- tadísticos descriptivos. 3-1 Habilidades y conceptos básicos Conocimiento estadístico y pensamiento crítico 1. Promedio El extinto sitio web IncomeTaxlist.com indicaba que el ingreso anual “promedio” en Florida era de $35,031. ¿Cuál es el papel del término promedio en estadística? ¿Debería usarse otro término en lugar de promedio? 2. ¿Qué hay de erróneo? USA Today publicó una lista consistente en el impuesto estatal por cada galón de gasolina. Si se suman las 50 cantidades de impuestos estatales y luego se divide la suma por 50, se obtiene 27.3 centavos. ¿Es el valor de 27.3 centavos el importe medio del impuesto estatal sobre ventas pagado por todos los conductores estadounidenses? ¿Por qué sí o por qué no? 3. Medidas de tendencia central ¿En qué sentido la media, la mediana, la moda y la mitad del rango son medidas del “centro”? 4. Medidas resistentes Las siguientes son cuatro de las velocidades de datos Verizon (Mbps) de la figura 3-1: 13.5, 10.2, 21.1, 15.1. Encuentre la media y la mediana de estos cuatro valores. A continua- ción, determine la media y la mediana después de incluir un quinto valor de 142, que es un valor atípico. (Una de las velocidades de datos de Verizon es 14.2 Mbps, pero 142 se utiliza aquí como un error re- sultante de una entrada con un punto decimal faltante). Compare los dos conjuntos de resultados. ¿Qué
92 CAPÍTULO 3 Descripción, exploración y comparación de datos tanto se vio afectada la media por la inclusión del valor atípico? ¿Cuánto fue afectada la mediana por la inclusión del valor atípico? Pensamiento crítico. En los ejercicios 5 a 20, tenga cuidado con las pequeñas trampas. Cada uno de estos ejercicios implica alguna característica capciosa. Encuentre la (a) media (b) mediana, (c) moda, (d) mitad del rango, y luego responda la pregunta dada. 5. Números de jugadores de fútbol americano A continuación se listan los números de camiseta de 11 jugadores seleccionados al azar del equipo de los Halcones marinos de Seattle, cuando ganaron el Súper Tazón XLVIII. ¿Qué nos dicen los resultados? 89 91 55 7 20 99 25 81 19 82 60 6. Pesos de jugadores de fútbol americano A continuación se listan los pesos en libras de 11 jugadores seleccionados al azar del equipo de los Halcones marinos de Seattle, cuando ganaron el Sú- per Tazón XLVIII (los mismos jugadores del ejercicio anterior). ¿Es probable que los resultados sean representativos de todos los jugadores de la NFL? 189 254 235 225 190 305 195 202 190 252 305 7. Valor neto de celebridades A continuación se listan los mayores valores netos (en millones de dólares) de las celebridades. Las celebridades son Tom Cruise, Will Smith, Robert De Niro, Drew Ca- rey, George Clooney, John Travolta, Samuel L. Jackson, Larry King, Demi Moore y Bruce Willis. ¿Qué nos dicen los resultados sobre la población de todas las celebridades? Sobre la base de la naturaleza de las cantidades, ¿qué se puede inferir acerca de su precisión? 250 200 185 165 160 160 150 150 150 150 8. Lo que pasa en Las Vegas... A continuación se listan los precios en dólares por una noche en diferentes hoteles ubicados en Las Vegas Boulevard (the “Strip”). Si usted decide hospedarse en uno de estos hoteles, ¿qué estadístico es más relevante, además de las medidas de tendencia central? Aparte del precio, identifique otro factor importante que afectaría su elección. 212 77 121 104 153 264 195 244 9. Huracanes A continuación se listan las cantidades de huracanes que se produjeron en el Atlántico cada año. Los datos se dan en orden anual, a partir del año 2000. ¿Qué característica importante de los datos no es revelada por ninguna de las medidas de tendencia central? 8 9 8 7 9 15 5 6 8 4 12 7 8 2 10. Chícharos en una vaina Los biólogos han realizado experimentos para determinar si una falta de bióxido de carbono en el suelo afecta a los fenotipos de los chícharos. A continuación se listan los códigos del fenotipo, donde 1 5 amarillo liso, 2 5 verde liso, 3 5 amarillo corrugado y 4 5 verde corrugado. ¿Se pueden obtener las medidas de tendencia central para estos valores? ¿Los resultados tienen sentido? 2 1 1 1 1 1 1 4 1 2 2 1 2 3 3 2 3 1 3 1 3 1 3 2 2 11. Precios de televisores A continuación se listan los precios de venta (en dólares) de televisores de 60 pulgadas o más, los cuales fueron calificados como “las mejores compras” por la revista Consumer Reports. ¿Los datos estadísticos resultantes son representativos de la población de todos los televisores de 60 pulgadas o más? Si usted decide comprar uno de estos televisores, ¿qué dato estadístico es más relevante, además de las medidas de tendencia central? 1800 1500 1200 1500 1400 1600 1500 950 1600 1150 1500 1750 12. Radiación del teléfono celular A continuación se listan las tasas de absorción de radiación medidas (en W/kg) correspondientes a los siguientes teléfonos celulares: iPhone 5S, BlackBerry Z30, Sanyo Vero, Optimus V, Droid Razr, Nokia N97, Samsung Vibrant, Sony Z750a, Kyocera Kona, LG G2 y Virgin Mobile Supreme. Los datos provienen de la Comisión Federal de Comunicaciones (FCC, por sus siglas en inglés). Los medios de comunicación a menudo informan sobre los peligros de la radiación de los teléfonos celulares como una causa de cáncer. La FCC tiene un estándar de que la tasa de absor- ción de un teléfono celular debe ser de 1.6 W/kg o menos. Si usted está planeando comprar un teléfono celular, ¿es alguna de las medidas de tendencia central el estadístico más importante? ¿Hay otro dato estadístico que sea más relevante? Si es así, ¿cuál? 1.18 1.41 1.49 1.04 1.45 0.74 0.89 1.42 1.45 0.51 1.38
3-1 Medidas de tendencia central 93 13. Cafeína en bebidas A continuación se indican las cantidades medidas de cafeína (mg por 12 onzas de bebida) obtenidas en una lata de cada una de 20 marcas (7-UP, A & W Root Beer, Cherry Coke, ...). ¿Son los estadísticos representativos de la población de todas las latas de las mismas 20 mar- cas consumidas por los estadounidenses? 0 0 34 34 34 45 41 51 55 36 47 41 0 0 53 54 38 0 41 47 14. Muertes de bomberos A continuación se listan las cantidades de heroicos bomberos que perdie- ron sus vidas en Estados Unidos anualmente mientras combatían incendios forestales. Las cantidades están ordenadas por año, comenzando en 2000. ¿Qué característica importante de los datos no es reve- lada por ninguna de las medidas de tendencia central? 20 18 23 30 20 12 24 9 25 15 8 11 15 34 15. Longitud de los pies A continuación se listan las longitudes en pulgadas de los pies de mujeres del ejército seleccionadas al azar, medidos en el sondeo antropométrico de 1988 (ANSUR, abreviatura en inglés). Estos datos estadísticos, ¿son representativos de la población actual de todas las mujeres del ejército? 10.4 9.3 9.1 9.3 10.0 9.4 8.6 9.8 9.9 9.1 9.1 16. Universidades más caras A continuación se listan los costos anuales (en dólares) de matrícula y colegiaturas en las 10 universidades más caras de Estados Unidos para un año reciente (con base en datos de US News & World Report). Las universidades listadas en orden son Columbia, Vassar, Trinidad, George Washington, Carnegie Mellon, Wesleyan, Tulane, Bucknell, Oberlin y Union. ¿Qué nos dice esta “lista de las 10 primeras” sobre esos costos para la población de todas las universidades estadounidenses? 49,138 47,890 47,510 47,343 46,962 46,944 46,930 46,902 46,870 46,785 17. Anillo de diamante A continuación se listan las cantidades en dólares que cuestan los paquetes para propuestas matrimoniales en los diferentes estadios de las Ligas Mayores de Béisbol. Cinco de los equipos no permiten propuestas. ¿Existen valores atípicos? 39 50 50 50 55 55 75 85 100 115 175 175 200 209 250 250 350 400 450 500 500 500 500 1500 2500 18. Ventas de álbumes de discos LP de vinilo A continuación se listan las ventas anuales de discos de vinilo en Estados Unidos (millones de unidades). Las cantidades de álbumes vendidos se presentan en orden cronológico, y la última entrada representa el año más reciente. ¿Las medidas de tendencia central nos dan alguna información sobre una tendencia cambiante a lo largo del tiempo? 0.3 0.6 0.8 1.1 1.1 1.4 1.4 1.5 1.2 1.3 1.4 1.2 0.9 0.9 1 1.9 2.5 2.8 3.9 4.6 6.1 19. Fumadores de California En la encuesta Entrevista sobre Salud en California, se entrevistó a adultos seleccionados al azar. Una de las preguntas fue acerca de cuántos cigarrillos fumaban al día, y los resultados se listan a continuación para 50 encuestados seleccionados aleatoriamente. ¿Qué tan bien reflejan los resultados los hábitos del tabaquismo de los adultos en California? 9 10 10 20 40 50 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 20. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió a las mujeres que evaluaran el atractivo de sus acompañantes masculinos; a continuación se lista una muestra de los resultados (1 5 no atractivo, 10 5 extremadamente atractivo). ¿Se pueden utilizar los resultados para describir el atractivo de la población de varones adultos? 5 8 3 8 6 10 3 7 9 8 5 5 6 8 8 7 3 5 5 6 8 7 8 8 8 7
94 CAPÍTULO 3 Descripción, exploración y comparación de datos En los ejercicios 21 a 24, encuentre la media y la mediana para cada una de las dos muestras, luego compare los dos conjuntos de resultados. 21. Presión arterial Una muestra de mediciones de presión arterial se toma del conjunto de datos 1 “Datos corporales” del apéndice B, y los valores (mm Hg) se relacionan de manera que 10 sujetos tienen medidas sistólicas y diastólicas. (La presión sistólica es una medida de la fuerza de la sangre empujada a través de las arterias, mientras que la presión diastólica es una medida de la presión arterial mientras el corazón está en reposo entre latidos). ¿Son las medidas de tendencia central los mejores estadísticos que pueden obtenerse de estos datos? Sistólica: 118 128 158 96 156 122 116 136 126 120 Diastólica: 80 76 74 52 90 88 58 64 72 82 22. Robo de parquímetros A continuación se listan los montos (en millones de dólares) recaudados en parquímetros por Brinks y otras empresas en la ciudad de Nueva York durante períodos similares. Se utilizó un conjunto de datos más amplio para condenar a cinco empleados de Brinks por hurto mayor. Los datos fueron proporcionados por el abogado de la ciudad de Nueva York, y se pueden encontrar en el sitio web de Data and Story Library (DASL). ¿Los datos limitados que aparecen aquí muestran evidencia de robo por los empleados de Brinks? El contratista de recaudación 1.3 1.5 1.3 1.5 1.4 1.7 1.8 1.7 1.7 1.6 fue Brinks El contratista de recaudación 2.2 1.9 1.5 1.6 1.5 1.7 1.9 1.6 1.6 1.8 no fue Brinks 23. Pulsos A continuación se listan los pulsos (latidos por minuto) de muestras de hombres y mujeres adultas (del conjunto de datos 1 “Datos corporales” en el apéndice B). ¿Parece haber una diferencia? Hombres: 86 72 64 72 72 54 66 56 80 72 64 64 96 58 66 Mujeres: 64 84 82 70 74 86 90 88 90 90 94 68 90 82 80 24. Filas en el banco Los tiempos de espera (en segundos) de los clientes en el Banco de Ahorro de Madison se registran con dos configuraciones: línea de clientes única y líneas de clientes individuales. Examine cuidadosamente los datos para determinar si hay una diferencia entre los dos conjuntos de datos que no sea evidente a partir de una comparación de las medidas de tendencia central. Si es así, ¿cuál es? Línea única 390 396 402 408 426 438 444 462 462 462 Líneas individuales 252 324 348 372 402 462 462 510 558 600 Grandes conjuntos de datos del apéndice B. En los ejercicios 25 a 28, considere el conjunto de datos indicado en el apéndice B. Use software o una calculadora para encontrar las medias y las medianas. 25. Tornados Utilice las medidas en la escala F de tornados listadas en el conjunto de datos 22 “Tornados” del apéndice B. Entre los 500 tornados, ¿a cuántos les faltan mediciones de la escala F? (Precaución: En algunas tecnologías, los datos faltantes se representan mediante una constante como –9 o 9999). 26. Terremotos Utilice las magnitudes (en la escala de Richter) de los 600 terremotos listados en el conjunto de datos 21 “Terremotos” del apéndice B. En 1989, el área de la Bahía de San Francisco fue golpeada por un terremoto de 7.0 en la escala de Richter. Ese terremoto ocurrió durante el período de calentamiento para el tercer juego de la Serie Mundial de béisbol. ¿Es la magnitud del terremoto de la Serie Mundial un valor atípico cuando se considera en el contexto de los datos muestrales dados en el conjunto de datos 21? Explique. 27. Temperaturas corporales Considere el conjunto de datos 3 “Temperaturas corporales” en el apéndice B y use las temperaturas corporales para las 12:00 AM del día 2. ¿Los resultados respaldan o contradicen la creencia común de que la temperatura corporal media es de 98.6 °F? 28. Nacimientos Use los pesos al nacer (en gramos) de los 400 bebés listados en el conjunto de datos 4 “Nacimientos” en el apéndice B. Examine la lista de pesos al nacer y haga una observación sobre esos números. ¿Cómo afecta esta observación la forma en que los resultados deben redondearse?
3-1 Medidas de tendencia central 95 En los ejercicios 29 a 32, encuentre la media de los datos resumidos en la distribución de frecuen- cias. Además compare las medias calculadas con las medias reales obtenidas utilizando la lista original de valores de datos, que son las siguientes: (Ejercicio 29) 36.2 años; (Ejercicio 30) 44.1 años; (Ejercicio 31) 224.3; (Ejercicio 32) 255.1. 29. Edad (en años) de la mejor 30. Edad (en años) actriz al ganar el Oscar Frecuencia del mejor actor al 20-29 29 ganar el Oscar Frecuencia 30-39 34 20-29 1 40-49 14 30-39 28 50-59 3 40-49 36 60-69 5 50-59 15 70-79 1 60-69 6 80-89 1 70-79 1 31. Conteo de plaquetas en 32. Conteo de la sangre de hombres plaquetas en (1000 células/ml) Frecuencia la sangre de 0-99 1 mujeres (1000 células/ml) Frecuencia 100-199 51 100-199 25 200-299 90 200-299 92 300-399 10 300-399 28 400-499 0 400-499 0 500-599 0 500-599 2 600-699 1 33. Media ponderada Un alumno del autor obtuvo calificaciones de A, C, B, A y D. Estos cursos tenían las siguientes cantidades correspondientes de horas de crédito: 3, 3, 3, 4 y 1. El sistema de cali- ficación asigna puntos a las calificaciones con letras como sigue: A 5 4; B 5 3; C 5 2; D 5 1; F 5 0. Calcule el promedio de calificaciones y redondee el resultado con dos decimales. Si la lista del decano requiere un promedio de 3.00 o mayor, ¿este estudiante entrará a la lista del decano? 34. Media ponderada Una alumna del autor obtuvo calificaciones de 63, 91, 88, 84 y 79 en sus cinco exámenes regulares de estadística. Su calificación en el examen final fue 86 y en su proyecto de clase obtuvo 90. Su calificación combinada en las tareas fue 70. Los cinco exámenes regulares representan 60% de la calificación final, el examen final 10%, el proyecto 15% y las tareas 15%. ¿Cuál es su califi- cación media ponderada? ¿Qué calificación con letra obtuvo (A, B, C, D o F)? Suponga que una media de 90 o más es una A, una media de 80 a 89 es una B, y así sucesivamente. 3-1 Más allá de lo básico 35. Grados de Libertad Cinco frecuencias de pulso aleatoriamente seleccionadas del conjunto de datos 1 “Datos corporales” en el apéndice B tienen una media de 78.0 latidos por minuto. Cuatro de los pulsos son 82, 78, 56 y 84. a. Encuentra el valor faltante. b. Necesitamos elaborar una lista de n valores que tengan una media específica conocida. Somos libres de seleccionar los valores que deseemos para algunos de los n valores. ¿Cuántos de los n valores pueden asignarse libremente antes de que los valores restantes queden determinados? (El resultado se conoce como el número de grados de libertad). 36. Datos censurados El conjunto de datos 15 “Presidentes” del apéndice B muestra el número de años que vivieron los presidentes estadounidenses después de su primera toma de poder. Hasta la fecha, cinco de los presidentes siguen vivos y después de su primera asunción han vivido 37, 25, 21, 13 y 5 años. Podemos usar los valores de 371, 251, 211, 131 y 51, donde los signos positivos indican
96 CAPÍTULO 3 Descripción, exploración y comparación de datos que el valor real es igual o mayor que el valor actual. (Se dice que estos valores están censurados en el momento actual en que se compiló a lista). Si se usan los valores en el conjunto de datos 15 y se ignoran los presidentes que todavía están vivos, ¿cuál es la media? Si utiliza los valores dados en el conjunto de datos 15 junto con los valores adicionales de 371, 251, 211, 131 y 51, ¿qué sabemos acerca de la media? ¿Los dos resultados difieren mucho? 37. Media recortada Debido a que la media es muy sensible a los valores extremos, se dice que no es una medida de tendencia central resistente. Al eliminar algunos valores bajos y altos, la media recortada se hace más resistente. Para encontrar la media recortada del 10% para un conjunto de datos, primero ordene los datos, luego elimine el 10% de los valores inferiores y el 10% de los valores superiores, luego calcule la media de los valores restantes. Utilice las cargas axiales (en libras) de las latas de aluminio que se listan a continuación (del conjunto de datos 30 “Latas de aluminio” en el apéndice B) para latas de 0.0111 pulga- das de espesor. Una carga axial es la fuerza a la que la tapa de una lata colapsa. Identifique cualquier valor atípico, luego compare la mediana, la media, la media recortada del 10% y la media recortada del 20%. 247 260 268 273 276 279 281 283 284 285 286 288 289 291 293 295 296 299 310 504 38. Media armónica La media armónica se utiliza a menudo como una medida de tendencia central para conjuntos de datos que consisten en tasas de cambio, como velocidades. Se encuentra al dividir el número de valores n por la suma de los recíprocos de todos los valores, expresados como n ax 1 (Ningún valor puede ser cero). El autor condujo 1163 millas para ir a una conferencia en Orlando, Flori- da. En el viaje de ida, el autor se detuvo durante la noche, y la velocidad media de principio a fin fue de 38 millas por hora. Durante el viaje de regreso, se detuvo sólo por comida y combustible, y la velocidad media desde el principio hasta el final fue de 56 millas por hora. Encuentre la media armónica de 38 mi/h y 56 mi/h para encontrar la verdadera velocidad “media” del viaje de ida y vuelta. 39. Media geométrica La media geométrica se utiliza a menudo en los negocios y la economía para encontrar tasas de cambio promedio, tasas de crecimiento promedio o razones medias. Para encontrar la media geométrica de n valores (donde todos son positivos), primero multiplique los valores, luego encuen- tre la raíz n-ésima del producto. Por un período de 6 años, el dinero depositado en certificados anuales de depósito tenía tasas de interés anual de 5.154%, 2.730%, 0.488%, 0.319%, 0.313% y 0.268%. Identifique el porcentaje de crecimiento único que es igual que las cinco tasas de crecimiento consecutivas, calculan- do la media geométrica de 1.05154, 1.02730, 1.00488, 1.00319, 1.00313 y 1.00268. 40. Media cuadrática La media cuadrática (o la raíz cuadrada media, o R.C.M.) se utiliza en aplicaciones físicas, como sistemas de distribución de energía. La media cuadrática de un conjunto de valores se obtiene al elevar al cuadrado cada valor, sumar esos cuadrados, dividir la suma por el número de valores n, y luego obtener la raíz cuadrada del resultado, como se indica a continuación: Σx2 Media cuadrática = A n Encuentre la R.C.M. de los siguientes voltajes medidos en corrientes domésticas: 0, 60, 110, –110, –60, 0. ¿Cómo se compara el resultado con la media? 41. Mediana Cuando los datos se resumen en una distribución de frecuencias, la mediana se puede encontrar identificando primero la clase mediana, que es la clase que contiene la mediana. Asumimos entonces que los valores de esa clase están uniformemente distribuidos e interpolamos. Si n expresa la suma de todas las frecuencias de clase, y m expresa la suma de las frecuencias de clase que preceden a la clase mediana, la mediana se puede estimar como se muestra a continuación. n + 1 a b - 1m + 12 (límite inferior de la clase mediana) + (anchura de clase) ° 2 ¢ frecuencia de la clase mediana Utilice este procedimiento para encontrar la mediana de la distribución de frecuencias dada en la tabla 3-2 de la página 88. ¿Cuánto se aleja este resultado de la mediana encontrada en la lista original de tiempos de servicio en McDonald’s del conjunto de datos 25 “Comida rápida” en el apéndice B?
También puede leer