ESTADÍSTICA - Mario F. Triola - DECIMOOOOOOOOOOSSEEEEGGUUUUUNDDDDAAA EEDDICCCCIIÓÓNN

Página creada Isabel Urcelay
 
SEGUIR LEYENDO
ESTADÍSTICA - Mario F. Triola - DECIMOOOOOOOOOOSSEEEEGGUUUUUNDDDDAAA EEDDICCCCIIÓÓNN
Mario F. Triola

ESTADÍSTICA
   DECIMO
        OSEGUND
              DA EDIC
                    CIÓN
ESTADÍSTICA - Mario F. Triola - DECIMOOOOOOOOOOSSEEEEGGUUUUUNDDDDAAA EEDDICCCCIIÓÓNN
12A
 EDICIÓN

         4
ESTADÍSTICA
PROBABILITY

                                                    MARIO F. TRIOLA
                                        Con la colaboración especial de
                                                          Laura Lossi,
                                                       Broward College

                               Traducción
                    Jesús Elmer Murrieta Murrieta
                  Maestro en Investigación de Operaciones
                         Tecnológico de Monterrey

                               Revisión técnica
                          Gerardo Montes Sifuentes
                          Universidad Regiomontana
        Instituto de Especialización de Ejecutivos – Campus Monterrey

                        Alberto de la Rosa Elizalde
                  Facultad de Contaduría y Administración
                            Facultad de Ciencias
                 Universidad Nacional Autónoma de México

                      Julio Sergio Acosta Rodríguez
                  Facultad de Contaduría y Administración
                 Universidad Nacional Autónoma de México
Datos de catalogación bibliográ!ca

  MARIO F. TRIOLA
  Estadística
  Decimosegunda edición
  Pearson Educación de México, S.A. de C.V., 2018
  ISBN: 978-607-32-4378-0
  Área: Matemáticas
  Formato: 21 × 27 cm                   Páginas: 784

Estadística
Authorized translation from the English Language edition entitled Elementary Statistics, 13th Edition, by Mario F. Triola, pu-
blished by Pearson Education, Inc., Copyright © 2018. All rights reserved. ISBN 9780134462455

Traducción autorizada de la edición en idioma inglés titulada Elementary Statistics, 13th Edition, por Mario F. Triola, publi-
cada por Pearson Education, Inc., Copyright © 2018. Todos los derechos reservados.

Edición en español
Director general: Sergio Fonseca Q Director de innovación y servicios educativos: Alan David Palau Q Gerente
de contenidos y servicios editoriales: Jorge Luis Íñiguez Q Coordinador de desarrollo de contenidos: Lilia
Moreno Q Editora especialista en contenidos de aprendizaje: Rosa Díaz Sandoval Q Coordinador de arte y
diseño: Mónica Galván Q Editor de desarrollo: Bernardino Gutiérrez Hernández Q Traductor: Jesús Elmer Murrieta
Murrieta Q Corrector de estilo: César Romero Q Gestor de arte y diseño: José Hernández Garduño Q Lector de
pruebas: Felipe Martínez Q Composición y diagramación: Servicios Editoriales 6Ns.

Esta edición en español es la única autorizada.

Contacto: soporte@pearson.com

Decimosegunda edición, 2018

ISBN LIBRO IMPRESO: 978-607-32-4378-0                      D.R. © 2018 por Pearson Educación de México, S.A. de C.V.
ISBN LIBRO E-BOOK: 978-607-32-4377-3                       Avenida Antonio Dovalí Jaime núm. 70
                                                           Torre B, Piso 6, Colonia Zedec, Ed. Plaza Santa Fe
                                                           Delegación Álvaro Obregón, México, Ciudad de México, C. P. 01210
Impreso en México. Printed in Mexico.
1 2 3 4 5 6 7 8 9 0 – 21 20 19 18                          www.pearsonenespañol.com

                                  Reservados todos los derechos. Ni la totalidad ni parte de esta publicación pueden repro-
                                  ducirse, registrarse o transmitirse, por un sistema de recuperación de información, en
                                  ninguna forma ni por ningún medio, sea electrónico, mecánico, fotoquímico, magnético
                                  o electroóptico, fotocopia, grabación o cualquier otro, sin permiso previo por escrito del
                                  editor.

                                                    Pearson Hispanoamérica
 Argentina Q Belice Q Bolivia Q Chile Q Colombia Q Costa Rica Q Cuba Q República Dominicana Q Ecuador Q El Salvador Q Guatemala
                       Q Honduras Q México Q Nicaragua Q Panamá Q Paraguay Q Perú Q Uruguay Q Venezuela
3-1 Medidas de
                                                                                                    tendencia central
                                                                                                3-2 Medidas de variación
                                                                                                3-3 Medidas de posición
                                                                                                    relativa y gráficas de
                                                                                                    caja

                3
DESCRIPCIÓN, EXPLORACIÓN
Y COMPARACIÓN DE DATOS

     PROBLEMA
        DEL
                  ¿Qué compañía tiene la mejor velocidad (de transferencia)
     CAPÍTULO     de datos para teléfonos inteligentes en los aeropuertos?

El conjunto de datos 32, “Velocidades de datos en aeropuertos”      de puntos con los datos no modificados serían un poco compli-
del apéndice B, lista las velocidades (de transferencia) de datos   cadas y no tan útiles, pero si redondeamos todos los conjuntos
medidos por RootMetrics en 50 aeropuertos de Estados Unidos         de datos originales, obtendremos la gráfica de puntos mostrada
considerando las cuatro principales compañías proveedoras del       en la figura 3-1. (Una observación de la escala horizontal en la
servicio en ese país (Verizon, Sprint, AT&T y T-Mobile). Todas      figura 3-1 revela que las velocidades de datos originales han sido
las velocidades se dan en unidades de megabits (o 1 millón de       redondeadas al entero par más cercano por el software utilizado
bits) por segundo, expresados como Mbps. Debido a que las           para crear las gráficas de puntos). Si se utilizan las mismas cuatro
velocidades de datos originales listadas en el conjunto de datos    escalas horizontales y se apilan las cuatro gráficas de puntos, las
32 incluyen números decimales como 38.5 Mbps, las gráficas          comparaciones resultan mucho más sencillas.
80
Objetivos del capítulo            81

                                                                   El análisis de la figura 3-1 sugiere que Verizon tiene el mejor des-
  Verizon                                                          empeño global, con velocidades de datos que tienden a ser más
                                                                   altas que las de las otras tres compañías. Pero en vez de confiar
                                                                   únicamente en interpretaciones subjetivas de una gráfica como

   Sprint                                                          la de la figura 3-1, este capítulo introduce medidas que son esen-
                                                                   ciales para cualquier estudio de estadística: la media, la mediana,
    AT&T
                                                                   la desviación estándar y la varianza, que se encuentran entre los

T-Mobile                                                           datos estadísticos más importantes en el estudio de esta materia.
            0     10 20 30 40 50 60 70 80
                                                                   Éstos se usarán para describir, explorar y comparar las velocida-
                Velocidad de transferencia de datos
                      (megabits por segundo)                       des de datos medidos de Verizon, Sprint, AT&T y T-Mobile como

FIGURA 3-1 Gráfica de puntos de las velocidades de da-             se listan en el conjunto de datos 32.
tos para Smartphone

 OBJETIVOS DEL CAPÍTULO

                                   Pensamiento crítico e interpretación: más allá de las fórmulas y la aritmética
                                   En este curso moderno de estadística no es tan importante memorizar fórmulas o efectuar
                                   cálculos manuales de aritmética. Es posible obtener resultados con una calculadora o
                                   software para que podamos concentrarnos en el sentido práctico de los resultados a través
                                   del pensamiento crítico. Aunque el presente capítulo incluye pasos detallados para proce-
                                   dimientos importantes, no siempre es necesario dominarlos. No obstante, a menudo es útil
                                   llevar a cabo unos cuantos cálculos manuales antes de usar la computadora, con el fin de
                                   incentivar la comprensión.
                                       Los métodos y herramientas presentados en este capítulo se llaman con frecuencia
                                   métodos de estadística descriptiva, puesto que resumen o describen las características
                                   relevantes de los datos. En los capítulos subsecuentes usamos la estadística inferencial
                                   para hacer inferencias , o generalizaciones, sobre las poblaciones. Los siguientes son los
                                   objetivos del capítulo:

                                   3-1 Medidas de tendencia central
                                    • Desarrollar la capacidad de medir el centro de los datos mediante la determinación de la
                                      media, la mediana, la moda y la mitad del rango.

                                    • Determinar si un valor atípico tiene un efecto sustancial sobre la media y la mediana.
                                   3-2 Medidas de variación
                                    • Desarrollar la capacidad de medir la variación en un conjunto de datos muestrales me-
                                      diante la determinación de los valores del rango, la varianza y la desviación estándar.

                                    • Desarrollar la capacidad de interpretar los valores de la desviación estándar aplicando la
                                      regla práctica del rango para determinar si un valor particular es significativamente bajo
                                      o significativamente alto.

                                   3-3 Medidas de posición relativa y gráficas de caja
                                    • Desarrollar la capacidad de calcular una puntuación z y utilizar el resultado para determi-
                                      nar si un valor dado x es significativamente bajo o significativamente alto.

                                    • Identificar valores de los percentiles y cuartiles de un conjunto de datos.
                                    • Desarrollar la capacidad de construir una gráfica de caja a partir de un conjunto de datos.
82           CAPÍTULO 3 Descripción, exploración y comparación de datos

     3-1            Medidas de tendencia central
                                    Concepto clave El enfoque de esta sección está en obtener un valor que mida el centro de
                                    un conjunto de datos. En particular, se presentan medidas de tendencia central, incluyendo la
                                    media y la mediana. El objetivo aquí no es sólo encontrar el valor de cada medida de tenden-
                                    cia central, sino también interpretar esos valores. La parte 1 de la presente sección incluye
                                    conceptos básicos que deben ser entendidos antes de considerar la parte 2.

                                     PARTE 1          Conceptos básicos de las medidas
                                                      de tendencia central
                                    En la parte 1 de esta sección introducimos la media, la mediana, la moda y la mitad del rango
                                    como diferentes medidas de tendencia central. Tales medidas se utilizan ampliamente para
                                    proporcionar valores representativos que “resumen” los conjuntos de datos.

                                      DEFINICIÓN
En cifras
                                      Una medida de tendencia central es un valor en medio o en el centro de un conjunto
$3.19: Monto medio dejado por
                                      de datos.
el ratón de los dientes, con base
en una encuesta realizada por
Visa. El 10% de los niños con           Existen diferentes métodos para medir el centro, por lo que tenemos distintas definicio-
menos suerte no obtiene nada.       nes para ellos. Comenzamos con la media.

                                    Media
                                    Por lo general, la media (o media aritmética) es la más importante de las mediciones numéri-
                                    cas usadas para describir datos, y es lo que la mayoría de las personas llama promedio.

                                      DEFINICIÓN
                                      La media (o media aritmética) de un conjunto de datos es la medida de tendencia cen-
                                      tral que se encuentra al sumar todos los valores de los datos y dividir el total por el nú-
                                      mero de datos.

                                      Propiedades importantes de la media
                                      ■   Las medias muestrales de una misma población tienden a variar menos que otras medidas
                                          de tendencia central.
                                      ■   La media de un conjunto de datos utiliza todos los valores de los datos.
                                      ■   Una desventaja de la media es que un solo valor extremo (atípico) puede cambiar el valor
                                          de la media en forma sustancial. (Con base en la siguiente definición, puede decirse que
                                          la media no es resistente).

                                      DEFINICIÓN
                                      Un dato estadístico es resistente si la presencia de valores extremos (atípicos) no ocasiona
                                      que éste cambie mucho.
3-1 Medidas de tendencia central                 83

 Cálculo y notación de la media
 La definición de la media puede expresarse como en la fórmula 3-1, donde la letra     ra                Paradoja del tamaño de
 griega Σ (sigma mayúscula) indica que los valores de los datos deben sumarse, por lo que
                                                                                       ue                la clase
 Σx representa la suma de todos los valores de los datos. El símbolo n expresa el tamaño
                                                                                       ño
 de la muestra, que es el número de valores de datos.                                                    Existen al
                                                                                                         menos dos
                                                                                                         formas de
 FÓRMULA 3-1                                                                                             obtener el
                                                                                                         tamaño de
                                  Σx d suma de todos los valores de datos
                        Media 5                                                                          una clase
                                  n     d número de valores de datos                                     promedio, y
 Si los datos son una muestra de una población, la media se expresa con x (que se pronuncia              ambas pueden dar resultados
 “x barra”); si los datos son la población entera, la media se expresa mediante m (letra griega          muy diferentes. En una
 mu minúscula).                                                                                          universidad, si tomamos la
                                                                                                         cantidad de estudiantes de
                                                                                                         737 clases, obtenemos una
                                                                                                         media de 40 estudiantes. Sin
 NOTACIÓN Sugerencia: Los estadísticos muestrales se representan usualmente mediante
                                                                                                         embargo, si reunimos una lista
 caracteres latinos, como x, y los parámetros de población por medio de letras griegas, como m.
                                                                                                         del tamaño de las clases para
 Σ            expresa la suma de un conjunto de valores de datos.                                        cada estudiante y utilizamos esta
 x            es la variable que generalmente se usa para representar los valores de datos               lista, obtendríamos una media
              individuales.                                                                              de 147. Esta gran discrepancia
                                                                                                         se debe al hecho de que existen
 n            representa el número de valores de datos en una muestra.
                                                                                                         muchos estudiantes en clases
 N            representa el número de valores de datos en una población.                                 grandes, en tanto que hay pocos
    Σx                                                                                                   estudiantes en clases pequeñas.
 x5           es la media de un conjunto de valores muestrales.
    n                                                                                                    Sin cambiar el número de clases
    Σx                                                                                                   o de profesores, podríamos
 m5           es la media de todos los valores en una población.                                         reducir el tamaño de clase
     N
                                                                                                         promedio para los estudiantes
                                                                                                         haciendo que todas las clases
                                                                                                         tengan un tamaño similar. Esto
     EJEMPLO 1        Media                                                                              también aumentaría la asistencia,
El conjunto de datos 32 “Velocidades de datos en aeropuertos” del apéndice B incluye me-                 que es más alta en las clases con
                                                                                                         menor número de alumnos.
didas de las velocidades de datos para teléfonos inteligentes en cuatro compañías. Encuen-
tre la media de los cinco primeros datos de velocidad para Verizon: 38.5, 55.6, 22.4, 14.1 y
23.1 (todos en megabits por segundo, o Mbps).

 SOLUCIÓN

La media se calcula mediante la fórmula 3-1. Primero sume los valores de datos, luego
divida por el número de valores:
                     Σx    38.5 + 55.6 + 22.4 + 14.1 + 23.1   153.7
                x =      =                                  =
                      n                   5                     5
                   = 30.74 Mbps

La media de las cinco primeras velocidades de datos para Verizon es de 30.74 Mbps.
           SU TURNO   Encuentre la media en el ejercicio 5 “Números de jugadores de fútbol americano”.

 PRECAUCIÓN Nunca utilice el término promedio cuando se refiera a una medida de
 tendencia central. Esa palabra se utiliza a menudo para la media, pero en ocasiones se
 usa para otras medidas del centro. Los estadísticos no emplean el término promedio
 y en el resto de este libro no se usará para hacer referencia a una medida de tendencia
 central específica. El término promedio tampoco es utilizado por la comunidad estadística
 o las revistas profesionales.
84           CAPÍTULO 3 Descripción, exploración y comparación de datos

                                     Mediana
                                     M
Lo que la mediana no es              La mediana se puede considerar de manera general como un “valor medio” en el sentido de
                                     que aproximadamente la mitad de los valores en un conjunto de datos son menores y la mitad
                                     qu
                  El biólogo         son mayores que la mediana. La siguiente definición es más precisa.
                                     so
                  de Harvard,
                  Stephen Jay
                  Gould escribió:
                  “La mediana          DEFINICIÓN
                   no es el            La mediana de un conjunto de datos es la medida de tendencia central que indica el valor
                   mensaje”. Así       intermedio, cuando los datos originales se presentan en orden de magnitud creciente
describe lo que aprendió cuando        (o decreciente).
se enteró que tenía mesotelioma
abdominal, una forma de cáncer.
Fue a la biblioteca para aprender
más y se sorprendió al descubrir       Propiedades importantes de la mediana
que el mesotelioma era incurable
                                       ■   La mediana no cambia por mucho cuando se incluyen sólo unos pocos valores extre-
(la mediana de supervivencia es
                                           mos, por lo que la mediana es una medida de tendencia central resistente.
de sólo ocho meses después de
ser descubierto). Gould escribió       ■   La mediana no utiliza directamente todos los valores de datos. (Por ejemplo, si el valor
lo siguiente: “Sospecho que la             mayor se cambia por uno mucho más grande, la mediana no cambia).
mayor parte de las personas,
sin formación en estadística,          Cálculo y notación de la mediana
leería esta afirmación como
‘probablemente estaré muerto
                                       La mediana de una muestra se denomina a veces x (que se pronuncia “x tilde”) o M
en ocho meses’; conclusión que         o Med; no existe una notación generalmente aceptada y no hay un símbolo especial para
debe evitarse, ya que no es así, y     la mediana de una población. Para encontrar la mediana, primero ordene los valores (pón-
más considerando que la actitud        galos en orden) y luego siga uno de los siguientes dos procedimientos:
(en la lucha contra el cáncer)         1. Si el número de valores de datos es impar, la mediana es el número ubicado en el in-
importa tanto”. Gould procedió
                                            termedio exacto de la lista ordenada.
a interpretar cuidadosamente
el valor de la mediana. Sabía          2. Si el número de valores de datos es par, la mediana se obtiene calculando la media de
que su oportunidad de vivir más             los dos números intermedios de la lista ordenada.
tiempo que la mediana era buena
porque era joven, su cáncer
fue diagnosticado de manera
temprana y tendría el mejor
                                            EJEMPLO 2       Mediana con un número impar de valores de datos
tratamiento médico. También           Encuentre la mediana de las cinco primeras velocidades de datos para Verizon: 38.5, 55.6,
razonó que algunas personas           22.4, 14.1 y 23.1 (todas en megabits por segundo, o Mbps).
podrían vivir mucho más de
ocho meses, y no vio ninguna           SOLUCIÓN
razón por la que no pudiera
                                      Primero ordene en forma ascendente los valores de datos, como se muestra a continuación:
estar en ese grupo. Armado con
esta interpretación reflexiva de                                         14.1 22.4 23.1 38.5 55.6
la mediana y una fuerte actitud
positiva, Gould vivió 20 años
                                      Como hay 5 valores de datos, tal cantidad es un número impar (5), por lo que la mediana
después de su diagnóstico.
                                      es el número intermedio exacto de la lista ordenada, que es 23.1 Mbps. Por lo tanto, la me-
Murió de otro cáncer no               diana es 23.10 Mbps. Observe que la mediana de 23.10 Mbps es diferente de la media de
relacionado con el mesotelioma.       30.74 Mbps que se encontró en el ejemplo 1. Note también que el resultado de 23.10 Mbps
                                      sigue la regla de redondeo que se proporciona más adelante en esta sección.
                                                 SU TURNO   Encuentre la mediana en el ejercicio 5 “Números de jugadores de fútbol americano”.

                                             EJEMPLO 3       Mediana con un número par de valores de datos
                                      Repita el ejemplo 2 después de incluir la sexta velocidad de datos de 24.5 Mbps. Es decir,
                                      encuentre la mediana de las siguientes velocidades de datos: 38.5, 55.6, 22.4, 14.1, 23.1,
                                      24.5 (todo en Mbps).
3-1 Medidas de tendencia central          85

  SOLUCIÓN

 Primero ordene los valores de manera ascendente:
                               14.1 22.4 23.1 24.5 38.5 55.6
 Debido a que el número de valores de datos es par (6), la mediana se obtiene calculando la
 media de los dos números intermedios, que son 23.1 y 24.5.
                                         23.1 1 24.5 47.6
                            Mediana 5               5     5 23.80 Mbps
                                              2       2
 La mediana es 23.80 Mbps.
                          SU TURNO   Encuentre la mediana en el ejercicio 7 “Valor neto de celebridades”.

Moda
La moda no se utiliza mucho con datos cuantitativos, pero es la única medida de tendencia ia                En cifras
central que puede usarse con datos cualitativos (que consisten solamente en nombres, etique-
                                                                                          e-
                                                                                                            Mohammed: El nombre más
tas o categorías).
                                                                                                            común en el mundo.

  DEFINICIÓN
  La moda de un conjunto de datos es el (los) valor(es) que ocurre(n) con mayor frecuencia.

  Propiedades importantes de la moda
  ■   La moda se puede encontrar con datos cualitativos.
  ■   Un conjunto de datos puede tener una moda, o múltiples modas, o no tener ninguna.
  Determinación de la moda: Un conjunto de datos puede tener una moda, más de una
  moda, o ninguna moda.
  ■   Cuando dos valores de datos ocurren con la misma mayor frecuencia, cada uno es una
      moda y se dice que el conjunto de datos es bimodal.
  ■   Cuando más de dos valores de datos ocurren con la misma mayor frecuencia, cada uno
      es una moda y se dice que el conjunto de datos es multimodal.
  ■   Cuando ningún valor de datos se repite, se dice que no hay moda.
  ■   Cuando usted pide helado con su pastel, se dice que está “a la moda”.

       EJEMPLO 4       Moda
 Encuentre la moda de las siguientes velocidades de datos para Sprint (en Mbps):
                                0.2 0.3 0.3 0.3 0.6 0.6 1.2

  SOLUCIÓN

 La moda es de 0.3 Mbps, porque es la velocidad de datos que ocurre con más frecuencia
 (tres veces).
                             SU TURNO   Encuentre la moda en el ejercicio 7 “Valor neto de celebridades”.

    En el ejemplo 4, la moda es un valor único. A continuación se presentan otras circun-
stancias posibles:

      Dos modas:        Las velocidades de datos (Mbps) de 0.3, 0.3, 0.6, 4.0 y 4.0 tienen dos
                        modas: 0.3 Mbps y 4.0 Mbps.
      Sin moda:         Las velocidades de datos (Mbps) de 0.3, 1.1, 2.4, 4.0 y 5.0 no tienen
                        moda porque ningún valor se repite.
86   CAPÍTULO 3 Descripción, exploración y comparación de datos

                         Mitad del rango
                         Otra medida de tendencia central es la mitad del rango.

                            DEFINICIÓN
                            La mitad del rango de un conjunto de datos es la medida de tendencia central que
                            consiste en el valor que está a la mitad entre los valores máximo y mínimo del conjunto
                            de datos original. Se encuentra al sumar el valor máximo y el valor mínimo de los datos y
                            después dividir esa suma entre 2, como se muestra en la siguiente fórmula:

                                                                 valor máximo de datos 1 valor mínimo de datos
                                            Mitad del rango 5
                                                                                           2

                            Propiedades importantes de la mitad del rango
                           ■   Debido a que la mitad del rango utiliza sólo los valores máximo y mínimo, es muy
                               sensible a esos extremos y, por lo tanto, no es resistente.
                           ■   En la práctica, la mitad del rango se utiliza con poca frecuencia, pero tiene tres caracte-
                               rísticas redentoras:

                               1. Es muy fácil de calcular.
                               2. Ayuda a reforzar la muy importante idea de que hay varias maneras de definir el
                                 centro de un conjunto de datos.
                               3. En ocasiones, su valor se utiliza incorrectamente para la mediana, así que la confu-
                                 sión puede reducirse al definir claramente la mitad del rango junto con la mediana.

                                 EJEMPLO 5       Mitad del rango
                           Encuentre la mitad del rango de las siguientes velocidades de datos para Verizon del ejem-
                           plo 1: 38.5, 55.6, 22.4, 14.1 y 23.l (todas en Mbps)

                            SOLUCIÓN

                           La mitad del rango se encuentra de la siguiente manera:
                                                           valor máximo de datos 1 valor mínimo de datos
                                      Mitad del rango 5
                                                                                 2
                                                          55.6 1 14.1
                                                        5             5 34.85 Mbps
                                                               2
                           La mitad del rango es 34.85 Mbps.
                                SU TURNO   Encuentre la mitad del rango en el ejercicio 5 “Números de jugadores de fútbol americano”.

                         Redondeo de medidas de tendencia central
                         A menudo, cuando se calculan medidas de tendencia central, es necesario redondear el resul-
                         tado. Se utiliza la siguiente regla.

                            Reglas de redondeo para medidas de tendencia central
                            • Para la media, la mediana y la mitad del rango, incluya un decimal más que los
                              presentes en el conjunto original de valores.
                            • Para la moda, deje el valor sin redondear (porque los valores de la moda son
                              iguales que algunos de los valores de los datos originales).
3-1 Medidas de tendencia central                 87

     Cuando aplique las reglas de redondeo, redondee sólo la respuesta final, no los valoreses
intermedios producidos durante los cálculos. Por ejemplo, la media de 2, 3 y 5 es 3.333333...,
                                                                                            ..,          Un error de redondeo
que se redondea a 3.3; esto es, con un decimal más que los valores originales de 2, 3 y 5.               cambia un récord
Otro ejemplo es: la media de 80.4 y 80.6 es 80.50 (un decimal más que los usados para los   os           mundial
valores originales). Debido a que la moda es uno o más de los valores originales, no la redon-
                                                                                            n-
deamos; simplemente usamos los mismos valores originales que resultaron ser modas.                       Los errores de
                                                                                                         redondeo a
                                                                                                         menudo pueden
Pensamiento crítico                                                                                      tener resultados
                                                                                                         desastrosos.
Siempre es posible calcular las medidas de tendencia central a partir de una muestra de nú-
                                                                                                         Justin Gatlin
meros, pero es necesario considerar si hacerlo tiene sentido. En la sección 1-2 se estableció
                                                                                                         estaba eufórico cuando
que no tiene sentido hacer cálculos numéricos con datos al nivel nominal de medición,                    estableció el récord mundial
ya que estos datos constan sólo de nombres, etiquetas o categorías, por lo que los datos es-             como la persona en correr los
tadísticos como la media y la mediana carecen de significado. También se debe pensar en el               100 metros en el menor tiempo
método de muestreo utilizado para recopilar los datos. Si el método de muestreo no es sólido,            (9.76 segundos). Sin embargo,
los datos estadísticos obtenidos pueden ser muy engañosos.                                               su tiempo récord duró sólo
                                                                                                         cinco días, cuando se corrigió
                                                                                                         a 9.77 segundos y empató el
                                                                                                         récord mundial en lugar de
      EJEMPLO 6       Pensamiento crítico y medidas de tendencia central
                                                                                                         romperlo. Su tiempo real fue
 Considere cada una de las siguientes situaciones ilustrativas en las que la media y la me-              de 9.766 segundos, y debería
 diana no son estadísticos significativos.                                                               haberse redondeado a 9.77
                                                                                                         segundos, pero la persona que
    a. Códigos postales del Gateway Arch en San Luis, la Casa Blanca, la División de la                  tomó el tiempo no sabía que
       Fuerza Aérea del Pentágono, el Edificio Empire State y la Estatua de la Libertad:                 tenía que presionar un botón
       63102, 20500, 20330, 10118, 10004. (Los códigos postales no miden ni cuentan                      para obtener el redondeo. El
       nada. Los números son sólo etiquetas para ubicaciones geográficas).                               representante de Gatlin dijo que
                                                                                                         el atleta estaba muy perturbado
    b. Clasificaciones de universidades nacionales seleccionadas: Harvard, Yale, Duke,                   y que el incidente era una
       Dartmouth y Brown (por US News & World Report): 2, 3, 7, 10, 14. (Las clasifica-                  “gran vergüenza para la IAAF
       ciones reflejan una ordenación, pero no miden ni cuentan nada).                                   (International Association of
    c. Números en las camisetas de la defensiva titular de los Halcones marinos de Seattle               Athletics Federations) y para
                                                                                                         nuestro deporte”.
       cuando ganaron el Súper Tazón XLVIII: 31, 28, 41, 56, 25, 54, 69, 50, 91, 72, 29.
       (Los números en las camisetas de fútbol americano no miden ni cuentan nada, son
       sólo sustitutos de los nombres).
    d. Primeros cinco ingresos de directores de empresa (en millones de dólares): 131.2,
       66.7, 64.4, 53.3, 51.5. (Estas listas de “los primeros 5” o “los primeros 10” incluyen
       datos que no son en absoluto representativos de toda la población).
    e. Las 50 edades medias calculadas a partir de las medias en cada uno de los 50 esta-
       dos. (Si se calcula la media de esos 50 valores, el resultado no es la edad media de
       las personas en todo el territorio de Estados Unidos y se debe tener en cuenta los
       tamaños de la población de los 50 estados, como se describe en la introducción de la
       media ponderada en la parte 2 de esta sección).
                            SU TURNO
                                       Para el ejercicio 5 “Números de jugadores de fútbol americano”,
                                        determine por qué la media y la mediana no son significativas.

     Con la idea de describir, explorar y comparar datos, proporcionamos la tabla 3-1 en la
página 88, que resume las diferentes medidas de tendencia central para las velocidades de
datos para teléfonos inteligentes que se mencionan en el problema del capítulo. Los datos se
listan en el conjunto de datos 32 “Velocidades de datos en aeropuertos” del apéndice B. La
figura 3-1 de la página 81 sugiere que Verizon tiene las mayores velocidades y la compara-
ción de medias y medianas en la tabla 3-1 también lo indica. En los siguientes capítulos se
describen otras herramientas que pueden utilizarse para una comparación efectiva.
88   CAPÍTULO 3 Descripción, exploración y comparación de datos

                         TABLA 3-1 Comparación de las velocidades de datos para teléfonos inteligentes (Mbps) en los
                         aeropuertos
                                                           Verizon           Sprint           AT&T               T-Mobile
                              Media                        17.60              3.71            10.70                  10.99
                              Mediana                      13.90              1.60              8.65                  9.70
                              Moda                     4.5, 11.1              0.3               2.7         3.2, 4.4, 5.1, 13.3,
                                                                                                             15.0, 16.7, 27.3
                              Mitad del rango              39.30             15.30            19.80                  14.00

                          PARTE 2           Más allá de lo básico en las medidas
                                            de tendencia central
                         Cálculo de la media a partir de una distribución de frecuencias
                         La fórmula 3-2 es el mismo cálculo para la media que se presentó en la parte 1, pero incor-
                         pora el siguiente método: cuando trabajamos con datos resumidos en una distribución de fre-
                         cuencias, hacemos posibles los cálculos asumiendo que todos los valores muestrales en cada
                         clase son iguales al punto medio de dicha clase. La fórmula 3-2 no es realmente un concepto
                         nuevo; es simplemente una variación de la fórmula 3-1 (media).

                            FÓRMULA 3-2 MEDIA A PARTIR DE UNA DISTRIBUCION DE FRECUENCIAS

                                         Primero multiplique cada frecuencia y el punto medio
                                                de la clase; luego sume los productos.
                                                                  T
                                                                Σ1 f # x2
                                                            x =               (El resultado es una aproximación)
                                                                  Σf
                                                                  c
                                                            Suma de frecuencias
                                                                (igual a n)

                         El ejemplo 7 ilustra el procedimiento para encontrar la media a partir de una distribución de
                         frecuencias.

                               EJEMPLO 7          Cálculo de la media a partir de una distribución
                                                  de frecuencias
                           Las dos primeras columnas de la tabla 3-2 mostradas aquí son las mismas de la distribu-
                           ción de frecuencias de la tabla 2-2 del capítulo 2. Utilice la distribución de frecuencias en
                           las dos primeras columnas de la tabla 3-2 para encontrar la media.

                                      TABLA 3-2 Tiempos de servicio para el almuerzo en McDonald’s
                                       Tiempo (segundos)     Frecuencia f   Punto medio de la clase x         f !x
                                            75 -124                11                  99.5                 1094.5
                                           125 - 174               24                 149.5                 3588.0
                                           175 - 224               10                 199.5                 1995.0
                                           225 - 274                 3                249.5                  748.5
                                           275 - 324                 2                299.5                  599.0
                                            Totales:          Σƒ 5 50                                   Σ(ƒ x) 5 8025.0
3-1 Medidas de tendencia central   89

  SOLUCIÓN

 Recuerde que al trabajar con datos resumidos en una distribución de frecuencias, se hacen
 posibles los cálculos asumiendo que todos los valores muestrales en cada clase son iguales
 al punto medio de dicha clase. Por ejemplo, considere el intervalo de la primera clase de
 75 a 124 con una frecuencia de 11. Asumimos que cada uno de los 11 tiempos de servicio
 es de 99.5 segundos (el punto medio de la clase). Con el tiempo de servicio de 99.5 se-
 gundos repetido 11 veces, tenemos un total de 99.5 ~ 11 5 1094.5, como se muestra en la
 última columna de la tabla 3-2. Después sumamos los resultados para encontrar la sumato-
 ria de todos los valores muestrales.
      La fila inferior de la tabla 3-2 muestra los dos componentes que se requieren para
 calcular la media (como en la fórmula 3-2) Σf 5 50 y Σ (f ~ x) 5 8025.0. Calculamos la
 media usando la fórmula 3-2 como sigue:
                                Σ1 f # x2   8025.0
                          x =             =        = 160.5 segundos
                                  Σf          50
 El resultado de x 5 160.5 segundos es una aproximación porque se basa en el uso de los
 valores de los puntos medios de las clases en lugar de la lista original de tiempos de ser-
 vicio. La media de 160.2 segundos encontrada mediante el uso de todos los tiempos de
 servicio originales es un resultado más preciso.
                                    SU TURNO   Resuelva el ejercicio 29 “Edades de las mejores actrices”.

Cálculo de una media ponderada
Cuando a los diferentes valores de datos x se les asignan pesos w distintos, podemos calcular
la media ponderada, que está dada por la fórmula 3-3.

  FÓRMULA 3-3
                                                            Σ(w # x)
                                 Media ponderada: x =
                                                              Σw
  La fórmula 3-3 implica primero multiplicar cada peso w por el valor correspondiente x, luego
  sumar los productos, y finalmente dividir el total por la suma de los pesos, Σw.

      EJEMPLO 8         Cálculo del promedio de calificaciones
 En su primer semestre de la universidad, una alumna del autor tomó cinco cursos. Sus cali-
 ficaciones finales, junto con el número de créditos para cada curso, fueron A (3 créditos),
 A (4 créditos), B (3 créditos), C (3 créditos) y F (1 crédito). El sistema de clasificación
 asigna puntos de calidad a las calificaciones con letras de la siguiente manera: A 5 4;
 B 5 3; C 5 2; D 5 1; F 5 0. Calcule su promedio de calificaciones.

  SOLUCIÓN

 Use los números de créditos como pesos: w 5 3, 4, 3, 3, 1. Reemplace las calificaciones con
 letras de A, A, B, C y F con los puntos de calidad correspondientes: x 5 4, 4, 3, 2, 0. Ahora
 usamos la fórmula 3-3 como se muestra a continuación. El resultado es un promedio de 3.07 en
 el primer semestre. (Al utilizar la regla de redondeo precedente, el resultado debe redon-
 dearse a 3.1, pero es común que los promedios de calificaciones se redondeen a dos decimales).
                         Σ1w # x2
                 x =
                           Σw
                        13 * 42 + 14 * 42 + 13 * 32 + 13 * 22 + 11 * 02
                    =
                                          3 + 4 + 3 + 3 + 1
                      43
                    =    = 3.07
                      14
                                                SU TURNO    Resuelva el ejercicio 33 “Media ponderada”.
90         CAPÍTULO 3 Descripción, exploración y comparación de datos

CENTRO DE TECNOLOGÍA

         Ejemplos de pantallas de estadística descriptiva
         Acceda a los complementos de software, videos y conjuntos de datos en www.pearsonenespañol.com/triola

Las siguientes pantallas se basan en las velocidades de datos de Verizon dentro del conjunto de datos 32 “Velocidades de datos
en aeropuertos”.

                 Statdisk                                                                        TI-83 , 4 Plus

                                                                                              Minitab

                                                                                           StatCrunch

                                                                  Herramienta de análisis
                                                                    de datos de Excel                       Suplemento XLSTAT Excel
3-1 Medidas de tendencia central             91

CENTRO DE TECNOLOGÍA

          Estadística descriptiva
          Acceda a los complementos tecnológicos, videos y conjuntos de datos de Elementary Statistic, 13E en www.pearsonenespañol.com/triola

            Statdisk                                               Minitab                                                   StatCrunch
 1. Haga clic en Data en el                 1. Haga clic en Stat en el menú superior.                       1. Haga clic en Stat en el menú superior.
    menú superior.                          2. Seleccione Basic Statistics en el menú                       2. Seleccione Summary Stats en el
 2. Seleccione Explore Data-                   desplegable y después elija Display                             menú desplegable y después elija
    Descriptive Statistics en                  Descriptive Statistics.                                         Columns.
    el menú desplegable.                    3. Haga doble clic en la columna de datos                       3. Seleccione la columna de datos de-
 3. Seleccione la columna de                   deseada para que aparezca en la ven-                            seada.
    datos deseada.                             tana Variables.                                              4. Haga clic en Compute! para ver los
 4. Haga clic en Evaluate                   4. Haga clic en OK para ver los estadísticos                       estadísticos descriptivos.
    para ver los estadísticos                  descriptivos.
                                                                                                            SUGERENCIA: Personalice los estadísticos
    descriptivos.                                                                                           descriptivos al seleccionar los elementos
                                            SUGERENCIA: Haga clic en el botón Statistics
                                            arriba de OK para seleccionar los estadísticos in-              bajo Statistics.
                                            dividuales que desea mostrar.

       Calculadora T1-83/84 Plus                                                                       Excel
 1. Presione  e STAT , luego seleccione                 Complemento XLSTAT
     CALC en el menú superior.                          1. Haga clic en la ficha XLSTAT de la barra de opciones y después haga clic en
 2. Seleccione 1-Var Stats y pulse                         Describing Data.
      ENTER
            .                                           2. Seleccione Descriptive Statistics en el menú desplegable.
 3. Introduzca el nombre de la lista que                3. Marque la casilla Quantitative Data e introduzca el intervalo de datos de-
     incluye los datos deseados (por                       seado. Si la primera fila de datos contiene una etiqueta, también marque la
     ejemplo, L1).                                         casilla Sample labels.
 4. Seleccione Calculate y pulse ENTER                  4. Haga clic en OK para ver los estadísticos descriptivos.
     para ver los estadísticos descripti-
     vos.                                               Complemento Excel Data Analysis
                                                        1. Haga clic en la ficha Data de la barra de opciones y después seleccione Data
 SUGERENCIA: Presione          para ver los
                                                           Analysis en el menú superior.
 estadísticos adicionales que no se desple-
 garon en la pantalla inicial.                          2. Seleccione Descriptive Statistics bajo Analysis Tools.
                                                        3. Introduzca el rango de datos deseado para el Inpute Range. Si la primera fila de
                                                           datos contiene una etiqueta, también marque la casilla Labels in First Row.
                                                        4. Marque la etiqueta Summary Statistics y haga clic en OK para ver los es-
                                                           tadísticos descriptivos.

  3-1 Habilidades y conceptos básicos
Conocimiento estadístico y pensamiento crítico
1. Promedio El extinto sitio web IncomeTaxlist.com indicaba que el ingreso anual “promedio” en
Florida era de $35,031. ¿Cuál es el papel del término promedio en estadística? ¿Debería usarse otro
término en lugar de promedio?
2. ¿Qué hay de erróneo? USA Today publicó una lista consistente en el impuesto estatal por cada
galón de gasolina. Si se suman las 50 cantidades de impuestos estatales y luego se divide la suma por
50, se obtiene 27.3 centavos. ¿Es el valor de 27.3 centavos el importe medio del impuesto estatal sobre
ventas pagado por todos los conductores estadounidenses? ¿Por qué sí o por qué no?
3. Medidas de tendencia central ¿En qué sentido la media, la mediana, la moda y la mitad del rango
son medidas del “centro”?
4. Medidas resistentes Las siguientes son cuatro de las velocidades de datos Verizon (Mbps) de la
figura 3-1: 13.5, 10.2, 21.1, 15.1. Encuentre la media y la mediana de estos cuatro valores. A continua-
ción, determine la media y la mediana después de incluir un quinto valor de 142, que es un valor atípico.
(Una de las velocidades de datos de Verizon es 14.2 Mbps, pero 142 se utiliza aquí como un error re-
sultante de una entrada con un punto decimal faltante). Compare los dos conjuntos de resultados. ¿Qué
92   CAPÍTULO 3 Descripción, exploración y comparación de datos

                         tanto se vio afectada la media por la inclusión del valor atípico? ¿Cuánto fue afectada la mediana por
                         la inclusión del valor atípico?
                         Pensamiento crítico. En los ejercicios 5 a 20, tenga cuidado con las pequeñas trampas. Cada
                         uno de estos ejercicios implica alguna característica capciosa. Encuentre la (a) media (b) mediana,
                         (c) moda, (d) mitad del rango, y luego responda la pregunta dada.
                         5. Números de jugadores de fútbol americano A continuación se listan los números de camiseta
                         de 11 jugadores seleccionados al azar del equipo de los Halcones marinos de Seattle, cuando ganaron
                         el Súper Tazón XLVIII. ¿Qué nos dicen los resultados?
                                                   89 91 55 7 20 99 25 81 19 82 60
                         6. Pesos de jugadores de fútbol americano A continuación se listan los pesos en libras de 11
                         jugadores seleccionados al azar del equipo de los Halcones marinos de Seattle, cuando ganaron el Sú-
                         per Tazón XLVIII (los mismos jugadores del ejercicio anterior). ¿Es probable que los resultados sean
                         representativos de todos los jugadores de la NFL?
                                            189 254 235 225 190 305 195 202 190 252 305
                         7. Valor neto de celebridades A continuación se listan los mayores valores netos (en millones de
                         dólares) de las celebridades. Las celebridades son Tom Cruise, Will Smith, Robert De Niro, Drew Ca-
                         rey, George Clooney, John Travolta, Samuel L. Jackson, Larry King, Demi Moore y Bruce Willis. ¿Qué
                         nos dicen los resultados sobre la población de todas las celebridades? Sobre la base de la naturaleza de
                         las cantidades, ¿qué se puede inferir acerca de su precisión?
                                               250 200 185 165 160 160 150 150 150 150
                         8. Lo que pasa en Las Vegas... A continuación se listan los precios en dólares por una noche en
                         diferentes hoteles ubicados en Las Vegas Boulevard (the “Strip”). Si usted decide hospedarse en uno de
                         estos hoteles, ¿qué estadístico es más relevante, además de las medidas de tendencia central? Aparte del
                         precio, identifique otro factor importante que afectaría su elección.
                                                      212 77 121 104 153 264 195 244
                         9. Huracanes A continuación se listan las cantidades de huracanes que se produjeron en el Atlántico
                         cada año. Los datos se dan en orden anual, a partir del año 2000. ¿Qué característica importante de los
                         datos no es revelada por ninguna de las medidas de tendencia central?
                                                   8 9 8 7 9 15 5 6 8 4 12 7 8 2
                         10. Chícharos en una vaina Los biólogos han realizado experimentos para determinar si una falta de
                         bióxido de carbono en el suelo afecta a los fenotipos de los chícharos. A continuación se listan los códigos
                         del fenotipo, donde 1 5 amarillo liso, 2 5 verde liso, 3 5 amarillo corrugado y 4 5 verde corrugado.
                         ¿Se pueden obtener las medidas de tendencia central para estos valores? ¿Los resultados tienen sentido?
                              2 1 1 1 1 1 1 4 1 2 2 1 2 3 3 2 3 1 3 1 3 1 3 2 2
                         11. Precios de televisores A continuación se listan los precios de venta (en dólares) de televisores de
                         60 pulgadas o más, los cuales fueron calificados como “las mejores compras” por la revista Consumer
                         Reports. ¿Los datos estadísticos resultantes son representativos de la población de todos los televisores
                         de 60 pulgadas o más? Si usted decide comprar uno de estos televisores, ¿qué dato estadístico es más
                         relevante, además de las medidas de tendencia central?
                                 1800 1500 1200 1500 1400 1600 1500 950 1600 1150 1500 1750
                         12. Radiación del teléfono celular A continuación se listan las tasas de absorción de radiación
                         medidas (en W/kg) correspondientes a los siguientes teléfonos celulares: iPhone 5S, BlackBerry Z30,
                         Sanyo Vero, Optimus V, Droid Razr, Nokia N97, Samsung Vibrant, Sony Z750a, Kyocera Kona, LG G2
                         y Virgin Mobile Supreme. Los datos provienen de la Comisión Federal de Comunicaciones (FCC, por
                         sus siglas en inglés). Los medios de comunicación a menudo informan sobre los peligros de la radiación
                         de los teléfonos celulares como una causa de cáncer. La FCC tiene un estándar de que la tasa de absor-
                         ción de un teléfono celular debe ser de 1.6 W/kg o menos. Si usted está planeando comprar un teléfono
                         celular, ¿es alguna de las medidas de tendencia central el estadístico más importante? ¿Hay otro dato
                         estadístico que sea más relevante? Si es así, ¿cuál?
                                        1.18 1.41 1.49 1.04 1.45 0.74 0.89 1.42 1.45 0.51 1.38
3-1 Medidas de tendencia central   93

13. Cafeína en bebidas A continuación se indican las cantidades medidas de cafeína (mg por 12
onzas de bebida) obtenidas en una lata de cada una de 20 marcas (7-UP, A & W Root Beer, Cherry
Coke, ...). ¿Son los estadísticos representativos de la población de todas las latas de las mismas 20 mar-
cas consumidas por los estadounidenses?

                   0 0 34 34 34 45 41 51 55 36 47 41 0 0 53 54 38 0 41 47

14. Muertes de bomberos A continuación se listan las cantidades de heroicos bomberos que perdie-
ron sus vidas en Estados Unidos anualmente mientras combatían incendios forestales. Las cantidades
están ordenadas por año, comenzando en 2000. ¿Qué característica importante de los datos no es reve-
lada por ninguna de las medidas de tendencia central?

                    20 18 23 30 20 12 24 9 25 15 8 11 15 34

15. Longitud de los pies A continuación se listan las longitudes en pulgadas de los pies de mujeres
del ejército seleccionadas al azar, medidos en el sondeo antropométrico de 1988 (ANSUR, abreviatura
en inglés). Estos datos estadísticos, ¿son representativos de la población actual de todas las mujeres del
ejército?

                     10.4 9.3 9.1 9.3 10.0 9.4 8.6 9.8 9.9 9.1 9.1

16. Universidades más caras A continuación se listan los costos anuales (en dólares) de matrícula
y colegiaturas en las 10 universidades más caras de Estados Unidos para un año reciente (con base
en datos de US News & World Report). Las universidades listadas en orden son Columbia, Vassar,
Trinidad, George Washington, Carnegie Mellon, Wesleyan, Tulane, Bucknell, Oberlin y Union. ¿Qué
nos dice esta “lista de las 10 primeras” sobre esos costos para la población de todas las universidades
estadounidenses?

        49,138 47,890 47,510 47,343 46,962 46,944 46,930 46,902 46,870 46,785

17. Anillo de diamante A continuación se listan las cantidades en dólares que cuestan los paquetes
para propuestas matrimoniales en los diferentes estadios de las Ligas Mayores de Béisbol. Cinco de los
equipos no permiten propuestas. ¿Existen valores atípicos?

            39      50        50    50    55       55         75        85     100       115    175      175    200
           209     250       250   350   400    450         500     500        500       500 1500       2500

18. Ventas de álbumes de discos LP de vinilo A continuación se listan las ventas anuales de discos
de vinilo en Estados Unidos (millones de unidades). Las cantidades de álbumes vendidos se presentan
en orden cronológico, y la última entrada representa el año más reciente. ¿Las medidas de tendencia
central nos dan alguna información sobre una tendencia cambiante a lo largo del tiempo?

             0.3    0.6      0.8   1.1   1.1   1.4      1.4       1.5    1.2       1.3    1.4   1.2     0.9   0.9
             1      1.9      2.5   2.8   3.9   4.6      6.1

19. Fumadores de California En la encuesta Entrevista sobre Salud en California, se entrevistó a
adultos seleccionados al azar. Una de las preguntas fue acerca de cuántos cigarrillos fumaban al día, y
los resultados se listan a continuación para 50 encuestados seleccionados aleatoriamente. ¿Qué tan bien
reflejan los resultados los hábitos del tabaquismo de los adultos en California?

                         9 10 10 20 40 50                     0    0     0     0     0    0     0   0    0
                         0     0    0    0     0        0     0    0     0     0     0    0     0   0    0
                         0     0    0    0     0        0     0    0     0     0     0    0     0   0    0
                         0     0    0    0     0

20. Citas rápidas En un estudio sobre citas rápidas realizado en la Universidad de Columbia, se pidió
a las mujeres que evaluaran el atractivo de sus acompañantes masculinos; a continuación se lista una
muestra de los resultados (1 5 no atractivo, 10 5 extremadamente atractivo). ¿Se pueden utilizar los
resultados para describir el atractivo de la población de varones adultos?

           5 8 3 8 6 10 3 7 9 8 5 5 6 8 8 7 3 5 5 6 8 7 8 8 8 7
94   CAPÍTULO 3 Descripción, exploración y comparación de datos

                         En los ejercicios 21 a 24, encuentre la media y la mediana para cada una de las dos muestras, luego
                         compare los dos conjuntos de resultados.
                         21. Presión arterial Una muestra de mediciones de presión arterial se toma del conjunto de datos
                         1 “Datos corporales” del apéndice B, y los valores (mm Hg) se relacionan de manera que 10 sujetos
                         tienen medidas sistólicas y diastólicas. (La presión sistólica es una medida de la fuerza de la sangre
                         empujada a través de las arterias, mientras que la presión diastólica es una medida de la presión arterial
                         mientras el corazón está en reposo entre latidos). ¿Son las medidas de tendencia central los mejores
                         estadísticos que pueden obtenerse de estos datos?
                                         Sistólica:    118 128 158          96 156 122 116 136 126 120
                                         Diastólica:   80     76     74     52   90     88     58    64    72   82
                         22. Robo de parquímetros A continuación se listan los montos (en millones de dólares) recaudados
                         en parquímetros por Brinks y otras empresas en la ciudad de Nueva York durante períodos similares. Se
                         utilizó un conjunto de datos más amplio para condenar a cinco empleados de Brinks por hurto mayor.
                         Los datos fueron proporcionados por el abogado de la ciudad de Nueva York, y se pueden encontrar
                         en el sitio web de Data and Story Library (DASL). ¿Los datos limitados que aparecen aquí muestran
                         evidencia de robo por los empleados de Brinks?

                                   El contratista de recaudación
                                                                     1.3 1.5 1.3 1.5 1.4 1.7 1.8 1.7 1.7 1.6
                                   fue Brinks
                                   El contratista de recaudación
                                                                     2.2 1.9 1.5 1.6 1.5 1.7 1.9 1.6 1.6 1.8
                                   no fue Brinks

                         23. Pulsos A continuación se listan los pulsos (latidos por minuto) de muestras de hombres y mujeres
                         adultas (del conjunto de datos 1 “Datos corporales” en el apéndice B). ¿Parece haber una diferencia?

                                   Hombres:      86 72 64 72 72 54 66 56 80 72 64 64 96 58 66
                                   Mujeres:      64 84 82 70 74 86 90 88 90 90 94 68 90 82 80

                         24. Filas en el banco Los tiempos de espera (en segundos) de los clientes en el Banco de Ahorro de
                         Madison se registran con dos configuraciones: línea de clientes única y líneas de clientes individuales.
                         Examine cuidadosamente los datos para determinar si hay una diferencia entre los dos conjuntos de
                         datos que no sea evidente a partir de una comparación de las medidas de tendencia central. Si es así,
                         ¿cuál es?

                                 Línea única            390    396    402    408      426    438    444   462   462   462
                                 Líneas individuales    252    324    348    372      402    462    462   510   558   600

                         Grandes conjuntos de datos del apéndice B. En los ejercicios 25 a 28, considere el conjunto de
                         datos indicado en el apéndice B. Use software o una calculadora para encontrar las medias y las
                         medianas.
                         25. Tornados Utilice las medidas en la escala F de tornados listadas en el conjunto de datos 22 “Tornados”
                         del apéndice B. Entre los 500 tornados, ¿a cuántos les faltan mediciones de la escala F? (Precaución: En
                         algunas tecnologías, los datos faltantes se representan mediante una constante como –9 o 9999).
                         26. Terremotos Utilice las magnitudes (en la escala de Richter) de los 600 terremotos listados en el
                         conjunto de datos 21 “Terremotos” del apéndice B. En 1989, el área de la Bahía de San Francisco fue
                         golpeada por un terremoto de 7.0 en la escala de Richter. Ese terremoto ocurrió durante el período de
                         calentamiento para el tercer juego de la Serie Mundial de béisbol. ¿Es la magnitud del terremoto de la
                         Serie Mundial un valor atípico cuando se considera en el contexto de los datos muestrales dados en el
                         conjunto de datos 21? Explique.
                         27. Temperaturas corporales Considere el conjunto de datos 3 “Temperaturas corporales” en el
                         apéndice B y use las temperaturas corporales para las 12:00 AM del día 2. ¿Los resultados respaldan o
                         contradicen la creencia común de que la temperatura corporal media es de 98.6 °F?
                         28. Nacimientos Use los pesos al nacer (en gramos) de los 400 bebés listados en el conjunto de datos
                         4 “Nacimientos” en el apéndice B. Examine la lista de pesos al nacer y haga una observación sobre esos
                         números. ¿Cómo afecta esta observación la forma en que los resultados deben redondearse?
3-1 Medidas de tendencia central   95

En los ejercicios 29 a 32, encuentre la media de los datos resumidos en la distribución de frecuen-
cias. Además compare las medias calculadas con las medias reales obtenidas utilizando la lista
original de valores de datos, que son las siguientes: (Ejercicio 29) 36.2 años; (Ejercicio 30) 44.1
años; (Ejercicio 31) 224.3; (Ejercicio 32) 255.1.

29. Edad (en años) de la mejor                      30.    Edad (en años)
       actriz al ganar el Oscar    Frecuencia             del mejor actor al
                20-29                  29                  ganar el Oscar      Frecuencia

                30-39                  34                       20-29              1

                40-49                  14                       30-39             28

                50-59                   3                       40-49             36

                60-69                   5                       50-59             15

                70-79                   1                       60-69              6

                80-89                   1                       70-79              1

31.    Conteo de plaquetas en                       32.     Conteo de
        la sangre de hombres                               plaquetas en
           (1000 células/ml)       Frecuencia              la sangre de
                  0-99                   1                 mujeres (1000
                                                            células/ml)        Frecuencia
               100-199                 51
                                                               100-199             25
               200-299                 90
                                                               200-299             92
               300-399                 10
                                                               300-399             28
               400-499                   0
                                                               400-499              0
               500-599                   0
                                                               500-599              2
               600-699                   1

33. Media ponderada Un alumno del autor obtuvo calificaciones de A, C, B, A y D. Estos cursos
tenían las siguientes cantidades correspondientes de horas de crédito: 3, 3, 3, 4 y 1. El sistema de cali-
ficación asigna puntos a las calificaciones con letras como sigue: A 5 4; B 5 3; C 5 2; D 5 1; F 5 0.
Calcule el promedio de calificaciones y redondee el resultado con dos decimales. Si la lista del decano
requiere un promedio de 3.00 o mayor, ¿este estudiante entrará a la lista del decano?
34. Media ponderada Una alumna del autor obtuvo calificaciones de 63, 91, 88, 84 y 79 en sus cinco
exámenes regulares de estadística. Su calificación en el examen final fue 86 y en su proyecto de clase
obtuvo 90. Su calificación combinada en las tareas fue 70. Los cinco exámenes regulares representan
60% de la calificación final, el examen final 10%, el proyecto 15% y las tareas 15%. ¿Cuál es su califi-
cación media ponderada? ¿Qué calificación con letra obtuvo (A, B, C, D o F)? Suponga que una media
de 90 o más es una A, una media de 80 a 89 es una B, y así sucesivamente.

  3-1 Más allá de lo básico
35. Grados de Libertad Cinco frecuencias de pulso aleatoriamente seleccionadas del conjunto de
datos 1 “Datos corporales” en el apéndice B tienen una media de 78.0 latidos por minuto. Cuatro de los
pulsos son 82, 78, 56 y 84.
a. Encuentra el valor faltante.

b. Necesitamos elaborar una lista de n valores que tengan una media específica conocida. Somos libres
de seleccionar los valores que deseemos para algunos de los n valores. ¿Cuántos de los n valores pueden
asignarse libremente antes de que los valores restantes queden determinados? (El resultado se conoce
como el número de grados de libertad).
36. Datos censurados El conjunto de datos 15 “Presidentes” del apéndice B muestra el número de
años que vivieron los presidentes estadounidenses después de su primera toma de poder. Hasta la fecha,
cinco de los presidentes siguen vivos y después de su primera asunción han vivido 37, 25, 21, 13 y
5 años. Podemos usar los valores de 371, 251, 211, 131 y 51, donde los signos positivos indican
96   CAPÍTULO 3 Descripción, exploración y comparación de datos

                         que el valor real es igual o mayor que el valor actual. (Se dice que estos valores están censurados en el
                         momento actual en que se compiló a lista). Si se usan los valores en el conjunto de datos 15 y se ignoran
                         los presidentes que todavía están vivos, ¿cuál es la media? Si utiliza los valores dados en el conjunto de
                         datos 15 junto con los valores adicionales de 371, 251, 211, 131 y 51, ¿qué sabemos acerca de la
                         media? ¿Los dos resultados difieren mucho?
                         37. Media recortada Debido a que la media es muy sensible a los valores extremos, se dice que no es una
                         medida de tendencia central resistente. Al eliminar algunos valores bajos y altos, la media recortada se
                         hace más resistente. Para encontrar la media recortada del 10% para un conjunto de datos, primero ordene
                         los datos, luego elimine el 10% de los valores inferiores y el 10% de los valores superiores, luego calcule
                         la media de los valores restantes. Utilice las cargas axiales (en libras) de las latas de aluminio que se listan
                         a continuación (del conjunto de datos 30 “Latas de aluminio” en el apéndice B) para latas de 0.0111 pulga-
                         das de espesor. Una carga axial es la fuerza a la que la tapa de una lata colapsa. Identifique cualquier valor
                         atípico, luego compare la mediana, la media, la media recortada del 10% y la media recortada del 20%.
                                          247 260 268 273 276 279 281 283 284 285 286 288
                                          289 291 293 295 296 299 310 504
                         38. Media armónica La media armónica se utiliza a menudo como una medida de tendencia central
                         para conjuntos de datos que consisten en tasas de cambio, como velocidades. Se encuentra al dividir el
                         número de valores n por la suma de los recíprocos de todos los valores, expresados como
                                                                            n

                                                                          ax
                                                                              1

                         (Ningún valor puede ser cero). El autor condujo 1163 millas para ir a una conferencia en Orlando, Flori-
                         da. En el viaje de ida, el autor se detuvo durante la noche, y la velocidad media de principio a fin fue de
                         38 millas por hora. Durante el viaje de regreso, se detuvo sólo por comida y combustible, y la velocidad
                         media desde el principio hasta el final fue de 56 millas por hora. Encuentre la media armónica de 38 mi/h
                         y 56 mi/h para encontrar la verdadera velocidad “media” del viaje de ida y vuelta.
                         39. Media geométrica La media geométrica se utiliza a menudo en los negocios y la economía para
                         encontrar tasas de cambio promedio, tasas de crecimiento promedio o razones medias. Para encontrar la
                         media geométrica de n valores (donde todos son positivos), primero multiplique los valores, luego encuen-
                         tre la raíz n-ésima del producto. Por un período de 6 años, el dinero depositado en certificados anuales de
                         depósito tenía tasas de interés anual de 5.154%, 2.730%, 0.488%, 0.319%, 0.313% y 0.268%. Identifique
                         el porcentaje de crecimiento único que es igual que las cinco tasas de crecimiento consecutivas, calculan-
                         do la media geométrica de 1.05154, 1.02730, 1.00488, 1.00319, 1.00313 y 1.00268.
                         40. Media cuadrática La media cuadrática (o la raíz cuadrada media, o R.C.M.) se utiliza en
                         aplicaciones físicas, como sistemas de distribución de energía. La media cuadrática de un conjunto de
                         valores se obtiene al elevar al cuadrado cada valor, sumar esos cuadrados, dividir la suma por el número
                         de valores n, y luego obtener la raíz cuadrada del resultado, como se indica a continuación:

                                                                                          Σx2
                                                                 Media cuadrática =
                                                                                         A n

                         Encuentre la R.C.M. de los siguientes voltajes medidos en corrientes domésticas: 0, 60, 110, –110, –60,
                         0. ¿Cómo se compara el resultado con la media?
                         41. Mediana Cuando los datos se resumen en una distribución de frecuencias, la mediana se puede
                         encontrar identificando primero la clase mediana, que es la clase que contiene la mediana. Asumimos
                         entonces que los valores de esa clase están uniformemente distribuidos e interpolamos. Si n expresa la
                         suma de todas las frecuencias de clase, y m expresa la suma de las frecuencias de clase que preceden a
                         la clase mediana, la mediana se puede estimar como se muestra a continuación.
                                                                                                     n + 1
                                                                                                    a      b - 1m + 12
                               (límite inferior de la clase mediana) + (anchura de clase) °            2                      ¢
                                                                                               frecuencia de la clase mediana
                         Utilice este procedimiento para encontrar la mediana de la distribución de frecuencias dada en la tabla 3-2
                         de la página 88. ¿Cuánto se aleja este resultado de la mediana encontrada en la lista original de tiempos de
                         servicio en McDonald’s del conjunto de datos 25 “Comida rápida” en el apéndice B?
También puede leer