ESTADISTICA

Escrito por lupitaluisalbert17 20-04-2010 en General. Comentarios (10)

http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif Estadística: http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif

La estadística es una colección de métodos para planificar y realizar  experimentos, obtener datos y luego analizar, interpretar, y formular una conclusión basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar información numérica  o cualitativa, de manera que pueda llevar a conclusiones válidas.

        La estadística se puede definir como la ciencia que recopila, organiza, analiza e interpreta la información numérica o cualitativa, mejor conocida como datos, de manera que pueda llevar a conclusiones válidas.

 La estadística descriptiva es la ciencia que recopila , organiza e interpreta la información numérica ó cualitativa. Los periódicos, revistas, radio y televisión usan la estadística descriptiva para informar y persuadirnos acerca de ciertas acciones a tomar y en la formación de opiniones.

 


    La estadística inferencial es la ciencia que interpreta información de manera que pueda llevar a conclusiones válidas. Los gobiernos y las organizaciones utilizan la estadística para tomar decisiones que afectan directamente  nuestras vidas

Una muestra es un subconjunto de una población. Las muestras representativas de una  población son útiles ya que facilitan el manejo de los datos. Una muestra es representativa de la población si al escogerla cada elemento tiene  la misma probabilidad de salir o de ser escogido. 

 

Población

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
 

Medidas de Tendencia Central

 Las medidas de tendencia central son la  media, la mediana y la moda.
 


La media es la suma de los valores de los elementos  dividida por la cantidad de éstos. Es conocida también como promedio, o media aritmética.

 

 
 

Fórmula de la media:
 

Media Poblacional = µ = X
                                          N 
 

= sumatoria http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/tongue.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif
µ = media
N = número de elementos
X = valores o datos

Esta fórmula se lee:

“mu es igual a la sumatoria de x dividido entre N”
 

                                        _
Media Muestral:      x  =  x
                                          n
 
 

Ejemplo:  Calcule la media de los siguientes  números:

 10 , 11 , 12 , 12 , 13
 

1. Sumar las cantidades       < 10 + 11 + 12 + 12 + 13 = 58>
2. Dividir la suma por la cantidad de elementos    < 58/5>
3. El resultado es la media    <11.6>
 

Por lo tanto, la media de los 5 números  es 11.6. Note que la media resulta un número que está entre el rango de elementos; en este caso, 11.6 está entre 10,11,12 y 13.
 
 


La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan.

Fórmula de la mediana:

Mediana =  X[n/2 +1/2]            La parte de [n/2 + 1/2] representa la posición.
 

Donde X es la posición de los números y n  es el número de elementos.

Ejemplo:  Buscar la mediana de los siguientes números:

 2   4   1   3  5   6   3

Primero, hay que ordenarlos:

 1       2       3       3       4       5       6
  X  X2     X3      X4     X5    X6     X7        ( Las posiciones de los números)
 

Mediana =  X[7/2 + ½]

  X[3.5 + .5]          < Se cambió el ½ a .5>

  X4                 < La mediana está en la posición 4>

por lo tanto la mediana es 3

 

 

 


 

Ejemplo: Buscar la mediana del ejemplo anterior de la media.

Números del ejemplo anterior:  10,12,13,12,11

1. Hay que ordenarlos, en este caso  de forma ascendente; aunque también puede ser descendente.

10 , 11 , 12 , 12 , 13

2. Buscar el elemento intermedio.
 

10 , 11 , 12 , 12 , 13
 

El elemento del medio es 12.
 

Por lo tanto, la mediana es 12.
 

Nota:  Si el número de elementos es impar, la mediana es el número del elemento intermedio. Si el número de elementos es par, se hace el cómputo mostrado en el ejemplo siguiente:

Buscar la mediana de :

  15 , 13 , 11 , 14 , 16 , 10 , 12 , 18

Como el número de elementos es par, hay que utilizar los dos números intermedios.
 

10 , 11 , 12 , 13 , 14 , 15 , 16, 18    ( ordenados)
 
 

                     13 y 14
 

Ahora, para buscar la mediana:

 1. Sumar ambos números.           <13 + 14 = 27>
 2. Dividirlo entre 2.          < 27/2 = 13.5>
 3. El resultado es la mediana.       < 13.5>
 
 

 

La moda es el valor que se presenta el mayor número de veces.

Ejemplo 1: Buscar la moda de:

  5     12    9    5    8    7    1

Como la moda es el número que más se repite, la moda es 5.
 

Ejemplo 2: Buscar la moda de:

14    16    18    16    15    12    14    14    16    18   20   16   16

El 14 se repite 3  veces.
El 18 se repite 2  veces.
El 16 se repite 5 veces.

Por lo tanto, la moda es 16.
 

Ejemplo 3:  Buscar la moda de :

   23    35    45    33    47    31     29     22

Como ningún número se repite, no  tiene moda.


 

Distribución normal.

 

http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif Gráficahttp://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif

Una gráfica es una representación de datos, generalmente numéricos, mediante líneas, superficies o símbolos, para ver la relación que guardan entre sí. También puede ser un conjunto de puntos, que se plasman en coordenadas cartesianas, y sirven para analizar el comportamiento de un proceso, o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. La representación gráfica permite establecer valores que no han sido obtenidos experimentalmente, es decir, mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental).

La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas, a la descripción e interpretación de datos e inferencias sobre éstos. Forma parte de los programas estadísticos usados con los ordenadores. Autores como Edward R. Tufte han desarrollado nuevas soluciones de análisis gráficos.

Existen diferentes tipos de gráficas, que se pueden clasificar en:

  • Numéricas: con imágenes visuales que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población.
  • Lineales: se representan los valores en dos ejes cartesianos ortogonales entre sí. Las gráficas lineales se recomiendan para representar series en el tiempo, y es donde se muestran valores máximos y mínimos; también se utilizan para varias muestras en un diagrama.
  • De barras: se usan cuando se pretende resaltar la representación de porcentajes de datos que componen un total. Una gráfica de barras contiene barras verticales que representan valores numéricos, generalmente usando una hoja de cálculo. Las gráficas de barras son una manera de representar frecuencias; las frecuencias están asociadas con categorías. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés.
  • Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Está formado por rectángulos unidos a otros, cuyos vértices de la base coinciden con los limites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo.
  • Circulares: gráficas que nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.

 

 

GRÁFICAS DE VARIABLES

Una grafica de control X-R, en realidad son dos gráficas en una, una representa los promedios de las muestras de la (gráfica X) y la otra representa los rangos (gráfica R), deben construirse juntas, ya que la gráfica X, nos muestra cualquier cambio en la media del proceso y la gráfica R nos muestra cualquier cambio en la dispersión del proceso, para determinar las X y R de las muestras, se basan en los mismos datos.

El uso particular de la grafica X-R es que nos muestra los cambios en el valor medio y en la dispersión del proceso al mismo tiempo, además es una herramienta efectiva para verificar anormalidades en un proceso dinámicamente.

Algunos puntos importantes a considerar previo a la elaboración de esta gráfica son:

  • Propósito de la gráfica

  • Variable a considerar

  • Tamaño de la muestra

  • Tener un criterio para decidir si conviene investigar causas de variación del proceso de producción.

  • Familiarizar a l personal con el uso de esta gráfica.

El proceso que se debe seguir para construir una grafica es:

La construcción de una gráfica de rangos y promedio resulta de formar una unidad, tanto de la gráfica de promedios como de la de rangos.

Consta de dos secciones, parte superior se dedica a los promedios, y la parte inferior a los rangos.

En el eje vertical se establece la escala, a lo largo del eje horizontal se numeran las muestras.

En la gráfica se relacionan estos promedios con los intervalos durante los cuales se tomaron la muestras. En el eje vertical se indican los valores correspondientes a los valores de muestras. En el eje horizontal se señalan los periodos de tiempo en los que se toman las muestras a semejanza que la de promedios.

La interpretación de esta grafica de promedio y rango seria que a partir de los datos de la grafica de promedios y rangos, podemos determinar el valor central del proceso y su aplicación.

Mediante este proceso esta bajo control cuando no muestra ninguna tendencia y además ningún punto sale de los limites.

Se describen los distintos tipos de tendencia, que son patrones de comportamiento anormal de los puntos (inestabilidad o proceso fuera de control estadístico)

GRAFICA DE MEDIAS Y DESVIACIONES ESTANDAR

Esta gráfica es el instrumento estadístico que sirve para estudiar el comportamiento de un proceso de manufactura, considerando como indicador la desviación estándar.

La estructura general, esta constituida por dos porciones, una se destina al registro de los promedios de la característica de calidad en consideración y otra para controlar la variabilidad del proceso.

La ventaja de usar esta gráfica es que para estos valores de n la desviación estándar es más sensible a cambios pequeños que el rango.

Dentro del procedimiento de construcción para dicha grafica incluye cálculos de límites de control para las dos partes que constituyen la gráfica y la graficación de los promedios y desviaciones estándar obtenidos en cada subgrupo.

Es importante la variabilidad del proceso de control, al iniciar la construcción de la gráfica, si el proceso no muestra estabilidad estadística, entonces la parte correspondiente a los promedios no será confiable dado que los límites de control de X dependen del valor medio de s.

GRAFICAS DE MEDIANAS Y RANGOS

Es la herramienta estadística que permite evaluar el comportamiento del proceso a partir de la mediana y del rango. La estructura es la común a todas las gráficas de control para variables.

La parte superior registra el valor medio de las características de calidad en estudio, y la parte inferior indica la variabilidad de la misma.

El cálculo de la mediana, es muy sencillo, de modo que utilizar esta gráfica par monitorear el proceso es atractivo para el usuario.

El uso de esta gráfica en procesos que actualmente muestren estabilidad estadística. Como toda gráfica de control, el usuario obtendrá, de una manera continua, información rápida y eficiente del proceso en estudio; para verificar que el proceso continua en control o bien para reconocer la aparición de causas especiales de variación.

Para el procedimiento de construcción de esta gráfica es muy similar al de la gráfica de medias y rangos; estos es calculando los límites de control, luego se grafican los puntos y se integran los límites de control y líneas centrales, por último se efectúa la lectura de la gráfica, a fin de ver si el proceso continua estable o bien percibir alguna situación de anormalidad.

GRAFICA DE CON TROL POR ATRIBUTOS

Las características de calidad que no pueden ser medidas con una escala numérica, se juzga a través de un criterio más o menos subjetivo.

Los datos se presentan con periodicidad a la gerencia y con ellos se integran números índices, que son muy importantes en el desarrollo de una empresa, estos pueden referirse al producto, desperdicio rechazo de materiales.

Dentro de la clasificación de las características calidad por atributos se requiere:

  • De un criterio

  • De una prueba

  • De una decisión

El criterio se establece de acuerdo con las especificaciones.

La prueba consiste en la operación que se realiza para averiguar la existencia o no del criterio establecido.

La decisión determina que título debe darse al productos, es decir si paso o no pasa.

TIPOS DE GRAFICA DE CONTROL POR ATRIBUTOS

P Porcentaje de Fracción Defectiva

np Número de Unidades Defectivas por muestra constante.

U Proporción de Defectos

C Número de Defectos por unidad

GRAFICAS POR PORCENTAJE DE DE FRACCIÓN DEFECTIVA

El porcentaje de artículos defectivos se expresa como fracción decimal para el cálculo de los límites de control.

La fracción sin embargo, se convierte generalmente en porcentaje cuando se transcribe en la gráfica y se usa en la presentación general de los resultados.

Las muestras que se utilizan para elaborar esta gráfica son de tamaño variable. Las muestras de tamaño grande permiten evaluaciones más estables del desarrollo del proceso y son más sensibles a cambios pequeños.

Se utiliza cuando no podemos tener el tamaño de muestra (n) constante, en la práctica es muy común.

El defectivo son aquellas piezas que no cumplen con especificaciones y es causa de rechazo.

Los principales objetivos de la gráfica P son:

Poner a la atención de la dirección cualquier cambio en el nivel medio de calidad.

Descubrir los puntos fuera de control que indican modelos de inspección relajados.

Proporcionar un criterio para poder juzgar si lotes sucesivo pueden considerarse como representativos de un proceso.

Esto puede influir convenientemente en la severidad del criterio de aceptación.

GRÁFICA DE NUMEROS  DE UNIDADES DEFECTIVAS POR MUESTRA

Esta gráfica es el instrumento estadístico que se utiliza cuando se desea graficar precisamente las unidades disconformes, y no el porcentaje que éstas representan, siendo constante el tamaño de la muestra.

Es necesario establecer la frecuencia para la toma de datos, teniendo en cuenta que los intervalos cortos permiten una rápida retroalimentación del proceso.

Los principales objetivos de la gráfica np son:

Conocer las causas que contribuyen al proceso

Obtener el registro histórico de una o varias características de una operación con el proceso productivo.

GRAFICA C NUMERO DE DEFECTOS POR UNIDAD

La gráfica c estudia el comportamiento de un proceso considerando el número de defectos encontrados al inspeccionar una unidad de producto.

La gráfica hace uso del hecho de que artículo es aceptable aunque presente cierto número de defectos.

Los objetivos de la gráfica c son:

Reducir el costo relativo al proceso

Informar a los supervisores de producción y a la administración acerca del nivel de calidad.

Determinar que tipo de defectos no son permisibles en un producto informar de la probabilidad de ocurrencia de los defectos en una unidad.

Estas graficas deben utilizarse solo cuando el área de oportunidad de encontrar defectos permanece constante.

GRAFICA u PROPORCIÓN DE DEFECTOS

La gráfica u puede ser usada bajo cada una de las siguientes suposiciones:

Como substituto de la gráfica c cuando el tamaño muestral.

Cuando el tamaño muestral varía, de que modo la gráfica c no puede usarse. http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif

 

GRAFICOS ESTADISTICOS

En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa.

La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.

Tipos de gráficos estadísticos

  • Barras

  • Líneas

  • Circulares

  • Áreas

  • Cartogramas

  • Mixtos

  • Histogramas


 

 'Gráficos estadísticos'

 

Gráficos de barras horizontales

Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.

  • para una serie

  • para dos o más series


 'Gráficos estadísticos'Gráfica de barras horizontalespara ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la población de un país ficticio llamado "Timbuctulandia":

 

Gráficos de barras proporcionales 

 

 

'Gráficos estadísticos'

 

Gráficos de barras comparativas

Se utilizan para comparar dos o más series, para comparar valores entre categorías. 

Las barras pueden ser:

  • Verticales

  • horizontales

'Gráficos estadísticos'

 

Gráficos de líneas 

En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. 

Se pueden usar para representar: 

  • una serie

  • dos o más series

'Gráficos estadísticos'

Estos gráficos se utilizan para representar valores con grandes incrementos entre sí.

'Gráficos estadísticos'

GRAFICA DE PASTEL

Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar.

Se pueden ser: 

  • En dos dimensiones

  • en tres dimensiones

'Gráficos estadísticos'para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el año de 1992 se puede usar algo así como sigue

Gráfica circular o de pastel. Fuente: ANUIES, 1995.

De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa "rebanada" de la gráfica y separarla de las demás:

Gráfica circular o de pastel. Fuente: ANUIES, 1995.

Gráficos de Áreas

En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo.
Pueden ser: 

  • Para representar una serie

  • para representar dos o más series

  • en dos dimensiones

  • en tres dimensiones.

'Gráficos estadísticos'

Gráficos Mixtos

En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series.

Pueden ser: 

  • en dos  dimensiones

  • en tres dimensiones.

 

     

'Gráficos estadísticos'

Histogramas

Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma. 

'Gráficos estadísticos'

 Histograma

Los  dispersogramas

Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados  cartesianos, cada punto corresponde a un par de valores de  datos x e y de un mismo elemento suceso.

'Gráficos estadísticos'

Pictogramas

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos.

Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma.


Pueden ser: 

 

  • En dos dimensiones

  • En tres dimensiones

Pictograma

Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una gráfica de dispersión. Por ejemplo, el ejemplo de la izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales

Gráfica de dispersiónGráfica de dispersión

 


 

Un tipo de gráfico similar a las gráficas de dispersión son las gráficas de burbujas, en las cuales se presenta la dispersión de las observaciones de la misma forma que aquéllas, pero se le añade la posibilidad de visualizar otra variable representada en el tamaño del punto, pues éstos se convierten en círculos (burbujas) con radios proporcionales a las magnitudes que representan.

Gráfica de burbujas

 

GRAFICA OJIVA

es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por ésto la aplicación de la técnica es parcial):

  1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho.
  2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. 

Ojiva mayor queOjiva menor que

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que está sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se diría: después de las 4:00 horas). De forma análoga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el número de observaciones menores que la frontera señalada (en caso de tiempos sería el número de observaciones antes de la hora que señala la frontera).

Si se utiliza una distribución porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que según sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribución porcentual:

Ojiva menor que porcentual

gráfica de áreas, la cual consiste en rellenas el área que se encuentre debajo de las líneas que resultan de una gráfica de líneas.

 

Gráfica de áreas. Fuente:  Revista "Ciencia y Desarrollo", 1994, XIX(114):58.

DE LOS DATOS RECOLECTADOS EN UNA INVETIGACION SE OBTUVIERON LOS SIGUIENTES RESULTADOS DE LOS CUALES DEBEMOS OBTENER EL BANGO,Y EL RANGO,LA MARCA DE  CLASE, FRECUENCIA, FRECUENCIA ACUMULADA, FRECUENCIA RELATIVA FRECUENCIA PORCENTUAL, CON UNA VARIACION DE .5 PARA OBTENER LOS LIMITES REALES DE CLASE ADEMAS GRAFIQUE:

 

32

46

55

26

35

55

35

23

90

28

52

44

19

43

60

23

32

80

16

96

40

21

46

63

32

60

78

23

28

70

27

18

72

46

59

85

46

17

60

42

27

81

56

63

96

17

44

50

86

63

40

75

71

91

33

16

30

80

44

38

83

90

92

96-16=80+1=81_RANGO                                                                                       96-16=80/2=40_RANGO ½ RAIZ DE 63 ENTRE 7.9= 8                                                                                   81/8=10.1_10_INTERVALO              40/8=5_INTERVALO                                                                                        

Intervalo

intervalo

frecuencia

Frecuencia acumulada

Frecuencia relativa

Frecuencia acumulada

Marca de clase

Frecuencia

%

l.r.inf

l.r.s

16-21

8

8

0.12

0.12

18.5

12

15.5

21.5

22-26

3

11

0.04

0.16

24

4

21.5

26.5

27-31

5

16

0.07

0.23

29

7

26.5

31.5

32-36

7

23

0.11

0.34

34

11

31.5

36.5

37-41

3

26

0.04

0.38

39

4

36.5

41.5

42-46

9

35

0.14

0.52

44

14

41.5

46.5

47-51

1

36

0.01

0.53

49

1

46.5

51.5

52-54

4

40

0.06

0.59

54

6

81.5

56.5

57-61

4

44

0.06

0.65

59

6

56.5

61.5

62-66

1

45

0.03

0.68

64

3

61.5

66.5

67-71

3

48

0.04

0.72

69

4

66.5

71.5

72-76

2

50

0.03

0.75

74

3

71.5

76.5

77-81

4

54

0.06

0.81

79

6

76.5

81.5

82-86

 

3

57

0.04

0.85

84

4

81

 

http://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif Muestrahttp://lupitaluisalbert17.blogspot.es/admin/archivos/smile.gif

Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.

 

 

Muestreo

El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.

Valor

Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

 

 

Dato

Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variables estadísticas

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

 

 

 

 

 

 

Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.

Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden

 

 

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta

Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos.

 

Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos números.

 

Tipos de frecuencias

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinadO valor y el número total de datos. Se puede expresar en tantos por ciento.

Distribución de frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

 

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Ver imagen en tamaño completo

 

 

 

Diagrama de barras

Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.

Los datos se representan mediante barras de una altura proporcional a la frecuencia.

 

 

 

Polígonos de frecuencias

Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.

También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

 

Diagrama de sectores

Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.

Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.

 

Histograma

Un histograma es una representación gráfica de una variable en forma de barras.

Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.

 

 

Medidas de centralización

Moda

La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

 

La clase modal es la que tiene mayor altura.

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

 

 

Cálculo de la mediana

1 Ordenamos los datos de menor a mayor.

2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre .

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

es el símbolo de la media aritmética.

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

                            Medidas de posición

 

Cuartiles

Los cuartiles son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Deciles

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

 

Percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

 Medidas de dispersión

 

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

La desviación media se representa por

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

La desviación típica se representa por σ.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviación típica para datos agrupados

   

 

Coeficiente de variación

El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

Puntuaciones típicas

Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se llama tipificación. 

 

 

DATOS CUANTITATIVOS

Para estos existe el intervalo de clase en el cual se ordenan y agrupan del mismo tamaño y se tabulan ordenándose en las frecuencias correspondientes entonces los intervalos contienen limites reales de clase los cuales son inferior y superior que es el extremo final y inicial de cada intervalo. Y esto se saca de la siguiente manera:

 

Se determina el rango del conjunto de datos con el dato mayor y el menor que se encuentran en la muestra.

 (Rango) R=Dy – dm  y el rango intermedio DM – dm        y se le suma la

Unidad.                                                                    2

La unidad es la variación, después se determina el número de clase que se obtiene de dividir el conjunto de datos a través de la raíz cuadrada de los mismos posteriormente se distribuyen los intervalos y estos siempre deben de ser nones si cae en un par se debe tomar e numero non siguiente.

 

 EJEMPLO:

 

 

Ordena los siguientes datos en una tabla de frecuencia con su intervalo.

10

20

10

30

30

10

30

40

30

50

30

50

40

50

60

20

70

20

60

20

50

30

20

20

40

40

50

100

50

70

70

70

70

60

70

70

30

30

20

40

20

80

30

40

30

50

80

70

60

60

60

40

80

80

10

40

60

20

100

70

40

80

20

90

40

80

50

70

30

40

10

50

60

30

50

40

30

60

50

10

 

 

 

R = DM – Dm   R= 100 – 10 +1= 91   

80

= 8.9 =91/8.9=11.12 = 10.22  11

 

 

INTERVALO

FRECUENCIA

T. DE FREC.

FREC. ACU.

10-20

IIIIIIIIIIIIIII

16

16

21-31

IIIIIIIIIIIII

13

29

32-42

IIIIIIIIIIII

12

41

43-53

IIIIIIIIII

11

52

54-64

IIIIIIIII

9

61

65-75

IIIIIIIIII

10

71

76-86

IIIIII

6

77

87-97

I

1

78

98-109

II

2

80

 

 

 

 

 

 

 

 

 

 

 

 

 

 

LIMITES REALES DE CLASE

 

 Son los valores que evitan huecos entre un valor y el siguiente.

Los intervalos resultan del límite real superior que tiene que ser igual al del límite real inferior.

El límite real inferior del primer intervalo se determina restándole la mitad de la variación (0.5) y el límite real superior del primer intervalo se determina sumándole la mitad de la variación.

La marca de clase es el punto medio que se encuentra en un intervalo y se obtiene del limite real inferior mas el limite superior. Se denota con el símbolo.

(X o Mi o Mc)   Li + las

                             2

 

 Elaborar la tabla de frecuencias obteniendo los límites reales de clase con una variación de (0.5) y obtener su frecuencia acumulada.

10

15

20

35

15

40

25

35

35

25

35

87

60

77

70

98

89

98

15

20

25

30

70

45

58

55

55

65

45

34

25

89

35

60

78

34

15

70

15

70

50

70

65

12

30

55

25

24

55

35

25

66

45

75

70

70

70

75

70

15

35

45

35

65

55

60

75

75

40

55

89

19

70

65

60

70

55

70

30

55

40

89

35

30

40

100

90

25

30

53

70

15

15

29

70

80

45

77

11

56

25

65

35

25

25

35

65

55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

       R = DM – Dm   R= 100 – 10+1= 91

108

= 10.39 = 91/10.39 = 8.7     7

 

INTERVALO

FRECUENCIA

T. DE FREC.

FREC.

ACU.

Mc

10-16

IIIIIIIIIII

11

11

13

17-23

III

3

14

20

24-30

IIIIIIIIIIIIIIII

16

30

27

31-37

IIIIIIIIIIIIII

14

44

34

38-44

IIII

4

48

41

45-51

IIIIII

6

54

48

52-58

IIIIIIIIIIII

12

66

55

59-65

IIIIIIIIII

10

76

62

66-72

IIIIIIIIIIIIIII

15

91

69

73-79

IIIIIII

7

98

76

80-86

I

1

99

83

87-93

IIIIII

6

105

90

94-100

III

3

108

97

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

FRECUENCIA PORCENTUAL

 

Se obtiene de la multiplicación cada una de las frecuencias acumuladas por 100.

INTERVALO

FREC.

FREC. ACU.

FREC. R.

FREC. R. A

M. c

FREC. %

6-14

4

4

0.018

0.018

9

1.8

15-23

5

9

0.023

0.041

19

4.1

24-32

12

21

0.056

0.097

28

9.7

33-41

43

64

0.20

0.297

37

29.7

42-50

6

70

0.028

0.325

46

32.5

51-59

8

78

0.037

0.362

55

36.2

60-68

45

123

0.21

0.572

64

57.2

69-77

32

155

0.15

0.722

73

72.2

78-86

45

200

0.21

0.932

82

93.2

87-95

12

212

0.056

0.988

91

98.8

 

 
 Histograma

 

LA VARIANZA :

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente manera:

La varianza para datos no agrupados

Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética"

Matemáticamente, se expresa como:

   

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

 

Xi

 

( Xi - )

( Xi - )2

18

(18 – 25.5)=-7.4

(-7.4)2=54.76

23

(23 – 25.5)=-2.4

(-2.4)2= 5.76

25

(25 – 25.5)=-0.4

(-0.4)2= 0.16

27

(27 – 25.5)= 1.6

( 1.64)2= 2.16

34

(34 – 25.5)= 8.6

( 8.6)2 =73.96

Total

xxxx

137.20

Respuesta: la varianza de las edades es de 27.4 años

La varianza para datos agrupados

Si en una tabla de distribución de frecuencias. Los puntos medios de las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así:

Σ(Xi-)2f1

δ2 = ----------------

Σfi

Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación:

ΣXi2fi - [(ΣXifi)2/N]

δ2 = ----------------------------

N donde N=Σfi

Ejemplo:

Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias, a partir de los cuales se deberá calcular la varianza, para lo cual se construye la siguiente tabla estadística de trabajo, si se calculó anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera

 

clases

Punto medios

Xi

fi

Xi2

Xifi

X2fi

7.420 – 21.835

14.628

10

213.978

146.280

2,139.780

21.835 – 36.250

29.043

4

843,496

116.172

3,373.984

36.250 – 50.665

43.458

5

1,888.598

217.270

9,442.990

50.665 – 65.080

57.873

3

3,349.284

173.619

10,047.852

65.080 – 79.495

72.288

3

5,225.555

216.864

15,676.665

79.495 – 93.910

86.703

5

7,533.025

433.965

37,665.125

Total

XXX

30

19,053.936

1,304.190

78,346.396


= 21,649.344 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645

  • Propiedades de la varianza :
  • s siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando Xi=
  • La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
  • Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Veámoslo:

Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que )

  • Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante. Veámoslo:

Si a xi’ = xi · k tendremos (sabiendo que )

  • Si en una distribución obtenemos una serie de subconjuntos disjuntos, la varianza de la distribución inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión

Siendo

Ni è el nº de elementos del subconjunto (i)

S2i è la varianza del subconjunto (i)

LA DESVIACIÓN ESTÁNDAR

Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.

 

 

 

Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros analistas.

Cálculo de la Desviación Estándar

δ = √δ2 ó S = √S2

Ejemplo:

Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años.

Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas.

  • Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):

  • La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 è X = xi (para todo i).
  • Es la medida de dispersión óptima por ser la más pequeña.
  • La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
  • Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía.
  • Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante.

 

El Coeficiente de Variación de Pearson

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

El problema de las medidas de dispersión absolutas es que normalmente son un indicador que nos da problemas a la hora de comparar. Comparar muestras de variables que entre sí no tienen cantidades en las mismas unidades, de ahí que en ocasiones se recurra a medidas de dispersión relativas.

Un problema que se plantea, tanto la varianza como la desviación estándar, especialmente a efectos de comparaciones entre distribuciones, es el de la dependencia respecto a las unidades de medida de la variable. Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson", del que se demuestra que nos da un número independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.

Definición del Coeficiente de Variación

Donde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

  • Propiedades del Coeficiente de Variación :
  • Si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado .

Ejemplo:

Suponga que Usted trabaja en una compañía de ventas, que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de béisbol de las grandes ligas en los Estados Unidos (E,E,U,A,).

De los registros de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas mensualmente:

Vendedor A 95 105 100

Vendedor B 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%, pero Ud. Sólo le puede dar el premio de incentivo a uno de ellos. ¿Cuál usted escogería?. ¿En base a que criterio’. Explique.

Este problema se resuelve utilizando el coeficiente de variación, para estos efectos es necesario encontrar la desviación estándar trimestral de las ventas de cada uno de la siguiente manera:

Vendedor A

Xi

( Xi -  )

( Xi -  )2

95

95 – 100 = -5

(-5)2 = 25

105

105 – 100 = 5

( 5)2 = 25

100

100 – 100 = 0

( 0)2 = 0

Total

XXX

50

La desviación estándar es δ=√(50/3) = √16.667 = 4.08, luego entonces el coeficiente de variación es igual a:

δ 4.08

C.VA= --------- = ----------- = 0.0408

 100

Vendedor B

Xi

( Xi -  )

( Xi -  )2

100

100 – 100 = 0

( 0 )2 = 0

90

90 – 100 = -10

(-10)2 = 100

110

110 – 100 = 10

( 10)2 = 100

Total

XXX

200

La desviación estándar es δ=√(200/3) = √66.667 = 8.16, luego entonces el coeficiente de variación es igual a:

Respuesta: Dado que el vendedor A tiene menor coeficiente de variación, A él le corresponde recibir el premio de incentivo.

(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)

Datos no agrupados

Calcule el rango, la varianza y la desviación estándar de las observaciones que se presentan a continuación.

63 45 39 55 69 21 50 25 33 25

Problema:

Un profesor hace un examen a tres estudiantes y las puntuaciones resultantes (Xi) son: 73, 75 y 77.

  1. Hallar la media, la varianza y la desviación estándar de esta población de valores
  2. En la clase hacia un calor terrible, y hubo alarma por la amenaza de incendio durante el examen. El profesor quisiera aumentar las puntuaciones para tener en cuenta estas condiciones desafortunadas de ambientación. Un primer aumento suma 10 puntos a cada puntuación. Sea Yi = Xi+10. Halle , δ2 y δ.
  3. Un segundo aumento incrementa cada puntuación en un 10%. Sea Pi =1.1(Xi). Halle , δ2 y δ.
  4. El último aumento es una combinación de los dos primeros. Est es, cada puntuación se incrementa en un 10% y luego se suman 10 puntos más. Sea Zi = 1.1(Xi)+10. Halle . δ2 y δ..

Datos Agrupados

La distribución de frecuencias que se presenta a continuación muestra el tiempo que se necesita para envolver 130 paquetes que fueron enviados por correo en Macondo.

Calcule el rango, la varianza y la desviación estándar de la siguiente distribución de frecuencias de los datos:

Tiempo

(en minutos)

No.de paquetes

envueltos

0.5 a menos de 1.0

6

1.0 a menos de 1.5

12

1.5 a menos de 2.0

30

2.0 a menos de 2.5

42

2.5 a menos de 3.0

28

3.0 a menos de 3.5

12

Total

130

 

 

 

  • LA DISPERSIÓN.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.

La dispersión es importante porque:

  • Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
  • Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
  • Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.

 

 EL RANGO  :

Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un conjunto de datos.

Rango para datos no agrupados;

R = Xmáx.-Xmín = Xn-X1

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:

R = Xn-X1 ) = 34-18 = 16 años

Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase.

Rango para datos agrupados;

R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)

Ejemplo:

Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes:

Clases

P.M.

Xi

fi

fr

fa↓

fa↑

fra↓

fra↑

7.420 – 21.835

14.628

10

0.33

10

30

0.33

1.00

21.835 – 36.250

29.043

4

0.13

14

20

0.46

0.67

36.250 – 50.665

43.458

5

0.17

19

16

0.63

0.54

50.665 – 65.080

57.873

3

0.10

22

11

0.73

0.37

65.080 – 79.495

72.288

3

0.10

25

8

0.83

0.27

79.495 – 93.910

86.703

5

0.17

30

5

1.00

0.17

Total

XXX

30

1.00

XXX

XXX

XXX

XXX

 PROBABILIDAD

 

 

La probabilidad es una medición numérica que va de 0 a 1 de la posibilidad de que un evento ocurra. Si da cerca de 0 es improbable que ocurra el evento y si da cerca de uno es casi seguro que ocurra.

mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables.

 

 

La probabilidad constituye un importante parametro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico.

Existen diversas formas como método abstracto, como la teoría Dempster-Shafer y la teoría de la relatividad numérica,esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad.

 

 

De una baraja de 40 cartas hacemos dos extracciones sucesivas, sin devolución . Calcula la probabilidad de que:

a) las dos sean reyes.

b) una sea copas y la otra espadas

c) al menos una sea copa

 

Ejemplo 1.Se lanza una moneda y si sale cara se ponen 7 bolas blancas en una urna y si sale cruz se ponen 4 blancas. Se vuelve a lanzar la moneda y se ponen 5 o 2 bolas negras, según se saque cara o cruz. Despues se saca una bola de urna así compuesta. Veamos las distintas posibilidades:

 

 

 

 

 

P (a): nº de resultados en que ocurra a

Nº de resultados posibles

Tipos de sucesos

  • Exhaustivo: se dice que dos o más sucesos son exhaustivos si se consideran todos los posibles resultados.

Simbólicamente: p (A o B o...) = 1

  • No exhaustivos: se dice que dos o más sucesos son exhaustivos si no cubren todos los posibles resultados.
  • Mutuamente excluyentes: sucesos que no pueden ocurrir en forma simultánea:

P(A y B) = 0 y p(A o B) = p(A) + p (B)

Ejemplo: hombres, mujeres

  • No mutuamente excluyentes: sucesos que pueden ocurrir en forma simultánea:

P (A o B) = p (A) + p (B) – p (A y B)

Ejemplo: hombres, ojos cafés

  • Independientes: Sucesos cuya probabilidad no se ve afectada por la ocurrencia o no ocurrencia del otro :

P ( AI B ) = P ( A ); P ( BIA ) = P (B) Y P (A Y B) = P(A) P(B)

Ejemplo: sexo y color de ojos

  • Dependientes: sucesos cuya probabilidad cambia dependiendo de la ocurrencia o no ocurrencia del otro:

P ( AI B ) difiere de p (A); P ( BIA ) difiere de P(B);

Y P (A Y B)= P ( A ) P ( BIA )= P (B) P ( AI B )

Ejemplo: raza y color de ojos

Distribución maestral

El diagrama de árbol es muy útil para visualizar las probabilidades condicional y conjunta y en particular para el análisis de decisiones administrativas que involucran varias etapas.

EJEMPLO: una bolsa contiene 7 fichas rojas (R) y 5 azules (B), se escogen 2 fichas, una después de la otra sin reemplazo. Construya el diagrama de árbol con esta información.

 

 

 

 

EXPERIMENTO

Un experimento es un proc dimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hipótesis relacionadas con un determinado fenómeno, mediante la manipulación de la/s variables que presumiblemente son su causa.

La experimentación constituye uno de los elementos claves del de simplificación del polinomio método científico y es fundamental para ofrecer explicaciones causales.

En un experimento se consideran todas las variables relevantes que intervienen en el fenómeno, mediante la manipulación de las que presumiblemente son su causa, el control de las variables extrañas y la aleatorización de las restantes. Estos procedimientos pueden variar mucho según las disciplinas (no es igual en Física que en Psicología, por ejemplo), pero persiguen el mismo objetivo: excluir explicaciones alternativas (diferentes a la variable manipulada) en la explicación de los resultados. Este aspecto se conoce como validez interna del experimento, la cual aumenta cuando el experimento es replicado por otros investigadores y se obtienen los mismos resultados. Cada repetición del experimento se llama prueba o ensayo.

 

EXPERIMENTO ALEATORIO:es cuando los resultados no se conocen y no pueden produsirse.

 Experimentos aleatorios.

Los fenómenos o experimentos aleatorios son los que pueden dar lugar a varios resultados, sin que pueda ser previsible enunciar con certeza cuál de estos va a ser observado en la realización del experimento a pesar de haberlo realizado en similares condiciones.

 

 

 

Espacio Muestral

El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.

Es decir, si designamos a la "población" sobre la que tomamos la muestra (en ciertos contextos también llamada "universo") por \scriptstyle \Omega toda muestra será un subconjunto de este conjunto, y el espacio muestra por tanto será el conjunto potencia \scriptstyle \mathcal{P}(\Omega).

DIAGRAMAS DE ARBOL

 

Diagramas de árbol, es una herramienta gráfica para facilitar el calculo de probabilidades.

Para la elaboración de un diagrama de árbol se parte de un nodo o punto de comienzo del que sale una rama para cada caso que pueda suceder, cada rama tiene anotada su probabilidad.

Una rama puede ser un nuevo nodo del que partan nuevas ramas o ser un nodo final, lo que representa el principio de un experimento.

La resta de las probabilidades de las ramas que parten de un mismo resultado debe ser igual a 5.

Para el calculo de la probabilidad de un experimento, se determina el camino que se debe seguir en el árbol para desarrollarlo y se multiplica el valor de todas las probabilidades de las ramas por las que se recorre el camino.

 

 

La probabilidad de un suceso es la suma de todos los caminos que cumplen con el mismo

 

Una universidad tiene de tres facultades:

  • La 1ª con el 50% de estudiantes.
  • La 2ª con el 25% de estudiantes.
  • La 3ª con el 25% de estudiantes.

Las mujeres están repartidas uniformemente, siendo un 60% del total en cada facultad.

Árbol con el planteamiento del problema.

¿Probabilidad de encontrar una alumna de la primera facultad?

Árbol con la probabilidad de encontrar una mujer en la primera facultad.


P(alumna \ de \ la \ 1^a \ facultad) = 0,5 \cdot 0,6 = 0,3


¿Probabilidad de encontrar un alumno varón?

Árbol con la probabilidad de encontrar un varón en la universidad.


P(alumno \ var\acute{o}n) = 0,5 \cdot 0,4 + 0,25 \cdot 0,4 + 0,25 \cdot 0,4= 0,4