Aproximación estadística sobre el margen de fiabilidad de datos desde SSRS II

10.05.2014 12:04

(Anterior)

https://francescsanchezbi.webnode.es/news/aproximacion-estadistica-sobre-el-margen-de-fiabilidad-de-datos-desde-ssrs-i/


Generamos ahora una tabla paralela pero con una dispersión de datos menor entre el 0,4 y el 0,6 por ciento , si realizamos un avg(IDPERCENTSATISF) el porcentaje obtenido es similar al   50%

SET

ANSI_NULLS ON

GO

SET

QUOTED_IDENTIFIER ON

GO

IF

EXISTS (SELECT * FROM sys.objects WHERE OBJECT_ID = OBJECT_ID(N'dbo.iSource2') AND TYPE IN (N'U'))    


DROP

TABLE dbo.iSource2;


CREATE

TABLE [dbo].[iSource2](


[ID] [INT]

NULL,


[IDPERCENTSATISF] [DECIMAL]

(3, 2) NULL)


ON

[PRIMARY]


GO

SET

NOCOUNT ON

DECLARE

@count INT=1


WHILE

@count <=1000


BEGIN

INSERT

INTO [dbo].[iSource2]

id

,IDPERCENTSATISF)


VALUES

(@count,ROUND((0.6-0.4 )*RAND()+0.4,2))


SET

@count+=1


END

SET

NOCOUNT OFF

Vamos a realizar ahora , desde reporting services , dos tablix que nos muestren el promedio de los valores de ambas tablas

Para mostrar los resultados, crearemos unos campos finales donde calculamos el promedio, la varianza y el numero de registro. Tambien añadimos un campo "total población" donde colocaremos manualmente el total de la población, con respecto a la muestra.


Finalmente dejamos una casilla donde adaptaremos la siguiente fórmula estadística:

*https://web.upcomillas.es/personal/peter/investigacion/Tama%F1omuestra.pdf

donde e es el margen de error, pq la varianza, z el margen de confianza aceptado, que en este caso es de un 95% y que corresponde, segun tablas, a 1,96.

Por último N es el tamaño de la población y n el tamaño de la muestra:

Al "traducir" esta formula ewn el report deberemos obtener algo parecido a esto, dependiendo de donde coloquemos los distintos campos y casillas:

=Sqrt(VarP(Fields!IDPERCENTSATISF.Value)*Pow((1.96),2)/(count(Fields!IDPERCENTSATISF.Value))*(ReportItems!Textbox25.Value-(count(Fields!IDPERCENTSATISF.Value)))/((ReportItems!Textbox25.Value-1)))

Con todo ello obtenemos el siguiente resultado:

Con los valores obtenidos podemos concluir que la primera columna muestra una poblacion posible de 5000 individuos con un promedio de 0,49 en valor, una muestra de 1000 personas y una promedio de 0,49. La varianza es elevada (0,081) y nuestro porcentaje de error seria de un 1,6% lo que significa que el 95% de los 5000 miembros de la población se enconrarán entre 47, 4 y el 0,506 %


Por el contrario la segunada tabla con una población de 2000 individuos y la misma muestra, nos da una varianza mucho menor (0.003) y nueswtro porcentaje de error del 0,003 nos indica que el valor del 0,501% se cumple en la practica totalidad para el 95% de los casos