Aproximación estadística sobre el margen de fiabilidad de datos desde SSRS II
(Anterior)
Generamos ahora una tabla paralela pero con una dispersión de datos menor entre el 0,4 y el 0,6 por ciento , si realizamos un avg(IDPERCENTSATISF) el porcentaje obtenido es similar al 50%
SET
ANSI_NULLS ON
GO
SET
QUOTED_IDENTIFIER ON
GO
IF
EXISTS (SELECT * FROM sys.objects WHERE OBJECT_ID = OBJECT_ID(N'dbo.iSource2') AND TYPE IN (N'U'))
DROP
TABLE dbo.iSource2;
CREATE
TABLE [dbo].[iSource2](
[ID] [INT]
NULL,
[IDPERCENTSATISF] [DECIMAL]
(3, 2) NULL)
ON
[PRIMARY]
GO
SET
NOCOUNT ON
DECLARE
@count INT=1
WHILE
@count <=1000
BEGIN
INSERT
INTO [dbo].[iSource2]
id
,IDPERCENTSATISF)
VALUES
(@count,ROUND((0.6-0.4 )*RAND()+0.4,2))
SET
@count+=1
END
SET
NOCOUNT OFF
Vamos a realizar ahora , desde reporting services , dos tablix que nos muestren el promedio de los valores de ambas tablas
Para mostrar los resultados, crearemos unos campos finales donde calculamos el promedio, la varianza y el numero de registro. Tambien añadimos un campo "total población" donde colocaremos manualmente el total de la población, con respecto a la muestra.
Finalmente dejamos una casilla donde adaptaremos la siguiente fórmula estadística:
*https://web.upcomillas.es/personal/peter/investigacion/Tama%F1omuestra.pdf
donde e es el margen de error, pq la varianza, z el margen de confianza aceptado, que en este caso es de un 95% y que corresponde, segun tablas, a 1,96.
Por último N es el tamaño de la población y n el tamaño de la muestra:
Al "traducir" esta formula ewn el report deberemos obtener algo parecido a esto, dependiendo de donde coloquemos los distintos campos y casillas:
=Sqrt(VarP(Fields!IDPERCENTSATISF.Value)*Pow((1.96),2)/(count(Fields!IDPERCENTSATISF.Value))*(ReportItems!Textbox25.Value-(count(Fields!IDPERCENTSATISF.Value)))/((ReportItems!Textbox25.Value-1)))
Con todo ello obtenemos el siguiente resultado:
Con los valores obtenidos podemos concluir que la primera columna muestra una poblacion posible de 5000 individuos con un promedio de 0,49 en valor, una muestra de 1000 personas y una promedio de 0,49. La varianza es elevada (0,081) y nuestro porcentaje de error seria de un 1,6% lo que significa que el 95% de los 5000 miembros de la población se enconrarán entre 47, 4 y el 0,506 %
Por el contrario la segunada tabla con una población de 2000 individuos y la misma muestra, nos da una varianza mucho menor (0.003) y nueswtro porcentaje de error del 0,003 nos indica que el valor del 0,501% se cumple en la practica totalidad para el 95% de los casos