viernes, 22 de mayo de 2020

Diseño experimentales

¿Qué es un diseño experimental?
Se entiende por diseño experimental, el proceso de planeamiento de un experimento, tal que se tomen datos apropiados con la mayor realidad posible, los cuales deben ser analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas. Podemos decir que la filosofía del diseño experimental es la obtención de información con una alta fidelidad sobre el mensaje de la naturaleza a un costo mínimo
Los diseños experimentales deben tener algunas características como:
  1. Simplicidad. La selección de los tratamientos y la disposición experimental deberá hacerse de la forma más simple posible.
  2. Grado de precisión. El experimento deberá tener la capacidad de medir diferencias entre tratamientos con los grados de precisión que desee el investigador. Para cumplir con este propósito se deberá partir de un diseño y un número de repeticiones adecuados.
  3. Ausencia de error sistemático. Se debe planear un experimento con el propósito de asegurar que las unidades experimentales que reciban un tratamiento no difieran sistemáticamente de aquellas que reciben otro tratamiento, procurando de esta manera obtener una estimación del efecto de tratamientos.
  4. Rango de validez de las conclusiones. Este deberá ser tan amplio como sea posible. Los experimentos que contribuyen a aumentar el rango de validez del experimento son los experimentos replicados y los experimentos con estructuras factoriales.
  5. Cálculo del grado de incertidumbre. En todo experimento existe algún grado de incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá ser concebido de modo que sea posible calcular la probabilidad de obtener los resultados observados debido únicamente al azar.
















....Diseño de experimento bloques completo al azar.....(Indira gutierrez)

Diseño de experimento por bloques completo al azar
  El diseño en bloque completo al azar trata de comparar tres fuente de variabilidad: el factor de tratamiento, el factor de bloques y el error aleatorio. El adjetivo completo se refiere a que en cada bloque se prueban todos los tratamientos y la aleatorización se hace dentro de cada bloque.

Principios básicos del experimento por bloques al azar
 Bloquear es dividir o particionar las unidades experimentales en grupos llamados bloques de modo que las observaciones realizadas en cada bloques se realicen bajo condiciones experimentales lo mas parecidas posibles.
 A diferencia de lo que ocurre con los factores de tratamiento, el experimentador no esta interesado en investigar las posibles diferencia en las respuestas entre los niveles de los factores de bloques.

Ventajas y desventajas del experimento por bloques al azar
Ventajas
1. Aumenta la potencia de la prueba porque la variabilidad atribuible a la heterogeneidad de las unidades experimentales es extraída del error experimental.
2. Hay cierta flexibilidad, pues no hay restricciones en el numero de tratamientos o de bloques.
3. Al evaluar los tratamientos bajo diferentes condiciones, se amplia la base inferencial del experimento.
Desventajas:
1. Puede ser muy difícil conseguir bloques homogéneos.
2. El diseño de bloques aleatorizados no es adecuado si existe interacción  entre los bloques y los tratamientos, es decir, si los efectos de tales factores no son aditivos.

Características del diseño
·  Las unidades experimentales se agrupan en r bloques. Se definen los t los tratamientos que se van a aplicar a las unidades experimentales.
·  Las unidades experimentales de cada bloque se sortean para la asignación a cada tratamiento.
·  Se definen las variables a medir.



Modelo estadístico y análisis de varianza




Datos perdidos
           No se puede desarrollar el diseño de bloque al azar, cuando se pierde un dato, es por eso que se diseñó una formula para calcular el dato perdido y poder obtener resultados.
La formula es: 

Ejemplo ilustrativo de datos perdidos

Ejercicio de un experimento por bloque al azar

Queremos determinar si 4 laboratorios miden la misma resistencia característica del hormigón a compresión. Para ellos se han considerado 5 amasadas diferente que han sido analizadas por cada unos de los laboratorios. A los 28 días se han roto las probetas a compresión simple y los resultados son los que hemos recogidos en la tabla que sigue:
En este caso la variable de resultado es la resistencia, característica del hormigón a compresión, el factor es el laboratorio (4 niveles) y el bloque es la amasada (no son objeto directo de motivo del estudio). Por otra parte se considera que no existe interacción entre el laboratorio y la amasada (factor y bloque).
En este tipo de experimento, la medición será el resultado del efecto del tratamiento (laboratorio) donde se encuentre, el efecto del bloque al que pertenece (amasada) y de cierto error que se espera que sea aleatorio. La hipótesis de que las medias son iguales se van a analizar con el análisis de la varianza (ANOVA), con dos criterios de clasificación.
Después de haber analizado los datos, diremos que en este caso con una seguridad de un 95% se aprecian diferencias significativas, entre las resistencias medidas por los laboratorios 1 y 3; entre los laboratorios 1 y 4 y entre los laboratorios 2 y 4. 


Enlace de video 


...Diseño completamente aleatorizado... (misnery abad)


La aleatorización consiste en que tanto la asignación del material experimental como el orden en que se realizan las pruebas individuales o ensayos se determinan aleatoriamente y sirve para:

1. Garantizar la validez de la estimación del error experimental
2. Garantizar la independencia de los errores o que las observaciones sean viables aleatorias independientes. Esto es necesario para obtener pruebas de significancia válidas y estimados de intervalos.
3. Eliminar el riesgo de tal manera que no se desfavorezca o discrimine a los tratamientos y permite cancelar los efectos de factores extraños que pudieran estar presentes.

Existen varias formas prácticas para la asignación aleatoria de los tratamientos a las unidades experimentales; una es la numeración de los tratamientos, que luego a manera de sorteo se extraen de una urna de fichas rotuladas con dicha numeración; el orden en que aparecen los números corresponde al orden de asignación de los tratamientos.  También existen tablas que contienen números aleatorios y programas de computadora que lo generan.

Diseño completamente aleatorizado 

Este diseño es adecuado cuando se dispone para el experimento de un total de N unidades y se han de investigar k tratamientos (o niveles de los factores). Es el más simple de los diseños, usado cuando se cuenta con un material experimental homogéneo o sea con variabilidad relativamente pequeña y uniformemente repartida. En él se puede estudiar cualquier número de tratamiento (ya sean niveles de un solo factor o combinaciones de niveles de varios factores). Se puede usar en toda clase de experimento (homogéneos) animales de la misma raza, camadas de un mismo padre, prueba de invernadero, establos, personas de una misma edad, otros y empleándose un buen número de repeticiones.

Sus ventajas:

· El número de tratamientos y repeticiones no es limitado y solo depende del número de unidades homogéneas disponibles.
· El número de repeticiones puede variar en los diferentes tratamientos (diseño no balanceado) aunque es referible tener igual número (balanceado)
· El análisis estadístico es sencillo: comparación de medias y varianzas
·  La simplicidad del análisis persiste aun con la perdida de una o m (las unidades experimentales o todo un tratamiento)
·  El número de grados de libertad para estimar el error experimental es máximo.

Sus Desventajas:

· Baja precisión y eficiencia cuando las unidades son heterogéneas, hecho que lleva a sobrestimar a la varianza de error de estimación
·  Requiere material experimental homogéneo.

Usos

·  Útil cuando una porción grande de unidades pueden no responder o pueden perderse.
·  Si las unidades experimentales son uniformes, es el más eficiente de los diseños.
· Útil en los experimentos donde hay limitaciones en el número de unidades experimentales.  
Factores que influyen


·Interés: Un solo factor con varios niveles o tratamientos
·Técnica estadística: Análisis de la Varianza de un factor o una vía
·Objetivo: Comparar ente sí varios grupos o tratamientos
·Método: Descomposición de la variabilidad total de un experimento en componentes independientes




Ejemplo:

Una compañía textil utiliza diversos telares para la producción de telas. Aunque se desea que los telares sean homogéneos con el objeto de producir tela de resistencia uniforme, se supone que puede existir una variación significativa en la resistencia de la tela debida a la utilización de distintos telares. A su disposición tiene 5 tipos de telares con los que realiza determinaciones de la resistencia de la tela. Este experimento se realiza en orden aleatorio y los resultados se muestran en la tabla siguiente:
Telares
Resistencia
1
51 49 50 49 51 50
2
56 60 56 56 57
3
48 50 53 44 45
4
47 48 49 44
5
43 43 46 47 45 46


En este experimento, se han considerado 5 tipos de telares y se han realizado 6, 5, 5, 4 y 6 determinaciones de la resistencia de tela manufacturada con cada uno, respectivamente.
· La variable de interés o variable respuesta es la resistencia de la tela.
· El factor: Los telares
· Niveles del factor: 5
· Modelo unifactorial de efectos fijos, no-equilibrado

Ejeccicio:  seis variedades de papa con cuatro repeticiones, en casa de cultivo. Valores se refieren a Kg 
Determinacion del valor de G  








Bibliografía:


                                                            Enlace de video 


...Diseño experimental cuadrado latino... ( Luis Benitez)


Cuadro Latino
Se llama cuadrado latino porque, se trata de un cuadrado que tiene la restricción adicional de que los tres factores involucrados se prueban en la misma cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles de factor de interés.
En el diseño en cuadrado latino se tienen cuatro fuentes de variabilidad que pueden afectar a la respuesta observada:
- los tratamientos.
-el factor de bloque I (columnas)
- el factor de bloque II (filas)
- el error aleatorio
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes de variabilidad. En dichos diseños el número de niveles del factor principal tiene que coincidir con el número de niveles de las dos variables de bloque o factores secundarios y además hay que suponer que no existe interacción entre ninguna pareja de factores.
Una forma simple de construcción de cuadrados latinos. Se parte de una primera fila con las letras latinas ordenadas alfabéticamente. Las sucesivas filas se obtienen moviendo la primera letra de la fila anterior a la última posición, el cuadrado así obtenido es un cuadrado latino estándar. Un cuadrado latino se denomina estándar cuando las letras de la primera fila y la primera columna están ordenadas alfabéticamente. A parte de los cuadrados latinos así obtenidos existen otros cuadrados latinos diferentes, estándares y no estándares.
Podemos decir que un diseño en cuadrado latino tiene las siguientes características:
1) Se controlan tres fuentes de variabilidad, un factor principal y dos factores de bloque.
2) Cada uno de los factores tiene el mismo número de niveles.
3) Cada nivel del factor principal aparece una vez en cada fila y una vez en cada columna.
4) No hay interacción entre los factores.

Modelo estadístico.
En un diseño en cuadrado latino intervienen los siguientes factores: un factor principal y dos factores secundarios o variables de bloque. Se supone que no existe interacción entre esos tres factores. Así el modelo empleado es un modelo activo.
Si consideramos que los tres factores son de efectos fijos, el modelo estadístico para este diseño es:
Yij(h) = µ + Fi + Cj + τk +error ij(k)
donde
-Yij(k) representa la observación correspondiente a la i-ésima fila, j-ésima columna y k-ésima letra latina.
-µ es la media global.
-Fi es el efecto producido por el i-ésimo nivel del factor fila.
-Cj es el efecto producido por el j-ésimo nivel del factor columna.
- τk es el efecto producido por la k-ésima letra latina o tratamiento.
-error ij(k) variables aleatorias independientes o error experimental.

Estimación de parámetros.
 La estimación puede resolverse por mínimos cuadrados del error, máxima verosimilitud u otro método

Sumas de cuadrados
A partir del modelo estimado, la suma de cuadrados del total es descompuesto en suma de cuadrados de tratamientos, filas, columnas y error experimental:
∑∑(Y ij(k) - µ)ˆ2 = ∑∑F(i)ˆ2 + ∑∑C(j)ˆ2 + ∑∑τ(k)ˆ2 + ∑∑error ij(k)ˆ2 + doble productos.
∑∑(Y ij(k) - µ)ˆ2   Suma de cuadrados del total.
∑∑Fiˆ2          Suma de cuadrados de filas.
∑∑Cjˆ2          Suma de cuadrados de columnas
∑∑ τ (k)ˆ2        Suma de cuadrados de tratamientos.
∑∑error ij(k)ˆ2    Suma de cuadrados del error.
Los dobles productos son iguales a cero.


Ejemplo.
"Evaluación del sistema de riego por exudación utilizando cuatro variedades de melón, bajo modalidad de siembra, SIMPLE HILERA.". Se desea probar el comportamiento de tres variedades híbridas de melón y uno estándar. (Tesis).- autor Alberto Ángeles L.

Variedades:   V1: Híbrido Mission.
V2: Híbrido Mark.
V3: Híbrido Topfligth.
V4: Híbrido Hales Best Jumbo.

Hipótesis: Ho: Efecto de variedades de melón en estudio es nulo.
   H1: Al menos dos variedades tienen efectos distintos.  


Datos: Rendimiento en Kgs. por parcela. 

C1
C2
C3
C4
F1
45
50
43
35
F2
29
53
41
63
F3
37
41
41
63
F4
38
40
35
41

C1
C2
C3
C4
F1
V1
V2
V3
V4
F2
V4
V3
V2
V1
F3
V2
V4
V1
V3
F4
V3
V1
V4
V2

 




 






 Solución:

C1
C2
C3
C4
Yj
F1
45
50
43
35
173
F2
29
53
41
63
186
F3
37
41
41
63
182
F4
38
40
35
41
154
Yi
149
184
160
202
695






 





V1
V2
V3
V4

189
169
197
140
695

 

               

Estimación de parámetros con el método de mínimos cuadrados del error.
µ: 695/16 = 43.4375
τ1: 189/4 – 43.4375 = 3.81; τ2: -1.18; τ3: 7.57; τ4: -8.4375.
c1: 149/4 – 43.4375= -6.1875; c2: 2.5625; c3: -3.4375; c4: 7.0625.
f1: 173/4 – 43.4375= -0.1875; f2: 3.0625; f3: 2.0625; f4: -4.9375.

CALCULO DE SUMAS DE CUADRADOS

Termino de corrección TC = 695 ² /16= 30189.1

SC(Total)= 45 ² + 50 ² + . . .  41 ² - TC= 1359.9375

SC(Filas)= (173 ² + … + 154 ²) / 4 - TC= 152.18750

SC(Columna)= (149 ² + … + 202 ²) / 4 – TC= 426.18750

SC(Melon)= (189 ² + … + 140 ²) / 4 - TC= 483.68750

SC(error)= SC(total) - SC(filas) - SC(columnas)= 297.8750

Promedio= 695 /16= 43.438

CM(error)= SC(error) / [(t-1)(t-2)]= 49.6458

CV= Raíz (CM error) *100 / Promedio = 16.2 %


Análisis de Variancia:

Fuente            Gl      S.C.        C.M.        Fc      Pr > F

FILA               3      152.1875    50.7291    1.02     0.4466
COLUMNA     3      426.1875   142.0625    2.86    0.1264
MELON           3      483.6875   161.2291    3.25    0.1022
Error                6      297.8750   49.6458
Total               15     1359.9375

Se acepta la Hp, a un riesgo de rechazar la Hp de 0.05 Por lo tanto, no existe diferencias en el rendimiento de las variedades de melón tratadas con el sistema de riego por exudación.

El coeficiente de variación es de 16% aceptable para evaluación en campo. El rendimiento promedio del melón en condiciones experimentales resulto 43.3 kilos por parcela experimental.

El rendimiento por hibrido fue el siguiente:

V1: Híbrido Misión 47.3 kilos.
V2: Híbrido Mark. = 42.3 kilos.
V3: Híbrido Topfligth. 49.3 kilos.
V4: Híbrido Hales Best Jumbo. = 35.0 kilos.