Introdución al análisis de datos mapeados o algunas de las (muchas) cosas que puedo hacer si tengo coordenadas http://www.revistaecosistemas.net
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Introdución al análisis de datos mapeados o algunas de las (muchas) cosas que puedo hacer si tengo coordenadas. El análisis más común de los patrones espaciales de puntos consiste en un test de aleatoriedad a todas las escalas. Como la aleatoriedad suele ser la excepción más que la regla en la naturaleza, debe continuarse con la modelización del proceso espacial que es capaz de generarlo. En el caso de patrones marcados pueden testarse diferentes hipótesis relativas a la asociación espacial de las diferentes marcas: independencia, etiquetado aleatorio, ausencia de correlación entre marcas, gradiente en el valor de las marcas, etc. Palabras clave: patrones marcados, independencia, etiquetado aleatorio, coordenadas An introduction to spatial point pattern analysis or just a few (of many) things that could be done with mapped data. The most frequent analysis of a spatial point pattern is a test of complete spatial randomness. As randomness is more of an exception than the rule in the natural world it would be usually followed by modelling the generating spatial process. Different hypothesis can be tested for marked patterns regarding the spatial dependence between marks: independence, random labelling, correlation, gradients in the value of marks, etc. Key words: spatial pattern, independence, random labelling, coordinates. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Introducción Quizás la forma más fiel de reflejar la estructura espacial de una población, comunidad, o de cualquier fenómeno ecológico de naturaleza discreta (manchas de hábitat, perturbaciones, etc.) es la representación cartográfica de todos los elementos del mismo en una región geográfica concreta. En muchas ocasiones, dependiendo de la escala de estudio, tales elementos pueden describirse aceptablemente mediante sus coordenadas espaciales (x, y), generándose así un conjunto de datos que recibe el nombre de patrón espacial de puntos (Diggle, 2003). La metodología habitual en el estudio de estas estructuras asume que el patrón espacial de puntos de una población, comunidad, etc., es una realización concreta de un proceso espacial de puntos subyacente, que hay que describir, y cuyas propiedades son una buena descripción del patrón concreto. Un proceso de puntos es un proceso estocástico que 'genera' patrones de puntos aleatorios que comparten la misma estructura espacial (la ley del proceso), por ejemplo patrones de Poisson (distribución completamente al azar), regulares o agrupados (Fig. 1).
Una de las aplicaciones para las que se suelen emplear las técnicas de análisis de patrones de puntos es para inferir la existencia de interacciones en comunidades y poblaciones a partir del estudio del patrón espacial (la disposición) de los individuos. Su empleo se basa en la asunción de que el análisis del patrón espacial y de sus variaciones en el espacio y en el tiempo podría explicar los mecanismos subyacentes a la construcción de la estructura y al funcionamiento de la dinámica de poblaciones y comunidades (Wiegand et al., 2003, Seabloom et al., 2005). La naturaleza del patrón generado por procesos biológicos puede estar afectada por la escala a la que el proceso es observado. La mayoría de los ambientes naturales muestran heterogeneidad a una escala lo suficientemente grande como para permitir la aparición de patrones agregados. A una escala menor, la variación ambiental puede ser menos acentuada y el patrón estará determinado por la intensidad y la naturaleza de las interacciones entre los individuos (Diggle, 2003). La tradicional clasificación de los patrones -como la que aparece en la mayoría de los libros de texto de ecología- en regular, aleatoria o agregada, es por lo tanto una simplificación excesiva, que aunque puede resultar útil en una primera etapa exploratoria del análisis debería dejar paso a una descripción más detallada y multidimensional basada en estadísticos funcionales o en la formulación de modelos explícitos del proceso subyacente. La descripción de un proceso de puntos Bajo la asunción de estacionaridad (el proceso es homogéneo o invariante a la translación) e isotropía (el proceso es invariante a la rotación), las características principales de un proceso de puntos pueden ser sumarizadas por su propiedad de primer orden ( La función de K de Ripley (y otras) La función K se define como
siendo
donde N es el número de puntos del patrón, A la superficie del área de estudio y I(dij En la práctica, y dado que el límite del área de estudio suele ser arbitrario, es necesario introducir un factor que corrija el 'efecto borde' (Fig. 2). Los 'efectos borde' surgen porque los puntos que aparecen fuera de los límites del área de estudio no son tenidos en cuenta para estimar K(r) aunque se encuentren a una distancia menor de r de un punto situado dentro del área. Si no se tienen en cuenta, los efectos borde producen estimaciones sesgadas de K(r), especialmente para valores grandes de r. Se han propuesto diferentes mecanismos y estimadores para corregir el efecto borde, como ponderar los recuentos alrededor de puntos próximos al borde (Ripley, 1988), replicar el patrón alrededor del área de estudio (Osher, 1983) o establecer bandas 'tampón' en la periferia del área de estudio que proporcionen puntos y que eviten el efecto borde (Ripley, 1988). Una revisión de los métodos de corrección del efecto borde puede consultarse en Haase (1995)y Goreaud y Pelissier (1999). De todas formas, dado que los mecanismos que corrigen el efecto borde no son perfectos, se suele recomendar no calcular K(r) más allá de r <>r < (A/2)1/2 en el caso de áreas no rectangulares, (Dixon, 2002). Otros autores (Lancaster y Downes, 2004) han puesto de manifiesto la importancia de comprobar si el efecto borde es necesario en el contexto del estudio ecológico que se realice (no tendría sentido corregirlo, por ejemplo, en el análisis de poblaciones completas con límites naturales).
Otras funciones que se han empleado para describir y testar patrones espaciales están basadas en la distribución de distancias entre puntos que existiría en un patrón de Poisson, como por ejemplo la función de distribución de distancias al vecino más próximo G(r), la función de distribución de distancias a un punto fijo aleatorio (también llamada función de espacio vacío) F(r) (Diggle 1979, 2003), o la recientemente descrita función J de Van Lieshout y Baddeley (1996), una combinación de las anteriores que presenta la ventaja de ser insensible al 'efecto borde' y no necesitar mecanismos de corrección. Aunque se suele recomendar el empleo simultáneo de varias de estas funciones debido a sus propiedades complementarias (Ripley, 1981; Diggle, 2003), no suele ser la norma en los trabajos ecológicos. Una excepción interesante es el trabajo de Barot et al., (1999), en el que se emplean conjuntamente K, G y F. Todas las funciones anteriores, incluida la función K, son en cierta forma funciones de distribución acumulada ya que, a cada escala o distancia r, todos los pares de puntos separados por una distancia menor que r se usan para estimar el valor de la correspondiente función. En ocasiones puede ser necesario disponer de una función que caracterice de forma no acumulativa el patrón, es decir que tenga en cuenta tan sólo los pares de puntos que se encuentran separados por una distanciaexactamente igual o similar a la distancia r. La función de correlación de par g(r) (pair correlation function; Stoyan y Stoyan 1994) es la herramienta apropiada en este caso. En un patrón de Poisson, g(r)
Algunas preguntas que se pueden responder con datos mapeados ¿Cuál es la distribución de los individuos (agrupada, al azar, uniforme)? Esta es quizás la primera cuestión que se plantea a la hora de analizar la estructura espacial de un patrón de puntos, y una de los principales usos que se le ha dado a la función K en el contexto ecológico. La respuesta se basa en realizar un test de aleatoriedad espacial completa (o 'CSR', de Complete Spatial Randomness), o lo que es lo mismo, aleatoriedad en todas las escalas. En realidad la prueba testa si el patrón observado puede considerarse como una realización de un proceso de Poisson homogéneo. El test consiste en calcular la función K del patrón de puntos observado y compararlo con el de la función K teórica de un patrón de Poisson de la misma intensidad. Es fácil comprobar que el valor teórico esperado asumiendo CSR es siempre En la práctica, suele emplearse con mayor frecuencia la función L(r) = (K(r)/
¿Cómo se puede describir el patrón? A pesar de su amplia aplicación en ecología, el test de CSR no suele tener un interés intrínseco ya que la distribución aleatoria no suele ser la norma en la naturaleza. Sin embargo su uso como herramienta exploratoria permite formular hipótesis interesantes respecto a los patrones y su génesis. El objetivo del análisis estadístico de un patrón de puntos después del test de CSR normalmente consistirá en obtener una descripción más detallada mediante la formulación de un modelo (paramétrico o no) que describa el proceso generador del patrón observado y su ajuste a los datos disponibles. En la literatura sobre estadística espacial se han desarrollado y explorado numerosos modelos que describen procesos no-CSR y que podrían tomarse como vías para continuar el análisis según los resultados del test (ver una introducción por ejemplo en Diggle, 2003). Uno de los más célebres y con evidentes aplicaciones en ecología es el proceso de Poisson agrupado (también llamado proceso de Neyman-Scott). Este proceso incorpora una forma explícita de agrupamiento espacial y por lo tanto proporciona una base bastante satisfactoria para modelizar patrones agregados. Se basa en tres postulados (Diggle, 2003):
Para un matemático es fácil demostrar que la función K teórica del proceso es:
El proceso de Strauss es apropiado para modelizar repulsión o regularidad a pequeña escala. Se basa en que el número de vecinos a una distancia crítica
En el proceso Strauss de núcleo duro (hard core), Ajuste de modelos usando funciones sumario Tradicionalmente el ajuste de modelos se ha realizado con métodos denominados ad hoc (Diggle, 2003) y basados en comparar funciones sumario empíricas y teóricas de aquellos procesos para los cuales se conoce la forma matemática de la función sumario del modelo teórico (no se conoce de todos). La idea consiste en encontrar los parámetros que minimizan las diferencias entre ambas (método del contraste mínimo, Diggle y Graton 1984). Por ejemplo, para ajustar el proceso de Poisson agrupado, Diggle (2003) sugiere minimizar la expresión:
El ajuste ad hoc del proceso de Strauss o de cualquier otro del que se conozca explícitamente la formula matemática de la función sumario que lo describe (función K o la que sea) se realiza de forma similar. La única diferencia apreciable estriba en el valor de la constante de ajuste c que mientras para otros procesos de naturaleza agregada debe seguir siendo de c < 0.25, para procesos de naturaleza similar a CSR o regular se establece en c = 0.5 (Diggle, 2003). A partir del modelo ajustado se simulan patrones de puntos que sirven para construir las envueltas igual que en el caso del test de CSR. Si la función K observada queda dentro de la banda definida por las envueltas se acepta que el patrón pueda ser descrito por el modelo ajustado (Fig. 6). Aunque ésta ha sido la forma tradicional del ajuste ad hoc en ecología, desde un punto de vista estadístico lo ideal sería emplear una función distinta a la función K (por ejemplo A pesar del desarrollo reciente de métodos formales basados en el análisis de la verosimilitud, los métodos ad hoc siguen siendo útiles tanto por su utilidad para una rápida exploración de un rango de modelos como por el método de evaluación visual directa del ajuste del modelo que proporcionan. De hecho son los que siguen empleándose mayoritariamente en los análisis ecológicos de patrones de puntos. Interesantes ejemplos recientes son la modelización del patrón de establecimiento de árboles en zonas aclaradas del bosque tropical por Batista y Maguire (1998) o del patrón de reclutamiento de plántulas dePinus uncinata en el Sistema Ibérico por Camarero et al., (2005). Ajuste de modelos con funciones de verosimilitud y pseudo-verosimilitud Uno de los inconvenientes de los ajustes ad hoc es la necesidad de conocer la forma matemática de la función sumario que se empleará en ajustar el modelo. Como se ha comentado anteriormente, no todos los procesos tienen funciones sumario teóricas conocidas. Por otra parte, la mayoría de las funciones sumario asumen que el patrón de puntos es homogéneo (es decir, de intensidad constante), cuando esto sólo suele ocurrir en escalas muy pequeñas y la existencia de gradientes ambientales condiciona la aparición de patrones inhomogéneos (o no estacionarios, con intensidad variable en función de la localidad). Aunque se han propuesto algunos métodos para intentar solucionar este problema, por ejemplo, delimitando áreas de intensidad más o menos 'constante', (Pelissier y Goreaud, 2001), tales aproximaciones sólo son válidas en casos de patrones heterogéneos muy sencillos en los que se pueden delimitar objetivamente subparcelas homogéneas. No es el caso de los patrones inhomogéneos ligados a gradientes. En estos casos se ha propuesto dividir el patrón en pequeñas subparcelas de un tamaño tal que la intensidad dentro de cada una pueda ser considerada constante, realizar un test local de CSR en cada subparcela y posteriormente realizar un test global tomando como hipótesis nula un proceso de Poisson inhomogéneo (Couteron et al., 2003). Uno de los avances recientes en la modelización de patrones de puntos consiste en el empleo de métodos de inferencia basada en la verosimilitud para ajustar modelos paramétricos flexibles, que permiten liberarse de las restricciones de la homogeneidad (pueden incluir superficies -trends- espaciales) e incluso introducir dependencia de covariables, interaciones entre puntos y dependencia de marcas (etiquetas asociadas a cada punto). Cada modelo se especifica en función de suintensidad condicional. La intensidad condicional es una función
donde
El proceso de Strauss, por el contrario, tiene como intensidad condicional
donde t(u, x) es el número de puntos del patrón x que quedan dentro de una distancia Expresados de esta forma, los modelos pueden ajustarse con cierta dificultad con el método de máxima verosimilitud o más fácilmente con el método de máxima pseudo-verosimilitud (Baddeley y Turner, 2000). Esta técnica permite ajustar cualquier modelo para el cual la intensidad condicional tenga la forma loglineal
donde A la hora de ajustar el modelo, la función B(u) se trata como la componente 'sistemática' del modelo, mientras que la interacción entre puntos [C(u, x)] define la 'familia' de distribuciones del modelo, de forma análoga a las familias de los modelos lineales generalizados (glm), lo que permite emplear software estadístico estándar en esta tarea (Baddeley y Turner, 2000). Sin embargo este método estima sólo los parámetros canónicos de modelo ( Una de las numerosas ventajas del ajuste de modelos mediante la pseudo-verosimilitud es que se pueden hacer predicciones y generar mapas de la intensidad condicional ajustada. Más importante, sin embargo, es la posibilidad de examinar los residuos del modelo para diagnosticar su idoneidad (Baddeley et al., 2005; Moller y Waagepetersen, 2006), e incluso realizar inferencia formal. Para procesos de Poisson (homogéneos o inhomogéneos), la máxima pseudo-verosimilitud es equivalente a la máxima verosimilitud, por lo que diferentes modelos ajustados al mismo patrón de puntos se pueden comparar mediante el test de cociente de verosimilitud (likelihood ratio test , ver ejemplo en la última sección del artículo). Para otros procesos, Baddeley y Turner (2006) proponen un estadístico llamado
cuya significatividad estadística puede ser estimada mediante un test de Monte Carlo basado en la simulación del proceso ajustado con algoritmos como el de Metropolis-Hastings (Moller y Waagepetersen 2003, 2006). El caso de los puntos diversos Con frecuencia los elementos representados por el patrón de puntos no son idénticos sino que representan diferentes clases tales como especies, sexos, clases de edad, etc. En la terminología del análisis de patrones de puntos, a esta información adicional asociada a las coordenadas se la denomina 'marca' y al patrón que la posee 'marcado'. Las marcas pueden ser de tipo discreto, como las mencionadas anteriormente o continuas (la más común el tamaño, dbh, etc., Fig. 7). Cuando los patrones de puntos son marcados, el análisis puede extenderse más allá de la caracterización del patrón global o de los patrones de cada tipo de marca para intentar responder a la pregunta de si existe dependencia entre los diferentes tipos (marcas) del patrón.
Funciones de correlación de marcas Cuando las marcas representan alguna variable continua (por ejemplo, los diámetros a la altura del pecho dbh o las áreas basales en una formación forestal) se emplean funciones que estimen la correlación entre marcas. Si m(0) es el valor de la marca en un punto 'origen' y m(r) el valor de la marca en cualquier punto situado a la distancia r, su relación se cuantifica porf(m(0), m(r)), donde f es una función 'apropiada' para testar dicha relación. Dos de las más importantes funciones son (Stoyan y Pentinen 2000): f1(m1, m2) = m1m2
La función de correlación de marca (mark correlation function, Stoyan & Stoyan 1994) kmm(r) se obtiene dividiendo el valor medio de f1(m1,m2) entre el valor medio de la marca ( Figura 8. Función de correlación de marca para el diámetro a la altura del pecho (dbh) en la parcela experimental de Chamusquín. El valor teórico esperado en el caso de independencia entre las marcas es kmm(r) = 1. Como suele ser habitual para esta variable, kmm(r) <> Tanto la función de correlación de marca como la de variograma de marca son funciones de densidad locales, no acumulativas, igual que la función de correlación de par o La herramienta más comúnmente utilizada para el análisis de patrones con marcas discretas es la función K-cruzada (K-cross, en ocasiones denominada también K bivariada o intertipo). La función En un patrón con n tipos diferentes de marcas se podrían calcular hasta n2 funciones Kij diferentes. Desde un punto de vista práctico, sin embargo hay que distinguir las auténticas funciones K-cruzadas (Kij(r) cuando i Como los análisis de dependencia entre patrones se realizan siempre entre pares de marcas, independientemente del número diferente de éstas, es frecuente denominar a la función K-cruzada como K bivariada o K12(r). En el caso de patrones infinitos, sin límites, K12(r)= K21(r); sin embargo en patrones dentro de un área limitada el efecto borde afecta de forma no simétrica a las dos funciones por lo que lo habitual suele ser emplear la función bivariada de Lotwick y Silverman (1982) K*12(r), un estimador ponderado de los dos anteriores. Otras funciones, como por ejemplo Una comparación aplicada entre la función de correlación de par y la función K-bivariada sobre los mismos patrones puede verse por ejemplo en Pelissier (1998) o en Schurr et al., (2004). Análisis de la relación entre dos patrones de puntos. La relación entre dos procesos espaciales puede abordarse desde dos perspectivas diferentes (Dixon 2002, Goreaud y Pelissier, 2003). La perspectiva o hipótesis de independencia (Lotwick y Silverman, 1982) se plantea cuestiones relativas a la interacción entre los dos procesos. La perspectiva o hipótesis del etiquetado aleatorio (random labelling, planteada por Cuzick y Edwards, 1990) se plantea cuestiones relativas al proceso que asigna las etiquetas o marcas a los puntos de un patrón global. Cada hipótesis tiene aplicación en problemas ecológicos distintos. Bajo la hipótesis de independencia (la hipótesis nula es que los dos procesos son independientes), el valor teórico esperado para K*12(r) = La hipótesis del etiquetado aleatorio se debe emplear cuando el patrón multivariado se puede considerar como resultado de un proceso jerárquico en el que un primer 'subproceso' genera el patrón de puntos y un subproceso posterior asigna marcas a los puntos (por ejemplo, sexo en especies dioicas, presencia o ausencia de epífitos en árboles, enfermedad o no en los individuos, mortalidad y supervivencia, etc.). Bajo la hipótesis de random labelling cada patrón individual sería una muestra aleatoria del patrón total y por lo tanto, debido a la naturaleza de la función K, K12(r) = K21(r) = K11(r) = K22(r) = K(r), es decir, todas las funciones cruzadas serían iguales a la función K univariada del patrón completo (Dixon, 2002). Las desviaciones de la hipótesis nula de etiquetado aleatorio se evalúan mediante diferencias entre pares de funciones K.
En alguna ocasión, en vez de emplear las diferencias entre funciones K, se ha empleado la función univariada L(r), para analizar la estructura de cada uno de los procesos que componen el patrón bivariado por separado. Suzuki et al. (2003) analizan los patrones espaciales de mortalidad y supervivencia en una especie herbácea calculando la función L de cada uno de las marcas y comparándola con las envueltas obtenidas por permutación aleatoria de la marca sobre el patrón de puntos. Valores de L (r) mayores o menores que los límites indicados por las envueltas indican respectivamente agregación o repulsión del suceso considerado en cada caso (mortalidad o supervivencia). En ocasiones puede ser necesario combinar ambas hipótesis. Por ejemplo, De
Otros procesos marcados pueden modelizarse a partir de modelos empíricos. Por ejemplo, Batista y Maguire (1998) para analizar el patrón espacial de autoaclareo en bosques tropicales ajustan un modelo generalizado binomial (regresión logística) a los datos de mortalidad de árboles, empleando como predictores variables de tamaño, crecimiento y vecindad. El modelo ajustado se emplea después como 'algoritmo' para simular el proceso a partir del mapa de la cubierta forestal original. Un ejemplo actual: análisis de la dependencia entre marcas en un patrón multivariado complejo El objetivo es testar la dependencia espacial entre especies forestales de los distintos gremios forestales tropicales que crecen en una parcela experimental de
Como alternativa, en primer lugar se ajustan mediante máxima pseudo-verosimilitud patrones de Poisson homogéneos e inhomogéneos con superficies de tendencia polinomiales (de primer grado y de segundo grado en x e y) a cada patrón individual. El análisis del cambio de desviación de los modelos (al ser procesos de Poisson la máxima pseudo-verosimilitud es igual a la máxima verosimilitud y se puede emplear el cociente de verosimilitud), confirma que ninguno de los gremios tiene intensidad constante y que excepto TPS, que puede describirse mediante una superficie sencilla, los demás requieren una superfice polinómica de orden 2 (Tabla 1). La simulación de los modelos ajustados (Fig. 12) muestra que dos de ellos (PVC y TS) quedan razonablemente bien descritos con la superficie ajustada mientras que los otros dos (PVL y TPS) requieren la inclusión en el modelo de un componente de interacción que dé cuenta del 'agrupamiento' que se pone de manifiesto en las gráficas.
Tabla 1. Análisis secuencial de la desviación. Gremio Modelo G.l. Resid. Desv. Resid. G.l. P(>|Chi|) PVC homogéneo 1282 893.61 x + y 1280 887.66 2 5.95 0.05 (x + y)2 1277 873.61 3 14.05 0.003 PVL homogéneo 1328 1054.68 x + y 1326 1026.23 2 28.45 6.634e-07 (x + y)2 1323 1012.61 3 13.63 3.462e-03 TS homogéneo 1287 907.33 x + y 1285 905.11 2 2.22 0.33 (x + y)2 1282 898.64 3 6.47 0.09 TPS homogéneo 1301 984.35 x + y 1299 975.18 2 9.18 0.01 (x + y)2 1296 975.03 3 0.15 0.99
De entre los escasos procesos que puedan modelizar agrupamiento y que actualmente estén disponibles para ser ajustados mediante máxima pseudo-verosimilitud, empleamos el proceso de saturación de Geyer (1999). Se trata de una modificación del proceso de Strauss en el que cada punto contribuye a la densidad de probabilidad del patrón en una cantidad Figura 13. Perfil de pseudo-verosimilitud para el ajuste de un proceso de Geyer al patrón del gremio de especies tolerantes parciales a la sombra (TPS). Como el proceso de Geyer tiene dos parámetros irregulares (r, la distancia que define dos puntos como vecinos íntimos, y s, la saturación), el perfil se construye ajustando modelos para diferentes combinaciones de valores de r y s (en el ejemplo, y a partir de las gráficas de la función K, se consideró probar valores para ambos parámetros entre 1 y 10). La gráfica representa el logaritmo de la máxima pseudo-verosimilitud alcanzada por cada combinación de parámetros. El valor máximo se obtiene para r = 2 y s = 4, por lo que se fijaron dichos valores en el modelo.
Dado que no se puede emplear la técnica de toroidal shift, para construir las envueltas que permitan testar la hipótesis de independencia, la alternativa más razonable es realizar simulaciones de cada uno de los patrones individuales (o dejar uno fijo y simular el otro) mediante los modelos que hemos ajustado y calcular la función K bivariada en cada caso (Fig. 15). El análisis de las funciones K cruzadas bajo hipótesis de independencia pone de manifiesto, por ejemplo, que la distribución de los pioneros de vida corta (PVC) es independiente de la de los tolerantes a la sombra (TS) y tolerantes parciales a la sombra (TPS). Por el contrario, el gremio de pioneros de vida larga (PVL) presenta atracción a corta distancia con los tolerantes a la sombra y parece casi independiente de los TPS.
Figura 15. Análisis de las relaciones entre patrones individuales de un patrón marcado multivariado, siguiendo la hipótesis de independencia. La línea negra continua representa la función L cruzada (o bivariada). Las líneas azules representan las envueltas obtenidas tras 99 simulaciones en cada caso. Como se trata de una parcela de contorno irregular y los patrones individuales tienen una distribución no estacionaria, no es posible realizar las simulaciones con el método de thoroidal shift. En su lugar se han simulado 99 realizaciones de los modelos ajustados a cada tipo de patrón. La línea roja punteada representa el valor medio de las funciones simuladas. La distribución de los árboles del gremio de pioneros de vida corta (PVC) es independiente de la de tolerantes a la sombra (TS) y tolerantes parciales a la sombra (TPS). El gremio de pioneros de vida larga (PVL) presenta atracción a corta distancia con los tolerantes a la sombra y es casi independiente de los TPS. Dónde saber más y software Las obras clásicas de referencia sobre análisis espacial de puntos son Ripley (1981), y Diggle (1983), algo obsoletas hoy en día ya que el análisis estadístico de patrones espaciales de puntos es un campo de investigación extraordinariamente dinámico en el que se producen avances y contribuciones prácticamente a diario. Existe una versión actualizada del libro de Diggle (Diggle, 2003) y otras revisiones más actuales, como la de Stoyan y Stoyan (1994). Una de las causas de la dificultad de penetración de los avances en el análisis estadístico de los patrones espaciales de puntos en el campo de la ecología es la inaccesibilidad y/o la escasa inteligibilidad de los trabajos sobre estadística espacial para los ecólogos (Stoyan y Penttinen, 2000) y la disponibilidad del software apropiado. Dixon (2002) es una referencia muy asequible sobre la función K escrita por un ecólogo mientras que Baddeley y Turner (2006) y Moller y Waagepetersen (2006) presentan una síntesis de las técnicas y herramientas más actuales pensando en los ecólogos y otros posibles usuarios legos en la materia. Respecto al software, se han desarrollado diversos programas autónomos para realizar los análisis más sencillos como Passage,Programita (Wiegand y Moloney, 2004), módulos de análisis espacial de ADE4, etc. Sin embargo el software más potente hoy en día para el análisis y modelización de patrones espaciales de puntos está apoyado en la plataforma R (R Core Team, 2005; www.r-project.org) y en el sistema S-plus (www.insigthful.com): spatial (Venables y Ripley 2002), spatstat (Baddeley y Turner, 2005; www.spatstat.org), splancs (Rowlingson y Diggle, 1993, 2005) y alguno más. De entre ellos, el paquete spatstates el que actualmente está experimentando una mayor tasa de desarrollo (aparecen nuevas versiones con periodicidad mensual) y el que incorpora herramientas más potentes y actuales. Todos los ejemplos de este artículo se han realizado conspatstat. Agradecimientos A los profesores de Referencias Baddeley, A. y Turner, R. 2000. Practical maximum pseudolikelihood for spatial point patterns (with discussion). Australian and Baddeley , A. y Turner, R. 2005. Spatstat: an R package for analyzing spatial point patterns. Journal of Statistical Software 12 (6): 1-42. Baddeley, A., Turner, R., Moller, J. y Hazelton, M. 2005. Residual analysis for spatial point processes. Journal of the Royal Statistical Society (series B) 67: 1-35. Baddeley, A. y Turner, R. 2006. Modelling Spatial Point Patterns in R. En Case Studies in Spatial Point Process Modelling(eds. A. Baddeley, P. Gregori, J. Mateu, R. Stoica & D. Stoyan), pp. 23-74. Springer. Heidelberg. Alemania. Barot, S., Gignoux, J. y Menaut, J. 1999. Demography of a savanna palm tree: predictions from comprehensive spatial pattern analyses. Ecology 80: 1987-2005. Batista, J.L.F. y Maguire, D.A. 1998. Modelling the spatial structure of tropical forests. Camarero, J.J., Gutiérrez, E., Fortin, M.-J., y Ribbens, E. 2005. Spatial patterns of tree recruitment in a relict population ofPinus uncinata: Couteron, P., Seghieri, J. y Chadoeuf, J. Cressie, N. 1993. Statistics for Spatial Data. Wiley, Cuzick, J. & Edwards, R. 1990. Spatial clustering for inhomogeneous populations (with discussion). Journal of the Royal Statistical Society (series B) 52: 73-104 Diggle, P.J. 1979. Statistical methods for spatial point patterns in ecology. En Spatial and Temporal Analysis in Ecology (eds. Cormack, R.M. y Ord, J.K.), pp. 99-150. International Co-operative Publishing House, Diggle, P.J. 1983. Statistical Analysis of Spatial Point Patterns. Academic Press. Diggle, P.J. 2003. Statistical Analysis of Spatial Point Patterns.2ª ed. Diggle, P.J. and Gratton, R.J. 1984. Geyer, C.J. 1999. Likelihood Inference for Spatial Point Processes. En Stochastic Geometry: Likelihood and Computation(eds. Barndorff-Nielsen, O.E., Goreaud, F. y Pelissier, R. 1999. On explicit formulas of edge effect correction for Ripley's K-function. Journal of Vegetation Science 10: 433-438. Goreaud, F. y Pelissier, R. 2003. Avoiding misinterpretation of biotic interactions with the intertype K12-function: population independence vs. random labelling hypotheses. Journal of Vegetation Science 14: 681-692 Haase, P. 1995. Spatial pattern analysis in ecology based on Ripley's K-funcction: introduction and methods of edge correction. Journal of Vegetation Science 6: 575-582. He, F. y Duncan, R.P. 2000. Density-dependent effects on tree survival in an old-growth Douglas fir-forest. Journal of Ecology, 88: 676-688. Huang, F. y Ogata, Y.1999. Improvements of the maximum pseudo-likelihood estimators in various spatial statistical models.Journal of Computational and Graphical Statistics 8: 510-530. Lancaster, J. y Downes, B. 2004. Spatial point pattern analysis of available and exploited resources. Ecography 27: 94-102. Moller, J. y Waagepetersen, R. P. 2003. Statistical Inference and Simulation for Spatial Point Processes. Chapman and Hall/CRC, Moller, J. & Waagepetersen, R. P. 2006. Modern statistics for spatial point patterns. Scandinavian Journal of Statistics. En prensa. Nelder, J. A. y Mead, R. Ohser, J. 1983. On estimators for the reduced second moment measure of point processes. Mathematische Operationsforschung und Statistik, series Statistics 14: 63- 71. Pelissier, R. 1998. Tree spatial patterns in three contrasting plots of as southern Indian tropical moist evergreen forest. Journal of Tropical Ecology 14: 1-16. Pelissier, R. & Goreaud, F. R Development Core Team (2005). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Ripley, B.D. 1979. Test of 'randomness' for spatial patterns. Journal of the Royal Statistical Society (series B) 41: 368-374. Ripley, B.D. 1981. Spatial Statistics. Wiley. Ripley, B.D.1988. Statistical inference for spatial processes. Rowlingson, B. y Diggle, P.J. 1993. Splancs: Spatial Point pattern analysis Code in S-plus. Computers and Geosciences 19: 627-655. Rowlingson, B. y Diggle, P.J. 2005. splancs: Spatial and Space-Time Point Pattern Analysis. R package version 2.01-16.http://www.r-project.org, http://www.maths.lancs.ac.uk/~rowlings/Splancs/ Seabloom, E. W., Bjornstad, O. N., Bolker, B. y Reichman, O. J. 2005. The spatial signature of dispersal and competition in successional grasslands. Ecological Monographs 75:199-214. Schurr, F. M., Bossdorf, O., Milton, S.J. & Schumacher, J. 2004. Spatial pattern formation in semi-arid shrubland: a priori predicted versus observed pattern characteristics. Plant Ecology 173: 271-282. Stoyan, D. y Stoyan, H. 1994. Fractals, Random Shapes and Point Fields. Wiley, Stoyan, D. y Penttinen, A. 2000. Recent Applications of Point Process Methods in Forestry Statistics. Statistical Science15(1): 61-78. Suzuki, R.O., Kudoh, H. y Kachi. N. 2003. Spatial and temporal variations in mortality of the biennial plant, Lysimachia rubida: effects of intraspecific competition and environmental heterogeneity. Journal of Ecology 91: 114-125. Van Lieshout, M.N.M. y Baddeley, A.J. Van Lieshout, M.N.M. y Baddeley, A.J. 1999. Indices of dependence between types in multivariate point patterns.Scandinavian Journal of Statistics 26: 511-532. Venables, W.N. y Ripley, B. D. 2002. Modern Applied Statistics with S. 4ª ed. Wiegand, T., Jeltsch, F., Hanski, I. y Grimm, V. 2003. Using pattern-oriented modeling for revealing hidden information: a key for reconciling ecological theory and application. Oikos 100: 209-222 Wiegand, T. y Moloney, K. A. 2004. Rings, circles and null-models for point pattern analysis in ecology. Oikos 104: 209-229 |
viernes, 27 de marzo de 2009
La función de K de Ripley
Suscribirse a:
Entradas (Atom)