Los Biplots son un tipo de gráfico exploratorio usado en Estadística. Se trata de una generalización multivariante de un diagrama de dispersión de dos variables. . De la misma manera que un diagrama de dispersión muestra la distribución conjunta de dos variables, un BIPLOT representa tres o más variables. El biplot aproxima la distribución de una muestra multivariante en un espacio de dimensión reducida, normalmente de dimensión dos, y superpone sobre la misma representaciones de las variables sobre las que se mide la muestra. Un biplot permite mostrar gráficamente la información de las filas (individuos, casos objetos, etc ....) y las columnas (variables) de una matriz de datos multivariantes. El prefijo bi se refiere a este hecho y no a que el gráfico se hace normalmente en dos dimensiones. La reducción de la dimensión a solamente dos o tres se consigue cuando las variables están relacionadas entre sí.

Las filas se representan normalmente como puntos mientras las variables son representadas mediante vectores, ejes lineales, trayectorias no lineales o regiones de predicción. Las variables continuas se representan normalmente mediante líneas rectas mientras que las variables categóricas representan mediante regiones de predicción y puntos para cada nivel. Hay muchas generalizaciones del concepto general que incluyen la posibilidad de representar trayectorias no lineales, métricas diferentes de la identidad, proyectar variables externas, etc ....

Aunque se ha extendido bastante en los últimos años, no siempre ha tenido el tratamiento que merece ya que muchos trabajos que usan, por ejemplo, un Análisis de Componentes Principales entre muchas otras técnicas, serían susceptibles de mejorar incorporando la versión y la interpretación biplot.

Introducción e historia

editar

El biplot fue introducido por K. Ruben Gabriel (1971).[1]​ El biplot inicial de Gabriel esta una extensión del Análisis de Componentes Principales basado en la Descomposición en valores singulares. Gabriel (1972)[2]​ extiende el método al Análisis Canónico para la separación de grupos. Gower y Hand (1996)[3]​ escribieron la primera monografía sobre biplots en la que incluyen diversos tipos asociados con varias técnicas multivariantes. Galindo (1985)[4]​ realiza una versión simétrica similar al Análisis de Correspondencias que representa filas y columnas con la misma calidad. Yan y Kang (2000)[5]​ describieron varios métodos que pueden ser utilizados para visualizar e interpretar un biplot, especialmente en el contexto del estudio de la interacción genotipo-ambiente en estudios agrícolas. Vicente-Villardón(2006)[6]​ propone un biplot lineal para datos binarios que denomina "Biplot Logístico" ya que la relación entre las variables observadas y las dimensiones del biplot se modela mediante una curva de respuesta logística. El libro de Greenacre (2010)[7]​ es una guía orientada al usuario de biplots, junto con el código en el lenguaje de programación de código abierto R, para generar biplots asociados con Análisis de Componentes Principales (ACP), Escalamiento Multidimensional (MDS), análisis log-ratio (LRA) (también conocido como mapeo espectral- spectral mapping-)[8][9]Análisis Discriminante (DA) y varias formas de Análisis de Correspondencias: Análisis de Correspondencias Simples (CA), Análisis de Correspondencias Múltiples (MCA) y Análisis Canónico de Correspondencias (CCA). El libro de Gower, Lubbe y le Roux (2011)[10]​ tiene por objetivo popularizar los biplots como método útil y fiable para la visualización de datos multivariantes cuándo los investigadores quieren considerar, por ejemplo, Análisis de Componentes principales (PCA), Análisis Canónico de Poblaciones (CVA) o varios tipos de Análisis de Correspondencias. Recientemente se han desarrollado nuevas versiones para Mínimos cuadrados parciales (PLS Biplot[11]​), Biplot Logístico para datos nominales[12]​ y ordinales,[13]​ etc ...

Biplot General

editar
 
Representación biplot con proyecciones sobre una de las variables

Sea   una versión transformada de la matriz de datos  , cuyas n filas son individuos (también llamadas muestras, casos, objetos, etc ...), y cuyas p columnas son las variables. La matriz de datos inicial se transforma normalmente restando la media de sus columnas y dividiendo por su desviación típica. Llamaremos r al rango de  . De acuerdo con Gabriel (1971)[1]​ un Biplot se construye usando una factorización de la matriz de datos en el producto de otras dos de rango menor s, normalmente 2 o 3,

  ( )

donde   es una matriz  ,   es una matriz   y   es una matriz de residuales. La descomposición se seleccionará para que los valores de la matriz de datos se aproximen lo mejor posible. Las filas   de   y las filas   de   pueden tomarse como marcadores de los individuos y las variables en   y representarse como vectores (o puntos) en un espacio euclídeo de dimensión reducida de forma que el producto escalar de una marcador fila por un marcador columna aproximen el valor correspondiente de la matrix de datos original

  ( )

es decir, la representación gráfica correspondiente al modelo en rango reducido se interpreta en términos de productos escalares.

La bondad de ajuste de la aproximación es

 

Una representación Biplot típica es un conjunto de puntos que representan a las filas y un conjunto de vectores que representan a las columnas de la matriz de datos. Cada elemento de la matriz de datos se aproxima como el producto escalar del vector (punto) que representa a su fila por el vector que representa a su columna. Proyectando cada punto fila sobre la dirección (vector) que representa a una variable y multiplicándola por la longitud del vector tendremos la aproximación de una columna completa de la matriz de datos. Como normalmente tendremos datos centrados, los puntos que se proyectan en la dirección positiva de la flecha son los que se encuentran por encima de la media y los puntos que se proyectan en la prolongación en sentido contrario tendrán valores por debajo de la media ya que el origen de coordenadas representa las medias de las variables. Cuanto más se aleja la proyección del origen, mayor es la magnitud de la diferencia con la media. Otros tipos de transformaciones previas necesitarían un estudio más detallado de la interpretación concreta de la transformación.

 
Representación biplot con escalas graduadas y proyecciones sobre una de las variables

Las direcciones que representan a las variables pueden completarse con escalas graduadas para predecir los valores originales. Para ello basta comprobar que la predicción del valor unitario de cada variable se realiza en el punto  . Colocando valores en   y haciendo variar los valores de   en la forma deseada obtendremos la escala graduada. Los valores de   sirven para etiquetar las escalas. La graduación de las escalas no depende de la factorización elegida. La bondad del ajuste para las proyecciones en una variable j puede calcularse dividiendo la suma de cuadrados de los valores ajustados de la columna correspondiente entre la suma de cuadrados total de la misma columna.

 

que se conoce como predictividad o calidad de representación de la variable j-ésima. Si las columnas de la matriz de datos están centradas,   es el coeficiente de correlación al cuadrado entre los valores ajustados y los observados, es decir, el porcentaje de la variabilidad de la variable explicado por el biplot. La medida sirve como ayuda para interpretar qué variables están adecuadamente representadas en el gráfico. Un razonamiento análogo podría hacerse para la aproximación de las filas, aunque podemos añadir una interpretación adicional   sería el coseno al cuadrado del ángulo que forma el vector en el espacio en dimensión completa y su proyección en dimensión reducida .

La factorización de la matriz no es única ya que si   es una factorización biplot válida y   es una matriz   no singular,   también lo es. Para obtener una representación única podemos imponer restricciones sobre   y   o seleccionar factorizaciones particulares con propiedades interesantes desde el punto de vista estadístico.

Biplot Clásico (Análisis de Componentes Principales y Factorial)

editar

La factorización más popular que dio lugar a la versión original de Gabriel (1971)[1]​ proviene de la descomposición en valores singulares (DVS) ya que obtiene la mejor aproximación de bajo rango   de  .  . El resultado se conoce como teorema de Eckart y Young. Además, la DVS está íntimamente relacionada con el Análisis de Componentes Principales y el Análisis Factorial.

Utilizando la DVS, podemos escribir

 

donde   son los valores singulares (no negativos) ordenados en orden decreciente,   son los vectores singulares por la izquierda y   los vectores singulares por la izquierda que se organizan, por columnas, en las matrices   y  , respectivamente. Es conocido que   son los vectores propios de   y   los de  .   son las raíces cuadradas de los valores propios no nulos de ambas matrices, que son los mismos. La aproximación a bajo rango (s) se obtiene tomando los primeros s términos de la DVS

 

donde los subíndices   y   significa las s primeras columnas, y todas menos las s primeras, respectivamente. La bondad del ajuste de la aproximación a bajo rango se calcula dividiendo la suma de cuadrados de la aproximación entre la suma de cuadrados total o lo que es lo mismo el cociente entre la suma de cuadrados de los primeros s valores singulares y la suma de cuadrados de todos.

 

que, habitualmente se expresa en forma de porcentaje. La aproximación a bajo rango puede servir, por ejemplo, para separar la señal del ruido en una matriz de datos.

Si la aproximación a bajo rango en dos o tres dimensiones puede considerarse adecuada, puede representarse mediante un biplot tomando   y   con  . El ajuste de los valores originales no depende de la elección particular de   ya que los valores ajustados son siempre los mismos.

Cuando  , se obtiene el denominado JK-Biplot o RMP-Biplot. Las coordenadas de las filas son las coordenadas sobre las componentes principales y las coordenadas de las columnas son los vectores propios de la matriz de covarianzas (con datos centrados) o de correlaciones (con datos estandarizados). Las distancias euclídeas entre los puntos fila en el biplot aproximan las distancias eucídeas entre filas en el espacio multidimensional. Además son las Coordenadas Principales o Escalado Clásico para la matriz de distancias euclídeas entre individuos.

Cuando  , se obtiene el denominado GH-Biplot o CMP-Biplot. Las coordenadas de las filas están estandarizadas. La distancia entre filas aproxima la distancia de Mahalanobis en el espacio multidimensional aunque las calidad de aproximación es baja debido a que la distancia de Mahalanobis no puede separase en direcciones principales. Las covarianzas y varianzas entre variables se aproximan de forma óptima, de forma que los cosenos de los ángulos entre los vectores que las representan aproximan las correlaciones entre ellas, y la longitud de los vectores aproxima la variabilidad. Si los datos están estandarizados, la representación está directamente relacionada con la solución de las componentes principales al Análisis Factorial. Las coordenadas de las variables son las saturaciones o cargas del modelo factorial, las calidades de representación mencionadas antes son las comunalidades, lo mismo que la longitud al cuadrado de los vectores en el espacio en dimensión reducida.

Cuando  , se obtiene el denominado SQRT-Biplot que ya no está relacionado con técnicas conocidas aunque mantiene la calidad de la representación de las entradas de la matriz de datos.

Para la visualización de los distintos biplots puede ser necesario rescatar la escala de las coordenadas ya que las dispersiones de ambas nubes no son las mismas. En la práctica multiplicar las coordenadas de las filas por un escalar y dividir las de las columnas por el mismo escalar no modifica los productos escalares pero puede mejorar sensiblemente la calidad de la representación.

HJ-Biplot

editar

Galindo (1985)[4]​ propone el denominado HJ-Biplot. Si queremos representar las dos nubes con la misma dispersión podemos tomar como coordenadas de las filas y de las columnas a   y  . Esta forma es la mejor representación β-baricéntrica en el sentido del Análisis de Correspondencias. En este caso el producto escalar no aproxima los valores observados de la matriz y las interpretaciones deben hacerse con referencia a los ejes factoriales. Lo que antes denominábamos contribuciones siguen siendo útiles ya que muestran la variabilidad de cada una de las variables explicada por la solución factorial.

El método es una generalización del Análisis Factorial de Correspondencias simétrico para matrices con cualquier tipo de datos y no solamente frecuencias y abundancias. Ha sido ampliamente utilizado en la literatura en diversas aplicaciones a distintos campos de la ciencia.

Biplot Externo

editar

Decimos que un biplot es externo cuando las coordenadas de filas y columnas no se calculan simultáneamente. Por ejemplo, calculamos las coordenadas de las filas   mediante un Análisis de Coordenadas Principales o un Escalado Multidimensional y las coordenadas de las columnas mediante un procedimiento externo como Análisis Procrustes o Regresión Múltiple. Todo lo anterior en relación con lainterpretación y las medidas de la bondad del ajuste sigue siendo válido para este tipo de biplot.

Biplot de Regresión

editar

Si   es conocido, o se ha calculado previamente,   puede obtenerse mediante Regresión Multivariante como

 

o mediante una Regresión Múltiple para cada columna.

 

donde   es la j-ésima fila de   e   es la j-ésima columna de  . El R2 de la regresión sería la calidad de la representación que hemos mencionado antes. El biplot resultante sigue todas las reglas de interpretación descritas antes. Este método permitiría también la proyección de variables externas que no intervinieron en el cálculo de las coordenadas.

Biplot de Procrustes

editar

Si   es conocido, o se ha calculado previamente,   puede obtenerse mediante Análisis Procrustes.

Realizaremos la transformación Procrustes de la matriz   para que la discrepancia con   sea lo más pequeña posible. Como ambas matrices tienen que tener el mismo número de columnas, completamos la matriz   con columnas de ceros, llamemos   a la matriz completada. Buscamos una matriz ortogonal   y un escalar t de forma que la matriz   sea lo más cercana posible a  . La solución se obtiene del Análisis Procrustes   donde   y   se obtienen de la DVS   y  . La matriz buscada   se obtiene seleccionando las primeras s columnas de  .

Como antes, todo lo expuesto es válido para este tipo de biplot.

Biplot mediante regresiones alternadas

editar

El biplot puede obtenerse también mediante mínimos cuadrados alternando regresiones por filas y por columnas. Si   es conocido,   puede obtenerse mediante Regresión Multivariante como  . Si   es conocido,   puede obtenerse mediante Regresión Multivariante como  . Tomando valores iniciales y alternando ambas regresiones, el procedimiento converge a la misma solución que la DVS. El procedimiento puede desarrollarse separando para cada fila y para cada columna lo que permite, por ejemplo, introducir ponderaciones para cada elemento de la matriz, datos faltantes, etc ...

Biplot Canónico, MANOVA Biplot

editar
 
Biplot Canónico con escalas graduadas sobre las variables

Inicialmente propuesto por Gabriel (1972),[2]​ aunque su aplicación no se desarrolló probablemente debido a que estaba publicado en una revista de meteorología. Cuando las filas de la matriz de datos tienen una estructura de grupos definidos a priori y el propósito es buscar las diferencias entre grupos, el ACP y los métodos biplot clásicos no son apropiados. La técnica clásica para analizar la estructura de grupos sería un Análisis Multivariante de la Varianza para contrastar las diferencias, un Análisis Discriminante para clasificar un individuo nuevo o un Análisis Canónico de Poblaciones (ACPo) (también conocido Factorial Discriminante, Coordenadas Discriminantes) para representar gráficamente los resultados de las dos técnicas anteriores. Es posible realizar una representación biplot del ACPo como se describe a continuación:

Supongamos que las n de la matriz de datos   están divididas en g grupos mutuamente excluyeres con nk (k = 1, 2..., g) (n = n1 + n2 +... + ng) individuos cada uno, por ejemplo, distintos tratamientos procedentes de un diseño experimental o muestras de distintas poblaciones. La matriz puede transformarse como antes, centrando y estandarizando, para obtener  . Sean   la matriz que contiene las medias de los grupos en cada variable,   la matriz diagonal con los tamaños muestras de los grupos y   y   las matrices de covarianzas "dentro" de los grupos y "entre" grupos, respectivamente.

El ACPo trata de obtener combinaciones lineales de las variables que tengan máximo poder discriminante, es decir, que separen lo mejor posible entre los grupos. Ss basa en los vectores propios de  . La primera variable canónica se interpreta también como la combinación lineal de variables que produce el valor de la F univariante más alta para la comparación de los grupos. En la representación gráfica de las primeras variables canónicas, la distancia entre los grupos aproxima la distancia de Mahalanobis entre los mismos en el espacio multidimensional. Un biplot al que se añade información sobre las variables a una representación canónica puede construirse de la siguiente forma:

Un biplot para la matriz de medias   puede obtenerse de la DVS generalizada utilizando como métricas  y  , puede obtenerse de la DVS usual de la matriz  que contiene las medias de los grupos transformadas. Sea   la mencionada DVS. Podemos escribir  , entonces las coordenadas del biplot se seleccionan como   y   en la dimensión adecuada. De esta forma, las coordenadas de los grupos son las coordenadas discriminantes y están separadas por una aproximación de la distancia de Mahalanobis.

Pueden representarse regiones de confianza circulares para la medias de los grupos que nos ayudarán a interpretar la significación de las diferencias. Las regiones se pueden construir usando la T2 de Hotteling, la forma clásica con distribución chi-cuadrado o usando distribuciones t de Student para la proyección de la región de confianza sobre cada una de las variables. Si dos regiones de confianza no se cruzan, hay una diferencia estadísticamente significativa entre los dos grupos. El test es conservador en el sentido que cuando dos regiones se cruzan el procedimiento no es concluyente ya que pueden estar separadas en otra dimensión del espacio.

Biplot Generalizado

editar

Hay varias formas de generalizar el biplot, por ejemplo, añadiendo métricas distintas de la identidad, permitiendo trayectorias para las variables diferentes de una línea recta o representaciones mediante regiones de predicción.

Otros Biplots

editar

Muchas técnicas multivariantes llevan asociado un biplot desde el momento de su creación y no se han descrito aquí. En general, cualquier técnica multivariante relacionada con una DVS o con una factorización matrícula es susceptible de ser representada mediante un biplot, en unos casos la relación está descrita en la literatura mientras que en otros está aun por investigar. Parece claro que muchas técnicas mejoran su interpretabilidad y su utilidad añadiendo la forma biplot.

Software

editar

Muchos de los paquetes de uso general como SPSS,[14]​ SAS,[15]​ Minitab[16]​ o STATA[17]​ pueden utilizarse para producir versiones básicas del biplot aunque tengan funcionalidad limitada y la forma de obtenerlos no está al alcance de un usuario medio. En la parte básica de R se incluye la función

biplot

que permite el dibujo de un biplot muy básico. El hecho de que no haya disponibles rutinas para realizar las representaciones biplot en los paquetes estadísticos de uso más frecuente hace que no haya sido utilizado de forma masiva en la investigación aplicada.

Pueden encontrarse algunos paquetes y utilidades más específicos con mayor funcionalidad. Listamos unos pocos aunque seguramente podremos encontrar algunos más.

Paquetes comerciales

editar

GGE-Biplot:[18]​ Paquete comercial dirigido a la construcción de los Biplots clásicos inicialmente dirigido al ámbito de la Agronomía pero utilizable en cualquier ámbito en el que el Biplot sea útil.

MVSP:[19]​ Paquete comercial para el análisis de datos en Ecología que cuenta con biplots.

PC-ORD: Paquete comercial para el análisis de datos en Ecología que cuenta, entre muchas otras técnicas, con biplots.

CANOCO:[20]​ Paquete para el Cálculo de un Análisis Canónico de Correspondencias que también incluye Biplot para Componentes Principales, entre otros.

Paquetes libres

editar

XLS-Biplot:[21]​ Un añadido para Excel que permite la construcción de Biplots básicos.

ViSta:[22]​ El nombre proviene de Visual Statistics. Es un paquete general con algunas funcionalidad para construir Biplots. Hace tiempo que no se actualiza.

Brodgar:[23]​ Paquete para el análisis de datos en Ecología que cuenta, entre muchas otras técnicas, con biplots.

MultBiplot:[24]​ "Multivariate Analysis using Biplots". Paquete que incluye muchas técnicas de Análisis Multivariante presentadas en forma Biplot: ACP, Biplot Factorial, HJ-Biplot, Correspondencias, Canónico de Correspondencias, Unfolding, STATIS-ACT, Meta-Biplot, Biplot Canónico, Biplot Logístico, entre muchas otras. [1] Dispone de una interface visual clásica que facilita su manejo. Funciona en Windows o Mac. En algunos de los análisis puede utilizarse como GUI del paquete en R.

PAQUETES de R

editar

BiplotGUI:[25]​ Paquete de R dirigido al cálculo de Biplots que, además de los clásicos incluye Biplot Canónico, Biplot Externo, Biplot No Lineal, Biplot Generalizado, entre otros. Solamente está disponible para Windows.

GGEBiplotGUI:[26]​ Biplot GGE interactivo en R. Paquete de R para construir GGE Biplot.

multibiplotGUI:[27]​ Biplot para Análisis Factorial Multiple.

biplotbootGUI:[28]​ Biplot clásico que incluye bootstrap para las calidades de representación.

NominalLogisticBiplot:[12]​ Biplot Logístico para datos nominales.

OrdinalLogisticBiplot:[13]​ Biplot Logístico para datos ordinales.

ade4:[29]​ Paquete de R para el análisis de datos en Ecología que cuenta, entre muchas otras técnicas, con biplots.

vegan:[30]​ Paquete de R para el análisis de datos en Ecología que cuenta, entre muchas otras técnicas, con biplots.

MultBiplotR:[24]​ Versión para R del paquete independiente MultBiplot. Disponible en CRAN. Contiene diversos métodos biplot

Referencias

editar
  1. a b c 'Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika, 58(3), 453-467.
  2. a b Gabriel, K. R. (1972). Analysis of meteorological data by means of canonical decomposition and biplots. Journal of Applied Meteorology, 11
  3. Gower, J. C., & Hand, D. J. (1995). Biplots (Vol. 54). CRC Press.
  4. a b Galindo Villardon, M. (1986). Una alternativa de representacion simultanea: HJ-Biplot. Qüestiió. 1986, vol. 10, núm. 1.
  5. Yan, W., Hunt, L. A., Sheng, Q., & Szlavnics, Z. (2000). Cultivar evaluation and mega-environment investigation based on the GGE biplo<meta />t. Crop Science, 40(3), 597-605.
  6. Vicente-Villardón, J. L., Galindo-Villardón, M. P., & Blázquez-Zaballos, A. (2006). Logistic biplots. Multiple correspondence analysis and related methods. London: Chapman & Hall.
  7. Greenacre, M. J. (2010). Biplots in practice. Fundacion BBVA.
  8. Lewi, Paul J. (2005). «Spectral mapping, a personal and historical account of an adventure in multivariate data analysis». Chemometrics and Intelligent Laboratory Systems 77 (1-2): 215-223. doi:10.1016/j.chemolab.2004.07.010. 
  9. David Livingstone (2009). A Practical Guide to Scientific Data Analysis. Chichester, John Wiley & Sons Ltd, 233-238. ISBN 978-0-470-85153-1
  10. Gower, J. C., Lubbe, S. G., & Le Roux, N. J. (2011). Understanding biplots. John Wiley & Sons.
  11. Oyedele, O. F., & Lubbe, S. (2015). The construction of a partial least-squares biplot. Journal of Applied Statistics, 42(11), 2449-2460.
  12. a b Hernández-Sánchez, J.C. & Vicente-Villardón, J.L. Adv Data Anal Classif (2016). doi:10.1007/s11634-016-0249-7
  13. a b Vicente-Villardón, J. L., & Sánchez, J. C. H. (2014). Logistic Biplots for Ordinal Data with an Application to Job Satisfaction of Doctorate Degree Holders in Spain. arXiv preprint arXiv:1405.0294.
  14. SPSS Inc (2008). SPSS. Chicago, IL, USA. URL http://www.spss.com/.
  15. SAS Institute Inc (2009). Cary, NC, USA. URL http://www.sas.com/.
  16. Minitab Inc (2007). Minitab. Minitab Inc, State College, PA, USA. URL http: //www.minitab.com/.
  17. StataCorp LP (2007). Stata, Version 10. StataCorp LP, College Station, TX, USA. URL: http://www.stata.com/.
  18. Yan W, Kang MS (2006). GGEbiplot, Version 5. URL http://www.ggebiplot.com/.
  19. Kovach Computing Services (2008). MVSP. Kovach Computing Services,Anglesey, UK. URL http://www.kovcomp.co.uk/mvsp.
  20. Plant Research International (2002). Canoco, Version 4.5. Plant Research International, Wageningen, The Netherlands. URL http://www.pri.wur.nl/uk/products/canoco Archivado el 30 de agosto de 2012 en Wayback Machine..
  21. Udina F (2005b). XLS-Biplot, Version 1.1a. Universitat Pompeu Fabra, Barcelona, Spain. URL http://tukey.upf.es/xls-biplot/index.html.
  22. Young FW (2001). ViSta, Version 6.4. University of North Carolina, Chapel Hill, NC, USA. URL http://visualstats.org/.
  23. Highland Statistics Ltd (2008). brodgar, Version 2.5.7. Highland Statistics Ltd, Newburgh, UK. URL http://www.brodgar.com/.
  24. a b Vicente-Villardón, J. L. (2010). MULTBIPLOT: A package for multivariate analysis using biplots. Departamento de Estadística. Universidad de Salamanca. http://biplot.usal.es/classicalbiplot/ Archivado el 29 de agosto de 2016 en Wayback Machine.
  25. La Grange, A., Le Roux, N., & Gardner-Lubbe, S. (2009). BiplotGUI: interactive biplots in R. Journal of Statistical Software, 30(12), 1-37.
  26. Frutos, E., Galindo, M. P., & Leiva, V. (2014). An interactive biplot implementation in R for modeling genotype-by-environment interaction. Stochastic Environmental Research and Risk Assessment, 28(7), 1629-1641.
  27. Nieto-Librero, A. N., Baccala, N., & Galindo, M. P. (2011). MultibiplotGUI: Multibiplot Analysis in R [Programa informático]. Salamanca, España: Departamento de Estadística, Universidad de Salamanca. {{Enlace roto|1=http://cran |2=http://cran/ |bot=InternetArchiveBot }}. r-project. org/web/packages/mul tibiplotGUI/index. html.
  28. Nieto, A. B., Galindo, M. P., Leiva, V., & Vicente-Galindo, P. (2014). A methodology for biplots based on bootstrapping with R. Revista colombiana de estadística, 37(2), 367-397.
  29. Thioulouse, J., Chessel, D., Dole, S., & Olivier, J. M. (1997). ADE-4: a multivariate analysis and graphical display software. Statistics and computing, 7(1), 75-83.
  30. Dixon, P. (2003). VEGAN, a package of R functions for community ecology. Journal of Vegetation Science, 14(6), 927-930.