Durante los últimos años ha surgido una enorme contribución de la física teórica hacia el entendimiento de los sistemas económicos, dando lugar a la emergencia de un nuevo campo de estudio denominado econofísica 2-4. Dentro de esta área, entender la estructura de las correlaciones entre diferentes mercados financieros es una de las líneas de investigación que más rápidamente crece debido a la gran importancia en el contexto de la optimización de portafolios 5. Un nuevo enfoque para entender este tipo de correlaciones viene de la teoría de matrices aleatorias (RMT, por sus siglas en inglés), la cual fue introducida en estadística matemática por Wishart en 1928 6. En la década de 1950, Wigner utiliza RMT para lidiar con la estadística de eigenvalores y eigenvectores de sistemas complejos de muchos cuerpos en el contexto de la física nuclear 7,8,9,10. Muchos fenómenos de la física han sido resueltos exitosamente utilizando el formalismo de RMT, pero no fue hasta la aparición de los trabajos casi simultáneos de Stanley et al. 11 y Bouchoud et al. 12 que se incrementó considerablemente la cantidad de estudios dedicados a entender la estructura de los mercados financieros a través de la aplicación de métodos provenientes de RMT 13,14,15,16,17.
Por otro lado, la influencia de las noticias financieras y de las redes sociales no ha sido explorada exhaustivamente debido a la Hipótesis del Mercado Eficiente (EMH, por sus siglas en inglés). De acuerdo con la EMH, el precio de la acción incorpora instantáneamente toda la información disponible del mercado, y su valor no depende del precio en el pasado 17. No obstante, recientemente una serie de trabajos han comenzado a investigar la influencia de las fuentes textuales de Internet en los movimientos de los mercados 18-25, mostrando que la información extraída de Twitter, StockTwits, Google Trends, y la revista financiera Financial Times, dan indicaciones tempranas que pueden ayudar a predecir cambios en la bolsa de valores. Estos nuevos resultados están construyendo un fuerte sustento en contra del tan aceptado paradigma de mercado eficiente, apoyando la aproximación de la economía conductual 26. En ese sentido, los resultados de este trabajo intentan mostrar una evidencia más en contra de este paradigma desde una nueva perspectiva.
La aproximación que se seguirá aquí para analizar los mercados financieros globales se sustenta en los resultados de RMT. Asimismo, en este estudio se incorpora la influencia de la red social Twitter mediante el análisis de sentimiento, el cual se basa en asignar un valor numérico a los datos textuales de acuerdo a su contenido. Aquí se utilizó la polaridad como medida del estado de ánimo, relacionando el puntaje obtenido con el precio al cierre de las bolsas de valores estudiadas.
Nuestro método de análisis se desarrolla desde el marco conceptual de la física estadística y de los sistemas complejos, ya que intentamos descubrir propiedades emergentes que escapan a los analistas financieros en econometría. Sin embargo, cuando se intentan crear paralelismos entre la física estadística y los mercados financieros, una cuestión importante que se debe tener en cuenta siempre es la complejidad del comportamiento humano, el cual es el origen de toda estrategia de comercio en la bolsa de valores (4).
Este trabajo está organizado como sigue: se describen los datos analizados, así como la metodología para extraer la colección pública de tweets; se explica cómo se llevó a cabo el análisis de sentimiento, y se describe el método seguido para construir las series de tiempo de polaridad. Asimismo, se muestran los resultados y análisis de los mismos, comenzando con la construcción de la matriz de correlación y terminando con el uso de la teoría de matrices aleatorias en el contexto del análisis multivariante. Finalmente, se da una conclusión general del trabajo.
Nuestro análisis se llevó a cabo para dos conjuntos diferentes de datos. El primer conjunto de datos está compuesto por los precios diarios al cierre de 20 índices financieros alrededor del mundo. Los países donde cotizan estos índices, así como los símbolos correspondientes están listados en las dos primeras columnas de las Tabla 1. El segundo conjunto de datos fue obtenido mediante la extracción de tweets asociados con cada uno de los índices financieros listados en el primer conjunto. Todas las consultas de Twitter fueron hechas en el horario universal (UTC), mientras que la consulta de los precios al cierre varía de acuerdo con la zona horaria donde cotizan los mercados involucrados de cada índice. Para ambos conjuntos de datos el periodo de tiempo bajo estudio comprendió del 22 de febrero al 13 de octubre de 2014, dando un total de L = 166 días de negociación, es decir, sin considerar los fines de semana. Los datos de los precios al cierre fueron obtenidos de la base de datos de Bloomberg, y siguieron el mismo preprocesamiento que en 27.
Por otro lado, todos los tweets fueron extraídos de la base de datos de Twitter mediante la interface Twitter Search api. Además, se utilizó un código wrapper en el lenguaje python para manejar de manera más eficiente los métodos del api de Twitter. Los keyword utilizados para obtener la colección de datos de Twitter se muestran en la Tabla 1. Cabe resaltar que se obtuvieron aproximadamente 2,400 tweets por keyword por día, extrayendo en total cerca de 8 millones de tweets para este análisis.
El análisis de sentimiento es un campo de estudio del procesamiento de lenguaje natural, minería de opiniones, y lingüística computacional 28,29. El método de estados emocionales y el de polaridad son las dos aproximaciones principales para calificar numéricamente los datos textuales. Nosotros utilizamos la aproximación de polaridad debido a que se puede asociar de manera más directa con los movimientos positivos y negativos de los índices financieros. La polaridad, en esencia, mide la diferencia entre el número de palabras positivas y negativas encontradas en datos textuales, y está dada por la fórmula:
donde p y n se refieren al total de palabras positivas y negativas, respectivamente.
Por otro lado, la red social Twitter permite a sus usuarios mandar y recibir mensajes cortos de hasta 140 caracteres, a los cuales se les conoce como tweets.
Un tweet es una combinación de caracteres intercalados con espacios en blancos, donde cada cadena de caracteres está compuesta por una secuencia alfanumérica, mezclada con caracteres especiales como son: @, $, #, %, &, etc. Por lo que cada tweet necesita de un preprocesamiento para eliminar los caracteres no deseados, los cuales introducen ruido para interpretar el significado de la información contenida en su texto. El primer paso es dividir cada uno de los tweets en las cadenas de caracteres que lo componen, evitando los símbolos no alfanuméricos. Como resultado se obtiene una colección de palabras individuales. A esta operación se le conoce como tokenización. Una vez que el tweet es tokenizado, cada elemento de la colección de palabras se simplifica o reduce mediante el método de stemming, el cual consiste en eliminar los afijos morfológicos dejando solamente la raíz de la palabra. Al finalizar esta etapa, el tweet ya se encuentra listo para ser categorizado por el análisis de sentimiento.
En nuestro estudio, el análisis de sentimiento se realizó con ayuda del código pysentiment3. Este código implementa el diccionario Harvard IV, el cual ha tenido éxito en predecir el desempeño de los mercados de valores 27,28. Este diccionario está compuesto de más de 8000 palabras y 182 categorías. Al considerar solamente las categoría positive y negative fue posible crear un conjunto de series de tiempo de polaridad a partir de la colección publica de tweets. Cada una de estas series de tiempo asociada a un único keyword de la Tabla 1, por lo que el conjunto está compuesto de 20 series de tiempo. Estas series de tiempo se construyeron como sigue. Primeramente, la colección pública de tweets se clasificó por keyword y fecha en una base de datos. En seguida, a cada tweet de la base de datos se le calculó la polaridad mediante de arriba. Después, se calculó el promedio de todas las polaridades para cada día y keyword dado. Finalmente, a este promedio se le consideró la polaridad P k (t) del keyword k al tiempo t, donde las unidades de tiempo se eligieron en días. En la Tabla 2 se muestra esquemáticamente el proceso de cálculo de polaridad para un tweet individual.
En esta sección se presentan algunas técnicas matemáticas provenientes de la física estadística que nos ayudarán a entender la estructura de las matrices de correlación asociadas a nuestros datos empíricos, es decir, los datos provenientes de Twitter y de los índices financieros globales. Para los primeros, en lugar de los datos crudos se utilizaron las series de tiempo de polaridad, mientras que para los segundos datos se usaron los retornos diarios al cierre. Además, puesto que en general los mercados financieros no cotizan los fines de semana, se ajustaron las series de tiempo de polaridad a los días de cotización de los índices financieros, desfasando además sus valores por un día.
Denotemos por S k (t) el precio al cierre del índice k al día t. Los retornos R k (t ) para cada índice k = 1, … , 20 al tiempo t se obtienen mediante:
donde se eligió t = 1, tal que el intervalo de retorno sea de un día. Además, con el propósito de comparar nuestros datos empíricos con los resultados provenientes de la física estadística, las series de tiempo de polaridad y retornos son normalizadas. El retorno normalizado para el índice k al tiempo t está dado por:
donde σ k es la desviación estándar de R k , y < … > denota el promedio temporal sobre el periodo estudiado. La polaridad se normalizó de la misma manera, y es denotada como p k (t) para el índice k al tiempo t. Por otro lado, la forma más simple de caracterizar los coeficientes de correlación entre series de tiempo normalizadas es mediante el cálculo de los elementos de matriz de Pearson:
donde el superíndice x es para denotar el tipo de serie de tiempo con la que se está trabajando, de tal
manera que
En la Figura 1 se muestran las matrices de correlación de las polaridades y retornos como mapas de calor. En estas figuras las etiquetas del keyword son remplazadas por el nombre del país que representa al índice financiero o a la serie de tiempo de polaridad asociada. En esta representación los cuadros de color más oscuro denotan las correlaciones fuertes, mientras que los cuadros más claros representan las correlaciones débiles o anticorrelaciones. Los casos extremos son c k,l = 1(-1), lo que corresponde a una perfecta correlación (anticorrelación), mientras que c k,l = 0 significa que la correlación es nula entre los elementos k y l. Se puede ver en la Figura 1a, que emergen algunos patrones en los datos de retorno, como es la fuerte correlación entre el sector europeo, Estados Unidos de Norteamérica y México, así como Norteamérica con Europa, y el sector asiático, lo cual refleja la codependencia de las economías debido a su posición geográfica. No obstante, si seguimos la posición de estos índices en la Figura 1b no encontramos la misma estructura. De aquí surge la necesidad de realizar un análisis más profundo para averiguar si existe una estructura de correlación oculta en la series de tiempo de polaridad.
Notas: (a) Elementos de la matriz de correlación para datos de retorno. (b) Elementos de la matriz de correlación para datos de polaridad. En esta escala de representación de colores, el valor mínimo corresponde al blanco, mientras que los valores más grandes corresponden a colores azul intenso.
Fuente: Elaboración propia.
Deseamos ahora introducir una herramienta fundamental para el análisis multivariante proveniente de RMT. Sea W una matriz de dimensión N × T, cuyos elementos son variables gaussianas estadísticamente independientes con media cero y varianza fija. La matriz H = WW + es conocida en RMT como matriz de Wishart y al ensemble (conjunto) generado por estas matrices como ensemble de Wishart (WE). Por construcción, estas matrices están formadas por N series de tiempo no correlacionadas de longitud finita T.
La densidad de probabilidad del espectro de eigenvalores se puede resolver analíticamente en el límite N, T → ∞, y Q = T/N ≥ 1, para el caso en que las entradas de la matriz H son números reales. A lo que se conoce como ley de Marcenko-Pastur 30:
la cual presenta las cotas λ− ≤ λ ≤ λ+ donde:
La cuestión de interés para nosotros es que si no existen correlaciones entre las series de tiempo, entonces la distribución de los eigenvalores de la matriz de correlación debe estar acotada dentro de la ley de Marcenko-Pastur. Estas predicciones son conocidas como resultados universales de las matrices de Wishart, y constituyen la hipótesis nula de la ausencia de correlaciones entre las variables de estudio, en nuestro caso entre los índices financieros globales y las polaridades de Twitter.
Aunque los resultados universales de las matrices de Wishart son válidos únicamente para dimensiones asintóticas (N, T → ∞,), compararlos con nuestros datos empíricos sigue siendo útil, ya que nos puede proporcionar indicios acerca de la presencia de correlaciones ocultas. Para este propósito, hemos construido un conjunto de matrices de correlación muestra a partir de ventanas de tiempo de T = 80 días de cotización, deslizándolas por un día. De esta manera, hemos obtenido dos muestras de M = 86 matrices de correlación, uno para los valores de polaridad, y el otro conjunto para los de retorno. Dentro de estos conjuntos, cada matriz de correlación tiene dimensiones N, T = 20 × 80, con Q = T/N = 4, por lo que el espectro de eigenvalores está acotado entre los límites λ- = 0.25 y λ+ = 2.25, y uno esperaría como hipótesis nula, que la gran mayoría de los eigenvalores no presenten correlaciones y se encuentren dentro de estos límites.
Sin embargo, se encontró que los eigenvalores extremos para el conjunto de matrices de correlación de polaridad están entre λ- = 0.0526 y λ- = 3.8215, mientras los de retornos se encuentran entre entre λ- = 0.0556 y λ- = 6.6942. Además, se encontró que solamente el 68:02% de los eigenvalores de polaridad y 72:27% de los de retorno caen dentro de los resultados universales de la RMT, es decir, dentro de la zona asociada a ruido, donde no se presentan correlaciones. La distribución de eigenvalores para los datos empíricos, así como de las matrices de correlación se han graficado en la Figura 2, superponiendo la ley Marcenko-Pastur en la misma figura.
Notas: La línea negra muestra la ley de Macenko-Pastur. La línea gris representa los resultados numéricos para 10,000 miembros de WE, la línea azul los resultados para las polaridades, y la línea verde para los retornos.
Fuente: Elaboración propia.
Es importante recordar que la distribución de Marcenko-Pastur es válida solamente para el límite asintótico, por lo que las distribuciones finitas siempre presentan desviaciones a este resultado. Además, entre más grande es el valor T/N, más confiables son los resultados, y las fluctuaciones son descritas de forma más realista por la varianza de los datos. Pero si T/N es un número pequeño, los resultados se verán afectados fuertemente por la finitud de la matriz de datos. En estos casos es una práctica común utilizar técnicas de noise dressing para omitir el ruido intrínseco de la matriz de correlación 31,32,33. Aun así, estas técnicas funcionan bien hasta dimensiones cercanas a N = 50, para dimensiones más pequeñas (que es nuestro caso) se debe proceder de manera diferente.
Otro hecho que puede generar desviaciones de los resultados universales de las matrices de Wishart se debe a que la distribución de los retornos usualmente tiene colas más largas que la distribución normal 1, la cual se asume de manera idealizada en la derivación de la ley de Marcenko-Pastur. Para observar este fenómeno, en la Figura 3 se ha graficado la distribución de los datos empíricos junto con la distribución normal y la distribución t-Student para caracterizar la distribución de los retornos. Para nuestro periodo de estudio, el parámetro a = 5.53 fue el que mejor se ajustó al caracterizar la distribución de los retornos, mientras la distribución de las polaridades parece ajustarse mucho mejor con la distribución normal en este caso: cabe resaltar que los datos de polaridad parecen romper la regla de colas largas encontrada por muchos autores para los retornos.
En el área de riesgo financiero y optimización de portafolios, los eigenvalores más grandes y más pequeños representan cantidades muy importantes, pues están asociados con los casos extremos de riesgo en una cartera de inversión 5. Los eigenvalores más grandes corresponden a una mezcla arriesgada de acciones o mercados financieros, mientras que los eigenvalores más pequeños están relacionados con un portafolio de bajo riesgo 34. El eigenvalor más grande es el factor que representa la información colectiva de los índices, y el eigenvector correspondiente es conocido como el modo del mercado. Este eigenvector nos dice si los índices como conjunto van a la alza o a la baja, siendo su tendencia condicionada al estado actual del mercado 34.
Estas características han sido exploradas exhaustivamente con datos provenientes de los índices financieros. Sin embargo, hasta el momento no se ha hecho un estudio con datos textuales. Es por ello que aquí se explora si este fenómeno también emerge al trabajar con la información proveniente de Twitter. Para este fin se analizó el comportamiento temporal del eigenvalor más grande y más pequeño de las matrices de correlación empíricas para cada periodo de estudio, utilizando la misma muestra de matrices (M = 86).
En la Figura 4 se muestran los resultados empíricos para nuestro periodo de estudio, junto con la media y desviación estándar de una simulación numérica de 10,000 miembros de WE, donde cada punto se calcula teniendo en cuenta los 80 días de transacción anteriores. Se puede observar que los resultados empíricos están lejos de los bordes teóricos, así como a más de tres desviaciones estándar de los resultados numéricos. Además, se encontró una anticorrelación fuerte entre polaridades y retornos al comparar el comportamiento temporal de sus eigenvalores más grandes. El coeficiente de Pearson encontrado fue Pc = 0.70, el de Spearman Sc = 0.69, ambos con valores de confidencia menores a 1 × 10-12. Por el contrario, el comportamiento temporal de los eigenvalores más pequeños muestra correlaciones positivas más moderadas, con valores de Pc = 0.45 y Sc = 0.49.
Notas: (a) Comportamiento temporal de los eigenvalores más grandes. (b) Comportamiento temporal de los eigenvalores más pequeños. La línea azul representa los resultados para las polaridades, la verde para retornos, y la línea negra los límites predichos por RMT para las matrices de Wishart, mientras que la línea gris representa la media y desviación estándar para una simulación numérica con 10,000 miembros de WE.
Fuente: Elaboración propia.
El hecho de que el comportamiento temporal de los eigenvalores más grandes de los retornos y polaridades estén anticorrelacionados mutuamente, puede deberse a un retraso en la transmisión de información de Twitter hacia los precios de los mercados financieros globales. Pudiendo esto constituir una evidencia más en contra de la hipótesis de mercado eficiente. Además, el coeficiente de correlación que se encontró para el comportamiento temporal de los eigenvalores empíricos más pequeños revela que el portafolio de menor riesgo se preserva aproximadamente sin importar si usamos polaridades o retornos para su cálculo, por lo que Twitter resulta ser una fuente de información muy interesante para el análisis de portafolios.
En general, estos resultados proveen evidencias acerca del surgimiento de factores comunes en la información financiera global, sin la necesidad de discriminar si los datos provienen de los retornos o de las polaridades, en otras palabras, con la información proveniente de Twitter parecer ser posible caracterizar el comportamiento colectivo de los mercados financieros globales.
La razón de participación inversa (IPR, por sus siglas en inglés) es una manera simple de cuantificar en cuántos estados está distribuida una partícula cuando existe cierta incertidumbre acerca de dónde se encuentra. Históricamente 35, la razón de participación (PR, por sus siglas en inglés) fue introducida para ayudar a clasificar las vibraciones atómicas en las redes cristalinas desordenadas 36. Esta cantidad describe la fracción del número total de sitios que participan en un modo vibracional correspondiente al eigenvector x = ( x 1, … , x n ) ∈ R n , y toma el valor
donde μ r = ∑ i = 1 | x i | 2r puede ser visto como el momento r de la energía cinética del modo. Si un modo dado envuelve el movimiento de un solo átomo, se caracteriza como localizado y tiene el valor PR = 1/N. Por el contrario, un modo vibracional que contenga a todos los átomos participando por igual es llamado extendido y tiene el valor PR = 1. Asimismo, una medida equivalente ha sido utilizada para estudiar el grado de localización de los eigenestados electrónicos en el modelo de Anderson 37 con implicaciones en la existencia de transiciones localizadas (no-localizadas) de un metal aislante en presencia de desorden.
En econofísica, una manera simple de extraer información a partir de los eigenvectores es estimando esta ipr, la cual nos permite conocer el número de índices que participan significativamente en cada eigenvector (o portafolio). Esta medida exhibe la distinción entre los eigenvectores asociados a los extremos y aquellos que pertenecen al resto del conjunto, dentro de la zona de ruido. Si se considera el k-ésimo eigenvector normalizado de la matriz de correlación |V k | = 1, la ipr del eigenvector V k se puede escribir como:
cuyo valor siempre cae entre los límites 1/N y uno. Si el eigenvector V k se encuentra localizado solamente en un componente, entonces IPR k = 1. Por el contrario, si se encuentra distribuido uniformemente sobre los N componentes, entonces IPR k = 1/N. Es de esperarse que los valores para IPR N fluctúen cerca del límite inferior 1/N, ya que corresponde al portafolio más diversificado, mientras que para IPR 1 se esperan valores más altos, ya que está asociado al eigenvalor más pequeño, y, por lo tanto, al portafolio menos diversificado 4. Asimismo, para valores de 1 < k < N, dentro de la región considerada como ruido, es de esperarse que surjan combinaciones aleatorias de los componentes, y, en consecuencia, valores de IPR k comprendidos entre los de IPR N y los de IPR 1.
En la Figura 5 se muestra el comportamiento temporal de IPR N (Figura 5 (a)) y de IPR 1 (Figura 5 (b) ) para los datos empíricos de Twitter e índices financieros. En estas mismas figuras se muestra la media y desviación estándar de una simulación numérica de 10,000 miembros de WE, donde de nuevo cada punto se calcula teniendo en cuenta los 80 días de transacción anteriores. Se puede ver en la Figura 5 (a) que ambos resultados empíricos presentan un comportamiento suave y fluctúan alrededor del límite inferior como es de esperarse, cayendo en la región de los resultados numéricos, lo cual confirma que cada uno de los indicadores financieros involucrados participa significativamente en V k , y como consecuencia todos los índices se mueven como uno solo en este eigenmodo. Es interesante observar que esta misma característica emerge cuando trabajamos con las polaridades. Para este caso se ha encontrado un Pc = 0.6 entre ambos comportamientos empíricos.
Notas: (a) Comportamiento temporal de IPR correspondiente a los eigenvalores más grandes. (b) Comportamiento temporal de IPR para el eigenvalor más pequeño. La línea azul representa los resultados para los retornos, la línea verde para polaridades, y la línea negra el límite inferior 1/N. Además, la línea gris representa la media y la desviación estándar de los resultados de la simulación numérica de 10,000 miembros de WE.
Fuente: Elaboración propia.
Si ahora fijamos nuestra atención en la Figura 5 (b), podemos observar que el IPR 1 se comporta de manera bastante diferente en ambos datos empíricos. Los resultados para retornos se mantienen fluctuando más de tres desviaciones estándar sobre lo esperado para los resultados numéricos, mientras que los resultados de polaridad se encuentran lejos de los valores numéricos la mayor parte del tiempo, aunque hay periodos en que caen dentro de los valores de la simulación. Esto último podría implicar la presencia de ruido en la adquisición de los datos de polaridad, principalmente al comienzo del periodo de estudio. Sin embargo, incluso así se presenta una correlación positiva entre el comportamiento temporal de los datos empíricos, con un Pc = 0.49.
Se logró extraer información de Twitter mediante el ensamblaje de distintos lenguajes de programación, cuantificando su contenido mediante técnicas de análisis de sentimiento. Donde las técnicas matemáticas provenientes de la física estadística mostraron que los datos extraídos de estas fuentes contienen información relevante para el análisis de los índices financieros globales estudiados aquí.
Mediante el análisis de RMT, se ha encontrado que los datos de Twitter comparten la misma estructura de correlaciones encontrada para los datos de retorno asociados con cada periodo de estudio. Asimismo, se han encontrado desviaciones largas de los eigenvalores, más allá de los límites predichos por la ley de Marcenko-Pastur, lo cual nos dice que existen correlaciones verdaderas entre los índices financieros y las polaridades. Por lo cual el hecho de que en este momento no seamos capaces de generar estrategias de compra en las bolsas de valores o de prevenir posibles crisis financieras a partir de la información textual, no imposibilita que en un futuro podamos hacerlo.
Asimismo, el estudio de RMT ha permitido observar una correlación moderada entre los comportamientos temporales de los eigenvalores extremos de las polaridades y retornos en ambos periodos de estudio. Esto implica que la información colectiva de los índices financieros globales emerge también al analizar las polaridades, y, por lo tanto, el portafolio de inversión óptimo o más diversificado es preservado al utilizar este tipo de información. Además, se encontró que los valores de IPR N fluctúan cerca del límite inferior 1/N, mientras que para IPR 1 se obtuvieron los valores más altos como es de esperarse para el caso del portafolio más y menos diversificado, respectivamente. Es notable observar que esta característica surge cuando trabajamos con las polaridades. Ello implica que la estructura de las correlaciones globales puede ser preservada independientemente de si estamos trabajando con las fuentes de Twitter o la información financiera (retornos). Este conjunto de resultados obtenidos por medio de RMT sugiere que los retornos y polaridades comparten una estructura de correlaciones común para los países y periodos de tiempo estudiados aquí.
En suma, estos nuevos resultados apoyan el paradigma de la economía conductual, es decir, de que las decisiones de los inversionistas se ven influenciados por la información de los medios de comunicación y redes sociales (Twitter) lo cual influye para generar juicios o estrategias precipitadas de comercio en el mercado de valores, influyendo finalmente estas decisiones en el precio final de las acciones.
[20]. Smailovic, Jasmina , Miha Grcar, Nada Lavrac y Martin Znidarsic. Human- computer interaction and knowledge discovery in complex, unstructured, big data, vol. 7947 of the series Lecture notes in computer science. Berlín Heidelberg: Springer-Verlag, 2013, 77.
Jasmina Smailovic Miha Grcar Nada Lavrac Martin Znidarsic Human- computer interaction and knowledge discovery in complex, unstructured, big data7947Lecture notes in computer scienceBerlín HeidelbergSpringer-Verlag,20137777
[21]. Oliveira, Nuno, Paulo Cortez y Nelson Areal. Progress in artificial intelligence, vol. 8154 of the series Lecture notes in computer science. Berlín Heidelberg: Springer-Verlag, 2013, 355.
Nuno Oliveira Paulo Cortez Nelson Areal Progress in artificial intelligence8154Lecture notes in computer scienceBerlín HeidelbergSpringer-Verlag,2013355355
[29]. Jurafsky, D. y J. H. Martin. Speech and language processing: An introduction to natural language processing, computational linguistics and speech recognition. Englewood Cliffs NJ, Prentice-Hall, 2000.
D. Jurafsky J. H. Martin Speech and language processing: An introduction to natural language processing, computational linguistics and speech recognitionEnglewood Cliffs NJPrentice-Hall2000
[34]. J. P. Bouchaud, J. P yM. Potters . «Financial applications of random matrix theory: A short review.» En Por Gemot Akemann, Jinho Balk y Philippe Di Francesco (eds.), The Oxford handbook of random matrix theory. Oxford: Oxford University Press, 2011, cap. 40, 824.
J. P. Bouchaud M. Potters Financial applications of random matrix theory: A short review Gemot Akemann Jinho Balk Philippe Di Francesco The Oxford handbook of random matrix theoryOxfordOxford University Press2011cap. 40824824