Estudio revela cómo la IA puede descifrar predicciones cripto en tweets y mejorar el análisis del mercado

𝕏

Hace 1 hora

Por Canuto

Una nueva investigación propone una forma más precisa de leer el pulso del mercado cripto en redes sociales: no solo analiza si un comentario es positivo o negativo, sino si realmente anticipa una subida, una caída o estabilidad. El hallazgo podría abrir la puerta a modelos más útiles para interpretar expectativas de inversores en activos altamente volátiles.
***

El estudio analizó 3.116 tweets sobre Cardano, Matic, Binance, Ripple y Fantom, y los clasificó en predictivos y no predictivos.
Los investigadores usaron anotación humana y con GPT, además de SenticNet, para asociar emociones con predicciones de alza, baja o estabilidad.
XLM-RoBERTa fue el mejor modelo para la tarea binaria, mientras Random Forest lideró en la clasificación multiclase tras balancear los datos.

Un grupo de investigadores propuso un nuevo enfoque para analizar conversaciones sobre criptomonedas en redes sociales, con una idea central: no basta con detectar si un mensaje transmite optimismo o pesimismo. También hace falta identificar si el usuario está haciendo una predicción concreta sobre el comportamiento futuro del mercado.

El trabajo, titulado Decoding Market Emotions in Cryptocurrency Tweets via Predictive Statement Classification with Machine Learning and Transformers, fue elaborado por Moein Shahiki Tash, Zahra Ahani, Mohim Tash, Mostafa Keikhay Farzaneh, Ari Y. Barrera-Animas y Olga Kolesnikova. La investigación se centró en tweets en inglés sobre Cardano, Matic, Binance, Ripple y Fantom.

La propuesta divide el análisis en dos etapas. Primero, los modelos deben distinguir entre mensajes predictivos y no predictivos. Luego, si el contenido sí anticipa un escenario futuro, debe clasificarse como incremental, decremental o neutral, según sugiera una subida, una caída o ausencia de cambios relevantes.

El planteamiento parte de una observación importante para mercados como el de las criptomonedas, donde la especulación pesa mucho más que en otros activos tradicionales. Un mismo movimiento de precio puede provocar emociones opuestas: una baja puede generar frustración en quien pierde dinero, pero entusiasmo en quien la ve como oportunidad de compra.

Por qué el sentimiento tradicional puede resultar insuficiente

Para lectores menos familiarizados con este tipo de análisis, el problema de fondo es que el sentimiento en redes no siempre equivale a una señal de mercado clara. Un comentario con tono positivo no necesariamente implica expectativa alcista, y uno negativo tampoco siempre significa una visión bajista.

Según explican los autores, esa ambigüedad reduce la utilidad de muchos modelos tradicionales de sentimiento. En cambio, separar la emoción de la dirección esperada del mercado permite una lectura más matizada del comportamiento de los inversores, algo especialmente útil en un entorno volátil y altamente narrativo como el cripto.

La investigación recuerda que el mercado de criptomonedas alcanzó una valoración máxima de USD $3 billones en noviembre de 2021. También menciona que Bitcoin, creado en 2008 por Satoshi Nakamoto, llegó a un máximo histórico de USD $103.900,47 el 5 de diciembre de 2024, una evolución que ayuda a explicar el fuerte interés de inversores, reguladores, académicos y usuarios comunes.

En ese contexto, las redes sociales se han vuelto una fuente de datos cada vez más observada. Muchos usuarios expresan allí emociones, expectativas y opiniones sobre el mercado. La novedad del estudio es tratar de convertir esa conversación en una capa analítica intermedia entre el sentimiento general y la predicción de precios.

Cómo se construyó el conjunto de datos

El equipo trabajó con una base original de cerca de 30.000 tweets recopilados en la plataforma X entre septiembre de 2021 y marzo de 2023. De ese universo seleccionó aleatoriamente 3.116 publicaciones vinculadas a las cinco criptomonedas estudiadas para realizar el proceso de anotación.

Dos anotadores humanos, ambos hombres de entre 28 y 30 años con maestría en ciencias de la computación y dominio sólido del inglés, participaron en la clasificación manual. Antes de abordar el corpus completo, recibieron 100 ejemplos de prueba para calibrar criterios y mejorar consistencia.

Además, GPT fue utilizado como tercer anotador para complementar el trabajo humano. La concordancia entre las etiquetas generadas por GPT-4o y las anotaciones manuales fue medida mediante el coeficiente Kappa de Cohen, con un resultado de 0,7493 para la detección de declaraciones predictivas.

En la primera tarea, el dataset quedó compuesto por 2.000 mensajes no predictivos y 1.116 predictivos. En la segunda, esos 1.116 mensajes predictivos se dividieron en 570 incrementales, 434 decrementales y 112 neutrales.

Más adelante, para corregir el desbalance de clases, los autores emplearon parafraseo generado con GPT. Tras esa etapa, la base equilibrada de la primera tarea pasó a 4.000 ejemplos, con 2.000 predictivos y 2.000 no predictivos. En la segunda tarea, cada categoría predictiva quedó con 570 casos, para un total de 1.710 instancias.

Emociones detectadas en torno a cada tipo de predicción

Para extraer señales emocionales, los investigadores utilizaron SenticNet. El sistema agrupó emociones como Delight and Joy, Enthusiasm and Eagerness, Delight and Pleasantness, Grief and Sadness, Fear and Anxiety, y Rage and Anger.

Los resultados muestran patrones relativamente claros. En términos generales, las predicciones incrementales estuvieron asociadas con emociones positivas. En Fantom, por ejemplo, Delight and Joy apareció en 81,82% de los comentarios incrementales. En MATIC la cifra fue 72,41%, y en ADA 61,29%.

Enthusiasm and Eagerness también mostró una fuerte presencia en publicaciones alcistas. MATIC alcanzó 49,66% en esta dimensión y ADA 44,09%. Eso sugiere que buena parte de los usuarios que esperan subidas tienden a expresarse con entusiasmo y confianza.

En cambio, las predicciones decrementales concentraron con mayor frecuencia emociones como tristeza, miedo y rabia, especialmente en publicaciones sobre BNB, ADA y XRP. Sin embargo, el estudio subraya un matiz relevante: algunas predicciones bajistas también aparecieron acompañadas de emociones positivas, lo que podría reflejar inversores que ven una caída como oportunidad de entrada.

Las predicciones neutrales tampoco estuvieron exentas de positividad. En varios casos, los mensajes sin una dirección fuerte siguieron mostrando niveles altos de Delight and Joy y Delight and Pleasantness, lo que los autores interpretan como posible optimismo general o confianza de largo plazo en el mercado.

Qué modelos funcionaron mejor

La investigación comparó modelos tradicionales de machine learning, enfoques de deep learning y arquitecturas transformer. Entre los métodos clásicos evaluó Logistic Regression, Random Forest, XGBoost y máquinas de soporte vectorial con kernel lineal y RBF. Para deep learning se probaron CNN y BiLSTM con embeddings GloVe y FastText.

En transformers, el equipo ensayó DistilRoBERTa, RoBERTa-base, Robertuito, BERT-base-uncased y XLM-RoBERTa. La evaluación se realizó con validación cruzada de 5 pliegues y usó métricas como accuracy, precision, recall y F1-score, con especial atención al macro F1 por su utilidad en datasets balanceados.

En la primera tarea y sobre el conjunto desbalanceado, RoBERTa-base fue el mejor transformer con macro F1 de 0,5578. Entre los modelos tradicionales, XGBoost lideró con 0,5068, mientras BiLSTM con GloVe fue el mejor en deep learning con 0,5070. Aun así, el rendimiento general fue moderado.

En la segunda tarea, orientada a separar predicciones incrementales, decrementales y neutrales, el desafío aumentó. Con datos desbalanceados, DistilRoBERTa logró macro F1 de 0,4051. XGBoost registró 0,3631 y CNN con FastText 0,3656.

La situación cambió de forma visible cuando se empleó la base balanceada con parafraseo generado por GPT. En la primera tarea, XLM-RoBERTa alcanzó el mejor macro F1 con 0,7011. Le siguieron SVM con kernel RBF, con 0,6825, y BiLSTM con GloVe, con 0,6349.

En la segunda tarea, el mejor resultado fue para Random Forest con macro F1 de 0,6488. SVM RBF obtuvo 0,6478, SVM lineal 0,6463, y entre deep learning destacó CNN con GloVe con 0,6149. DistilRoBERTa lideró entre los transformers con 0,5936.

Lecturas e implicaciones del estudio

Uno de los puntos más interesantes es que el trabajo no presenta las emociones como sustituto de otras métricas de mercado, sino como una señal complementaria. La clasificación propuesta podría usarse junto con indicadores técnicos, series de precios y herramientas de trading algorítmico para construir sistemas híbridos de decisión.

Los autores sostienen que esta separación entre emoción y dirección predictiva puede ayudar a analistas, inversores y reguladores. En teoría, permitiría distinguir mejor entre euforia especulativa, pánico, oportunidad percibida y simple ruido conversacional.

El reporte de clasificación también deja ver que la categoría neutral fue la más fácil de detectar en la segunda tarea, con precisión de 0,8224, recall de 0,8368 y F1-score de 0,8296. En contraste, las clases incremental y decremental mostraron más solapamiento semántico y un rendimiento más discreto.

Los investigadores consideran que sus hallazgos respaldan el valor de la ampliación sintética de datos en problemas de desbalance y muestran que, dependiendo de la tarea, no siempre gana la misma familia de modelos. Los transformers dominaron la clasificación binaria, mientras un modelo tradicional como Random Forest fue superior en la tarea multiclase.

Entre las limitaciones, el estudio reconoce que solo trabajó con texto en inglés y con publicaciones de una sola red social. Tampoco integró datos de mercado en tiempo real, algo que sería clave para validar la verdadera capacidad predictiva del sistema.

Como siguiente paso, los autores planean alinear tipos de predicción y señales emocionales con movimientos reales de precios. También mencionan posibles extensiones multilingües, aplicaciones en tiempo real y nuevas técnicas de balanceo para robustecer el marco analítico.

Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín

𝕏

Análisis de Mercado

Análisis de mercado

USDT	Tether USDt	-0,01%	$39,49 mmd
BTC	Bitcoin	-0,1%	$18,03 mmd
ETH	Ethereum	-1,16%	$7,53 mmd
USDC	USDC	-0,0%	$4,25 mmd
SOL	Solana	-1,53%	$1,94 mmd
XRP	XRP	-1,61%	$0,936 mmd
BNB	BNB	-0,88%	$0,826 866 mmd
DOGE	Dogecoin	-3,42%	$0,805 785 mmd
NIGHT	Midnight	-5,47%	$0,550 165 mmd
USD1	World Liberty Financial USD	0,0%	$0,530 755 mmd

DEXE	DeXe	3,93%	$7,39
CC	Canton	2,15%	$0,152 444
TRX	TRON	0,9%	$0,318 905
OKB	OKB	0,81%	$84,35
M	MemeCore	0,61%	$2,22
SKY	Sky	0,47%	$0,070 841
CHZ	Chiliz	0,44%	$0,039 502
SIREN	siren	0,41%	$1,7
SUN	Sun [New]	0,21%	$0,017 342
PAXG	PAX Gold	0,14%	$4.506,18

KAS	Kaspa	-7,32%	$0,032 615
FET	Artificial Superintelligence Alliance	-6,27%	$0,235 144
NIGHT	Midnight	-5,47%	$0,049 832
STABLE	Stable	-4,65%	$0,024 576
PENGU	Pudgy Penguins	-4,53%	$0,006 258
TRUMP	OFFICIAL TRUMP	-4,48%	$2,86
BCH	Bitcoin Cash	-4,31%	$459,57
SUI	Sui	-4,29%	$0,846 217
STX	Stacks	-3,55%	$0,216 451
CRV	Curve DAO Token	-3,53%	$0,207 843

Estudio revela cómo la IA puede descifrar predicciones cripto en tweets y mejorar el análisis del mercado

Por qué el sentimiento tradicional puede resultar insuficiente

Cómo se construyó el conjunto de datos

Emociones detectadas en torno a cada tipo de predicción

Qué modelos funcionaron mejor

Lecturas e implicaciones del estudio

Suscríbete a nuestro boletín

Análisis de Mercado

Bnb se estabiliza en USD $612,8 ante baja volatilidad

Dogecoin sube 0,94% en medio de volumen decreciente

Solana cae ante medias móviles bajistas

XRP mantiene estabilidad por encima de USD $1,33 en medio de volumen bajo