Análisis de la relación entre el showtime del baloncesto y la actividad de twitter - Grado en Ingeniería Informática Trabajo Fin de Grado - RUA
←
→
Transcripción del contenido de la página
Si su navegador no muestra la página correctamente, lea el contenido de la página a continuación
you Análisis de la relación entre el showtime del baloncesto y la actividad de twitter. Grado en Ingeniería Informática Trabajo Fin de Grado Autor: Agustín Pérez Micó Tutor/es: José Vicente Berná Martínez Julio 2021
Resumen Este estudio analiza cómo la actividad que ocurre en un partido de baloncesto (a nivel de jugadas vistosas, inteligentes y polémicas) influye en la actividad que los usuarios tienen en Twitter. Para realizar el análisis se han escogido varias jornadas de la liga ACB como muestra de datos. Como las fechas de las jornadas son de todo el año, y las librerías que existen actualmente son de pago o son limitadas, se han empleado técnicas de scraping facilitando la extracción de la información. Una vez recabada la información esta se procesa con Python para obtener gráficas que representan el periodo de estudio que se establece para cada partido (30 minutos previos al partido, 2h de duración del evento y los 30 minutos posteriores ) en rangos de 5 minutos y los tweets que mencionan a las cuentas de twitter de cada club. Sobre las gráficas, se han generado hipótesis apoyadas en una base matemática, extrayendo dichas hipótesis de la observación de los datos. Hipótesis validadas (aplicando otro conjunto de partidos aleatorios de las otras jornadas de la liga) realizando las mismas pruebas que se hacen en la primera vuelta del estudio, demostrando así que existe una conexión entre el showtime y la actividad en twitter, relación que además se puede expresar formalmente. 2
Motivación, justificación y objetivo general El baloncesto es un deporte de equipo con un alto nivel de exigencia técnica y táctica , siendo una de las prácticas deportivas que más ha evolucionado significativamente en los últimos años. Con los avances tecnológicos cada vez es más competitivo, llamativo y popular. Además ha marcado tendencia en algunas de las premisas del mundo empresarial : objetivos, liderazgo, trabajo colectivo, actitud positiva inteligente, motivación, etc... La principal razón por la que mi trabajo está enfocado en este tema es porque el baloncesto ha ocupado muchos ratos en mi vida y siempre he disfrutado enormemente de la inversión que hacía en ese pasatiempo, que, por mucho tiempo se convirtió en parte de mí. Si bien contemplamos el deporte como tal, puede ser simple, pero al mirar más allá vemos una infinidad de aspectos de la vida cotidiana en la que la sociedad y el baloncesto coinciden. Uno de ellos podría ser la interacción en las redes sociales, siendo esta relación beneficiosa para ambas partes, ya que para la industria del baloncesto supone ciertas ventajas, pero también acercan a los deportistas y equipos hasta cualquier dispositivo con el que se pueda conectar a las RRSS en cuestión. En este trabajo voy a centrar mi disertación en la actividad que tiene la gente de la red social Twitter, y como se refleja en función de la actividad de los equipos en el tiempo de duración de un partido en concreto. La muestra de tweets recogida incluirá a los equipos de la de la liga ACB que es la primera liga de baloncesto en España. En una de las conversaciones que mantuve con el tutor surgió la idea de indagar de qué manera se refleja en twitter la actividad que ocurre durante el periodo de tiempo en el que transcurre un partido de baloncesto. Viendo como la gente interacciona con el partido en el momento , ya sea si lo están viendo en directo, por televisión o incluso si lo están siguiendo por la propia red social. Considero que hallar la solución a la cuestión presentada puede demostrar mi valía como ingeniero ya que va a quedar reflejada la incidencia que tiene el baloncesto, directa o indirectamente en la sociedad a través de las RRSS, ya que estas pueden llegar a ser unas herramientas muy influyentes sobre las personas que las utilizan, y por ende, en la sociedad misma, absorbiendo cada vez más tiempo de nuestro día a día y también facilitándonos cosas que antes ni siquiera podíamos imaginar. 3
Mi interés personal es evaluar cuan profundamente han calado las RRSS en nuestras vidas, suponiendo incluso una influencia en nuestra personalidad, estado de ánimo o manera de pensar. Y mi intención, es que cualquier persona pueda opinar con ciertos criterios. basándose en este estudio. Agradecimientos Me gustaría destacar en esta sección varios aspectos de mi vida, en primer lugar, me gustaría agradecer a mi familia, que siempre me han orientado y motivado para que siguiera haciendo la carrera. Además, agradecer el inestimable apoyo brindado por mi tutor del TFG José Vicente Berna, de manera didáctica y pragmática ha sido capaz de guiarme hasta el final, con él no solo he aprendido metodología de trabajo, también me ha motivado a lo largo del proyecto a encontrar un punto de vista ingenieril, habilidad que me voy a llevar para siempre en el desarrollo de mi profesión. Mi camino como universitario ha tenido luces y sombras, pero me han ayudado a mantenerme centrado y conseguir este objetivo. También agradecer a los Copazos por sus buenos momentos en la fábrica. A los chavales por hacerme que me sienta un alicantino más, y por último, pero no menos importante, me gustaría recordar esos meses que estuve en Rozna. La metamorfosis por la que pasé en ese país me devolvió la ambición. 4
Citas Las personas viven sus vidas atados a lo que ellos consideran como verdadero y correcto. Así es como definen la realidad. Pero ¿Qué significa la verdad o lo correcto? Son conceptos vagos, su realidad puede ser solamente una ilusión si consideramos que viven en su propio mundo con sus propias creencias. ¿No crees? Itachi Uchiha Tiempo al tiempo. Tomás Pérez Porque la vida puede ser maravillosa. Andrés Montes 5
Índice de figuras RESUMEN .................................................................................................................2 MOTIVACIÓN, JUSTIFICACIÓN Y OBJETIVO GENERAL ....................................................3 AGRADECIMIENTOS ...................................................................................................4 CITAS ........................................................................................................................5 ÍNDICE DE FIGURAS ...................................................................................................6 ÍNDICE DE TABLAS .....................................................................................................8 1. INTRODUCCIÓN ................................................................................................ 11 1.1 Historia de las redes sociales ..................................................................................................... 11 1.2 Twitter como RRSS.................................................................................................................... 12 1.3 Twitter y el baloncesto.............................................................................................................. 12 2. ESTADO DEL ARTE. ............................................................................................ 14 2.1. Twitter............................................................................................................................... 14 3.1.1 API de Twitter ................................................................................................................................ 16 3.1.2 Tipos de Autenticación .................................................................................................................. 17 2.2. Python ............................................................................................................................... 18 2.3. Scraping y Twint ................................................................................................................. 20 2.4. Showtime en el baloncesto ................................................................................................. 22 2.5. ACB ................................................................................................................................... 24 3.5.1 Clubes influyentes de la liga ACB................................................................................................... 25 2.6. El uso de las redes sociales y el nivel de interacción (engagement) de los clubes de la Liga Endesa ACB .................................................................................................................................... 27 6
3. OBJETIVO ......................................................................................................... 29 4. METODOLOGÍA................................................................................................. 30 5. ANÁLISIS DE PARTIDOS ...................................................................................... 31 5.1. Estudio de la relación de la actividad en Twitter con dimensiones del club. .......................... 32 5.2. Detección de eventos de interés ......................................................................................... 42 5.3. Identificación del tipo de evento más característico............................................................. 54 6. VALIDACIÓN DE HIPÓTESIS ................................................................................ 57 7. RESULTADOS .................................................................................................... 64 8. CONCLUSIONES Y TRABAJO FUTURO .................................................................. 65 REFERENCIAS .......................................................................................................... 66 7
Índice de figuras FIGURA 1. GRÁFICO DE LOS PAÍSES CON EL MAYOR PORCENTAJE DE PENETRACIÓN DE TWITTER (2020)............................ 15 FIGURA 2. LÍMITACIONES DE USO DE LA API DE TWITTER EN FUNCIÓN DE LOS NIVELES DE AUTENTICACIÓN EXISTENTES . ...... 18 FIGURA 3. HELLO WORLD EN C++. ..................................................................................................................... 19 FIGURA 4. HELLO WORLD EN PYTHON. ................................................................................................................ 19 FIGURA 5. CLONADO DE TWINT DESDE GITHUB. .................................................................................................... 20 FIGURA 6. INSTALACIÓN DE REQUERIMIENTOS DE TWINT ......................................................................................... 20 FIGURA 7. SCRIPT DE TWINT .............................................................................................................................. 21 FIGURA 8. RESULTADO DEL SCRIPT ...................................................................................................................... 21 FIGURA 9. CAPTURA DE PANTALLA DE LOS DATOS OBTENIDOS CON EL SCRAPING .......................................................... 22 FIGURA 10. CAPTURA DE PANTALLA DE LA APLICACIÓN JORNADA VIRTUAL.................................................................. 23 FIGURA 10. TABLA DE ENGAGEMENT EN TWITTER .................................................................................................. 28 FIGURA 11. RUEDA DE WALLACE ........................................................................................................................ 30 FIGURA 12. GRÁFICA DE TWEETS / RANGO HORARIO ANDORRA-BASKONIA ................................................................ 31 FIGURA 13. GRÁFICA DE MÁXIMOS Y MÍNIMOS ANDORRA - JOVENTUT ...................................................................... 32 FIGURA 14. GRÁFICA DE MÁXIMOS Y MÍNIMOS BILBAO – OBRADOIRO ....................................................................... 33 FIGURA 15. GRÁFICA DE MÁXIMOS Y MÍNIMOS FUENLABRADA – ESTUDIANTES ........................................................... 33 FIGURA 16. GRÁFICA DE MÁXIMOS Y MÍNIMOS BASKONIA - UCAM .......................................................................... 34 FIGURA 17. GRÁFICA DE MÁXIMOS Y MÍNIMOS REAL MADRID – GIPUZKOA BASKET ..................................................... 34 FIGURA 18. GRÁFICA DE MÁXIMOS Y MÍNIMOS BURGOS – BARCELONA...................................................................... 35 FIGURA 19. GRÁFICA DE MÁXIMOS Y MÍNIMOS VALENCIA – JOVENTUT ...................................................................... 35 FIGURA 20. GRÁFICA DE MÁXIMOS Y MÍNIMOS ANDORRA – BASKONIA ...................................................................... 36 FIGURA 21. GRÁFICA DE MÁXIMOS Y MÍNIMOS HERBALIFE – ZARAGOZA .................................................................... 36 FIGURA 22. GRÁFICA DE MÁXIMOS Y MÍNIMOS ESTUDIANTES – UCAM ..................................................................... 37 FIGURA 23. GRÁFICA DE MÁXIMOS Y MÍNIMOS BETIS – TENERIFE ............................................................................. 37 FIGURA 24. GRÁFICA DE MÁXIMOS Y MÍNIMOS BILBAO – MANRESA.......................................................................... 38 FIGURA 25. GRÁFICA DE MÁXIMOS Y MÍNIMOS FUENLABRADA – OBRADOIRO ............................................................. 38 FIGURA 26. GRÁFICA DE MÁXIMOS Y MÍNIMOS UNICAJA – JOVENTUT........................................................................ 39 FIGURA 27. GRÁFICA DE MÁXIMOS Y MÍNIMOS OBRADOIRO – ANDORRA ................................................................... 39 FIGURA 28. GRÁFICA DE MÁXIMOS Y MÍNIMOS FUENLABRADA – TENERIFE ................................................................. 40 FIGURA 29. GRÁFICA DE MÁXIMOS Y MÍNIMOS BETIS – MANRESA ............................................................................ 40 FIGURA 30. GRÁFICA DE MÁXIMOS Y MÍNIMOS HERBALIFE – UCAM......................................................................... 41 FIGURA 31. GRÁFICA DE MÁXIMOS Y MÍNIMOS ZARAGOZA – REAL MADRID ............................................................... 41 FIGURA 32. GRÁFICA DE MÁXIMOS Y MÍNIMOS VALENCIA – ESTUDIANTES .................................................................. 42 FIGURA 33. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BILBAO – OBRADOIRO .................................................. 43 FIGURA 34. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO ANDORRA – JOVENTUT ................................................. 44 8
FIGURA 35. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO FUENLABRADA – ESTUDIANTES....................................... 44 FIGURA 36. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BASKONIA – UCAM .................................................... 45 FIGURA 37. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO FUENLABRADA – OBRADOIRO ......................................... 45 FIGURA 38. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BILBAO – MANRESA ..................................................... 46 FIGURA 39. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BETIS – TENERIFE ......................................................... 46 FIGURA 40. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO HERBALIFE – ZARAGOZA ................................................ 47 FIGURA 41. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO ESTUDIANTES – UCAM ................................................ 47 FIGURA 42. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO ANDORRA – BASKONIA ................................................. 48 FIGURA 43. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO VALENCIA – JOVENTUT ................................................. 48 FIGURA 44. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BURGOS – BARCELONA ................................................. 49 FIGURA 45. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO MADRID – GIPUZKOA ................................................... 49 FIGURA 46. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO FUENLABRADA – TENERIFE ............................................. 50 FIGURA 47. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO BETIS – MANRESA ........................................................ 50 FIGURA 48. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO VALENCIA – ESTUDIANTES.............................................. 51 FIGURA 49. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO ZARAGOZA – REAL MADRID ........................................... 51 FIGURA 50. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO HERBALIFE – UCAM .................................................... 52 FIGURA 51. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO OBRADOIRO – ANDORRA ............................................... 52 FIGURA 52. BÚSQUEDA DEL EVENTO MÁS NOTABLE, PARTIDO UNICAJA – JOVENTUT ................................................... 53 FIGURA 53. GRÁFICA DE MÁXIMOS Y MÍNIMOS BARCELONA – GUIPUZKOA ................................................................. 57 FIGURA 54. GRÁFICA DE MÁXIMOS Y MÍNIMOS REAL MADRID – MANRESA ................................................................ 58 FIGURA 55. GRÁFICA DE MÁXIMOS Y MÍNIMOS UNICAJA – VALENCIA ........................................................................ 58 FIGURA 56. GRÁFICA DE MÁXIMOS Y MÍNIMOS HERBALIFE – ESTUDIANTES................................................................. 59 FIGURA 57. GRÁFICA DE MÁXIMOS Y MÍNIMOS ZARAGOZA – TENERIFE ...................................................................... 59 FIGURA 58. BÚSQUEDA DEL EVENTO MÁS NOTABLE BARCELONA – GUIPUZKOA .......................................................... 60 FIGURA 59. BÚSQUEDA DEL EVENTO MÁS NOTABLE REAL MADRID – MANRESA .......................................................... 60 FIGURA 60. BÚSQUEDA DEL EVENTO MÁS NOTABLE UNICAJA – VALENCIA .................................................................. 61 FIGURA 61. BÚSQUEDA DEL EVENTO MÁS NOTABLE HERBALIFE – ESTUDIANTES........................................................... 61 FIGURA 62. BÚSQUEDA DEL EVENTO MÁS NOTABLE ZARAGOZA – TENERIFE ................................................................ 62 9
Índice de tablas TABLA 1. TABLA DE DATOS DE LOS EQUIPOS DE LA ACB ........................................................................................... 25 TABLA 2. DIFERENCIALES DE LOS PARTIDOS ANALIZADOS.......................................................................................... 54 TABLA 3. DIFERENCIALES DE LOS PARTIDOS ANALIZADOS.......................................................................................... 55 TABLA 4. PROBABILIDAD DE OCURRENCIA DE UNA DETERMINADA ACCIÓN ................................................................... 56 TABLA 6. EVENTO CARACTERÍSTICO DEL CONJUNTO DE VALIDACIÓN ........................................................................... 63 10
1. Introducción 1.1 Historia de las redes sociales Desde hace unos años, las redes sociales han entrado de lleno en nuestro día a día, en casi todos los países del mundo, la gente comparte una serie de información en internet. Desde fotos de comida, pensamientos, videos de animales…. Pero al final, casi todo tipo de publicaciones en distintas redes sociales se basan en un simple hecho , compartir la opinión de la persona que publica con la gente conocida o desconocida, cerca o lejos, no importa, las redes sociales conectan a todas las personas del mundo. Las redes sociales, o RRSS a partir de ahora, son aplicaciones online en las que las personas que desean registrarse tienen opción de crear un perfil. Dicho perfil se rellena con información del usuario y es posible personalizarlo en función de los gustos de cada uno (por ejemplo, cada persona puede poner su foto en el perfil para que las demás personas que la vean puedan reconocerlo). La manera en la que nos relacionamos a través de estas RRSS ha ido cambiando mucho desde que fueron creadas, en un principio había RRSS muy heterogéneas, siendo este el motivo por el cual unos usuarios escogían unas frente a otras. Por ejemplo, algunas de las primeras redes sociales fueron MySpace ( en la que se subían canciones o álbumes) o Fotolog ( en la que se colgaban fotos). Ambas eran distintas, ya que el contenido que se publicaba en una no se podía colgar en otras y viceversa, sin embargo, esta diversificación de las funcionalidades de las RRSS fue pasando a la antigüedad. Hubieron varios factores que motivaron dicho cambio, como fue la modernización de las tecnologías web (en MySpace las páginas eran mucho más rudimentarias, pero sin embargo con la aparición de Tuenti o Facebook, el diseño pasó a ser mucho más intuitivo y amigable) Adicionalmente, hubo un hecho que marcó un antes y un después en el uso de las tecnologías. La relación entre los usuarios, con Facebook y Tuenti se produjo un boom en cuanto al uso de las RRSS se refiere, si bien antes la gente estaba disgregada por distintas aplicaciones, en ese momento los usuarios pudieron colgar diversos tipos de contenido a la vez que eran capaces de tener interacción entre ellos. (Cada persona era capaz de postear fotos, música, videos, comentarios … y los contactos que esa persona tuviese podían darle feedback) 11
Actualmente, el panorama ha cambiado mucho. Ya no sólo tiene RRSS la población más juvenil, sino que se ha instaurado como una manera que posibilita la relación con el mundo externo desde la pantalla de un dispositivo. Ahora mismo se pueden encontrar desde marketplaces hasta aplicaciones de contactos dentro de las mismas… ya no sólo tienen una versión web, sino que la mayor parte del consumo que se hace en estas RRSS se produce a través de dispositivos móviles. 1.2 Twitter como RRSS Dicho esto, cabe destacar que el punto de vista que se va a tomar para hacer esta disertación está enfocado en la red social Twitter, que cuenta con 340 millones de usuarios activos aproximadamente. En ella, igual que en todas las demás, se ven representados los usuarios y la forma en la que interaccionan a base de tweets, que son mensajes de texto (originalmente con 140 caracteres de extensión), fotos o incluso videos. Cada usuario tiene una serie de seguidores y también sigue a la gente que esa persona cree conveniente. La mecánica de funcionamiento es simple, cada usuario puede crear tweets propios o bien puede reaccionar de diversas maneras con los tweets de otras personas: respondiendo, retwiteando ( reposteando tal cual está el contenido) , o indicando que “te gusta” el tweet. 1.3 Twitter y el baloncesto Dentro de twitter podemos encontrar una gran variedad de cuentas: Desde gente anónima a deportistas famosos, pero también entidades conocidas, las cuales aglutinan una serie de seguidores con un interés común en algo, como podría ser un club de baloncesto. La manera en la que los seguidores del baloncesto interaccionan con las cuentas de los clubs debe de ser proporcional a la fama o el prestigio del equipo, ya que no es lógico comparar la cuenta de un equipo humilde con uno famoso como podría ser el Real Madrid o el Barcelona. Aun así, si tomáramos el punto de vista del showtime (juego vistoso para el espectador, con mucha emoción ) en un partido de baloncesto, podríamos intentar comprobar la relación existente entre la fama de un club con muchos seguidores, y el razonable y considerable número 12
de interacciones en Twitter, de modo que este punto de vista va a ser el tomado como punto de partida en esta investigación 13
2. Estado del arte. En este apartado vamos a profundizar en el marco teórico necesario para poder realizar el estudio con garantías de que las bases sobre las que profundizar están claras. En primer lugar se va a hablar acerca de Twitter y sus usuarios, especificaciones y restricciones que puede tener la API de Twitter, también es necesario conocer las herramientas que se van a emplear para la obtención y tratamiento de los datos, finalizando con la parte más deportiva del marco teórico en que se tratan temas como la ACB y los clubes que la conforman. 2.1. Twitter Twitter es una plataforma de microblogging en la que es posible compartir contenidos en vivo a través de la red. Esto posibilita que hasta desde el último lugar del mundo sea posible compartir vivencias o recuerdos en cualquier momento. El lanzamiento de esta herramienta se remonta a marzo de 2006 en California y desde ese momento no ha hecho más que crecer, llegando a tener 339 millones de usuarios activos en un mes. Según indican en el artículo “Estadísticas de redes sociales 2021: Usuarios de Facebook, Instagram, YouTube, LinkedIn, Twitter, Tiktok y otros” [1] , Twitter como red social es una de las que tiene un crecimiento más lento, sin embargo, aporta otras cosas muy importantes en la estrategia de marketing enfocado a redes sociales. - Se trata de una aplicación en tiempo real. - Se convierten en un medio de comunicación oficial para marcas. - Es una red social pública, lo que favorece que las marcas puedan realizar escucha activa sobre los usuarios. En el siguiente gráfico podemos observar los 20 países con mayor porcentaje de penetración de Twitter. 14
Figura 1. Gráfico de los países con el mayor porcentaje de penetración de Twitter (2020) (Fuente Extrapolaciones de datos publicadas en las herramientas de twitter). Una de las grandes ventajas de Twitter es su dinamismo, las noticias vuelan por todo el mundo de inmediato y eso favorece una gran comunicación entre los usuarios, sea de la índole que sea los contenidos virales recorren el mundo en cuestión de minutos. Existen una serie de maneras para compartir contenido empleando dicha herramienta. - Tweet : Mensaje de 280 caracteres escritos en los cuales cualquier usuario puede escribir lo que considere. También es posible añadir hastags, que son palabras clave marcadas con el símbolo # que son referenciadas desde un buscador de hastags con el que es posible filtrar todos los mensajes que contengan la palabra con el hastag. Además, es posible adjuntar imágenes, vídeos o imágenes en movimiento (gif) al cuerpo del mensaje. En caso de escribir más de 280 caracteres se anexionan varios mensajes para dar cabida al texto introducido, siendo posible construir hilos de texto a modo de comentarios sobre los que los demás usuarios pueden contestar e interactuar. - Retweet : Simplemente es el hecho de repostear tal cual el mensaje desde la cuenta del creador original. Además de hacer retweet es posible dar me gusta al mensaje. Siendo estas las dos opciones básicas para interactuar con el un tweet. 15
- Citar : Citar un tweet implica que la persona que cita escribe un mensaje relacionándolo con el mensaje citado. - Mensaje Directo : Es la única manera de comunicación privada que existe en la plataforma, consta de un chat privado en el cual también es posible adjuntar videos o imágenes, a diferencia de los tweets públicos, en los mensajes directos no existe máximo de caracteres, de modo que es posible escribir mensajes de la extensión que se quiera. Inicialmente debemos tener un concepto genérico de los ámbitos entre los que va a transcurrir nuestra investigación. Para ello es conveniente que se tengan en cuenta otros estudios o investigaciones cuya finalidad sea realizar análisis de las RRSS, en este caso nos interesa incidir en: número de casos ocurridos, influencia o repercusión o encuentro de un cuerpo centrarnos en aquellos que se enfoquen particularmente en la red social Twitter, ya que es la que vamos a emplear más adelante para realizar nuestras reflexiones. La información que podemos encontrar referente a ello es muy extensa y diversa, sin embargo, para poder recabar datos relevantes debemos especificar parámetros más concretos en la búsqueda, tales como: análisis semántico en twitter, análisis de las herramientas que usaremos para obtener las métricas (APIS), RRSS y deportes, twitter y deportes , twitter acb…. 3.1.1 API de Twitter Twitter es una aplicación multiplataforma a la que es posible acceder desde cualquier dispositivo que esté conectado a internet y disponga de un navegador. Todos los sistemas operativos empleados en dispositivos portátiles como móviles o tabletas disponen de una aplicación con la que pueden acceder a la red social teniendo una interfaz de usuario configurable. Además de ello Twitter comparte su información de otras maneras, accesibles para empresas o usuarios con conocimientos suficientes para poder recabar información a través de la API. API es el término que se emplea para referirse a la manera que tienen los programas informáticos de dialogar entre sí, para compartir información o datos. Se crea una aplicación software que funciona similar a un punto de acceso, cualquier dispositivo que conozca la dirección puede comunicarse con la aplicación ya que esta es pública. Como norma general cualquier API que se vaya a emplear, en este caso la de Twitter, requiere cumplir con ciertas condiciones, que vienen recogidas en su apartado de políticas [2]. Esta serie de indicaciones establecen los límites y restricciones de uso que nos permiten hacer uso de las distintas herramientas y funcionalidades que ofrece Twitter. En primer lugar, debemos 16
registrarnos como usuarios de Twitter, una vez hemos accedido a la plataforma se nos da la posibilidad de crear una aplicación por defecto, se le llama por defecto ya que en un primer lugar las aplicaciones sólo pueden acceder a información pública de Twitter. Sin embargo, existen ciertas API con las que si es posible compartir información privada como podrían ser los mensajes directos. En las que el usuario es capaz de administrar los permisos que concede a la API en cuestión. Las API de Twitter incluyen varios puntos de conexión, que se dividen en grupos: - Cuentas y usuarios: Los desarrolladores pueden administrar el perfil y la configuración de la cuenta de los usuarios empleando la programación. - Tweets y respuestas: Es posible realizar consultas sobre los tweets y las respuestas de las cuentas, además también existe la posibilidad de filtrar en búsqueda de ciertos términos o publicar nuevos tweets desde la API. - Mensajes directos: En caso de que los usuarios deseen pueden habilitar permiso para que los puntos de acceso lean los mensajes que se envíen desde las cuentas especificadas. - Anuncios: Permite a empresas desarrollar y administrar campañas de marketing. - Herramientas y SDK del editor: Se proporcionan una serie de herramientas con las cuales los desarrolladores pueden integrar la cronología de Twitter en software externo. 3.1.2 Tipos de Autenticación Existen tres tipos de autenticación en función del tipo de uso que se le de a la API [3], con ellos se clasifican los tres niveles de acceso que permiten una serie de acciones diferentes. La diferencia entre ellos radica en que con el método OAuth 1.0a se puede acceder a la información de una cuenta privada o llevar a cabo acciones en nombre de una cuenta de Twitter, con la OAuth 2.0 Bearer Token permite acceder a la información disponible de manera pública en Twitter y con la autenticación básica acceden las API empresariales de Twitter que requieren el uso de autenticación básica HTTP. 17
Figura 2. Límitaciones de uso de la API de Twitter en función de los niveles de autenticación existentes. (Fuente: https://developer.twitter.com/en/docs/authentication/overview ). Debemos tener en cuenta que las métricas (o información) que se van a extraer son las referentes a la información pública de las cuentas sobre las que vayamos a someter a estudio y no es necesario poder controlar aspectos privados de la cuenta como Hacer Retweet o leer los datos de los anunciantes. Por ello emplearemos el método de autenticación OAuth 2.0 Bearer Token. 2.2. Python Python es un lenguaje de programación multiparadigma [4], lo que quiere decir que es posible emplear varios tipos de programación a la hora de trabajar con él, como podría ser la programación funcional, la programación imperativa o una mezcla de ellas. Además de ello es considerado un lenguaje de alto nivel, en el momento de su creación se contempló la posibilidad de que éste dispusiera de estructuras de datos previamente definidas, como podrían ser diccionarios, listas estructuradas, parejas… De esta manera es posible simplificar las líneas de código consiguiendo una gran legibilidad, hecho que permite un rápido aprendizaje de este lenguaje por parte de personas que ya conozcan ciertos conceptos de programación. Es posible apreciar esta simplicidad en el código si comparamos un “Hola mundo” en Python y en C++ (Figura 3). “Hola mundo“ es, por antonomasia el comando básico que cualquier programador realiza al probar por primera vez un lenguaje de programación. Lo único que se 18
pretende es que aparezca por pantalla la frase “Hola mundo” a modo de mensaje cómico con el fin de comprobar que las librerías están bien instaladas y el código compila y se ejecuta correctamente. C++: #include using namespace std; int main() { cout
2.3. Scraping y Twint El scraping es la extracción de datos de diferentes portales en línea con la que es posible recopilar datos o crear bots de motores de búsqueda. Para realizar el scraping de Twitter vamos a emplear la herramienta denominada Twint. Twint es una herramienta para realizar scraping que se basa en un código Python, tiene la capacidad de desarrollar su función sin conectarse a la API de Twitter (Twint es fácil de usar y muy rápido, no tiene límite para descargar tweets, no requiere inicio de sesión o registro inicial para obtener datos.) En primer lugar podemos analizar las características de la herramienta. Anteriormente se ha comentado que Twint permite extraer la mayor parte del contenido de una cuenta sin ser necesario el conectar con la API (sin emplear claves de autenticación), desde el anonimato. A continuación, se enumeran los pasos a llevar a cabo con el fin de descargar e instalar Twint. Dividiendo la tarea en dos partes, instalación y configuración. Para instalar la herramienta vamos a clonar el repositorio oficial desde el GitHub de Twint (Figura 5), con ello obtenemos todos los archivos necesarios para ejecutar Twint en el directorio que en el que ejecutemos la primera sentencia. En una segunda fase se instalan y configuran las dependencias y librerías auxiliares que puedan necesitarse desde un fichero txt (Figura 6). git clone https://github.com/twintproject/twint.git Figura 5. Clonado de Twint desde Github. (Fuente: propia). pip3 install -r requirements.txt Figura 6. Instalación de requerimientos de Twint (Fuente: propia). Una vez Twint está instalado y configurado podemos ejecutar un script en el que se lanzarán las peticiones a la API recibiendo una respuesta (Figura 7) 20
import twint import pandas as pd c = twint.Config() c.Search = 'Donald Trump' c.Since = '2021-01-08 15:00:00' c.Until = '2021-01-09 15:00:00' c.Store_csv = True c.Output = 'donald_trump.csv' twint.run.Search(c) Figura 7. Script de Twint (Fuente: propia). El script anterior se compone de 3 fases, en la primera importa las librerías necesarias para poder ejecutar el código, en la segunda configura los parámetros con los que va a realizar el scrapeo, y en la tercera fase se lanza la búsqueda pasando el objeto c (que se ha configurado previamente) como parámetro. Es necesario importar Twint por motivos evidentes y en este caso también importamos la librería pandas (librería oficial de Python) para analizar y manipular los datos. La configuración del objeto c, con el que vamos a trabajar es intuitiva, se le especifica que busque los tweets que mencionen a Donald Trump entre el 8 y el 9 de Enero de 2021, que almacene los datos obtenidos en un archivo csv denominado donald_trump.csv para poder trabajar con los datos obtenidos transformando estos en información interpretable de manera matemática. Finalmente ejecuta el comando Search(c) el que lanza la búsqueda en la API del objeto con los parámetros especificados previamente, el resultado de la correcta ejecución del script es un archivo csv con un formato similar al de la Figura 8. Figura 8. Resultado del Script (Fuente: propia). 21
Los datos tal y como son devueltos no son visibles, pero gracias a que están en formato CSV, podemos formatearlos y hacerlos más entendibles, de forma que posteriormente podamos procesarlos. Al formatear los datos mostrando las columnas y filtrar un poco algunos campos podemos obtener un archivo de datos como el siguiente. Figura 9. Captura de pantalla de los datos obtenidos con el Scraping (Fuente: propia) 2.4. Showtime en el baloncesto El concepto del showtime es fácilmente explicable si empleamos un sinónimo como podría ser espectáculo, sin embargo, si hablamos del showtime en el baloncesto, este comenzó a emplearse en la década de los 80 en la NBA (National Basketball Asociation) que es la liga de baloncesto más importante del mundo. En Estados Unidos el baloncesto ha sido, históricamente, uno de los deportes más practicados y seguidos por la gente. Por ende, constituye una de las señas que definen y hacen conocido a su país por todo el mundo. Volviendo a la década de los 80, la NBA vivió una época dorada de la cual surgieron personalidades mundialmente conocidas, como podría ser Michael Jordan. A la par que Michael Jordan reinaba en la NBA surgieron figuras relevantes como Larry Bird, Magic Johnson o Kareem Abdul-Jabbar. Estos dos últimos formaron equipo en Los Ángeles Lakers durante toda la década de los 80, consiguiendo ganar 5 campeonatos de la NBA, llegaron a conseguir un juego tan vistoso y espectacular, como indica Jeff Pearlman [5] se le acabó poniendo nombre al estilo ofensivo con el que desenvolvían su juego, empleando contrataques muy rápidos y eléctricos, culminando las jugadas con una maestría y soltura que hacían que los espectadores que acudían a los estadios se pusieran en pie. 22
Para Jerry Buss, dueño de Los Lakers desde 1979 hasta 1982 [6], el showtime era una filosofía de juego y una estrategia de marketing con la cual podían conseguir llenar fácilmente el estadio, conectando al equipo y los aficionados. De esta unión surge un fenómeno mediático basado en el showtime, cuando en un partido de baloncesto uno o los dos equipos aportan un juego vistoso o bonito el público conecta más fácilmente que cuando es aburrido. Históricamente el juego de Los Ángeles Lakers se basaba en jugar al contraataque con movimientos rápidos de balón, no obstante, en la actualidad el concepto de showtime ha evolucionado hacia los componentes que hacen que cualquier partido sea más entretenido. Si observamos las acciones que pueden definir el showtime debemos tener en cuenta que un partido puede ser vistoso o entretenido tanto si los jugadores ofrecen un juego vistoso, como si los equipos o los árbitros protagonizan acciones polémicas. Para medir el showtime en un partido de baloncesto de la liga ACB es posible contemplar los partidos desde un punto de vista de jugada a jugada, empleando la herramienta que la liga proporciona en su página web. http://jv.acb.com/es . En esta aplicación web podemos ver todos los partidos de este último año con el siguiente formato: Figura 10. Captura de pantalla de la aplicación Jornada Virtual (Fuente: http://jv.acb.com/es ). 23
Al obtener un formato de jugada a jugada podemos cuadrar dichos momentos con el eje cronológico de un partido, pudiendo establecer teorías contrastables en otros partidos. Por ejemplo, si un árbitro expulsa a 3 personas por una tangana, debería de haber muchos tweets concentrados en poco tiempo en el periodo de tiempo que rodea dicha acción en el partido. Siendo esta la respuesta de la afición ante el evento ocurrido en el partido. 2.5. ACB La mayor liga de baloncesto en España tiene el nombre de (ACB), Asociación de Clubes de Baloncesto, su origen se remonta al año 1982 en un intento, por parte de los propietarios de los clubes que participaban en la antigua liga, de profesionalizar el sistema de juego de aquel entonces. [7] La liga ACB desde su creación, siempre ha contado con 18 equipos de origen español, y cabe destacar el hecho de que fueran españoles puesto que en el año 1992 el Basquet Club Andorra se uniría a la competición, en la que aún se mantiene hoy en día. Si bien la ACB siempre tuvo 18 integrantes, al finalizar la temporada 2019-2020 la ACB contaba con 18 equipos ya que al producirse la pandemia del COVID19 no se pudo terminar la liga, por lo tanto no había ningún equipo descendido. Finalmente el Gipuzkoa Basket conseguía unirse a la liga en el último momento y la temporada 20-21 pasó a tener 19 participantes, enfrentándose todos los equipos contra todos en formato de ida y vuelta (un partido como local y otro como visitante) teniendo en cuenta que cada jornada descansaría un equipo. Quedando un total de 38 jornadas que se extienden desde el 19 de Septiembre del 2020 hasta el 16 de Mayo. Siendo esta la jornada de finalización de la liga regular y dando paso al denominado play-off, en el que los 4 primeros equipos de la liga se enfrentan en un cuadro eliminatorio para decidir el campeón de ese año. Estos son los 19 conjuntos que integran la liga en la temporada 20-21, el nombre de sus pabellones junto con su capacidad y el año de fundación. Equipo Capacidad Títulos Followers en twitter Antigüedad BAXI Manresa 5.000 1 30 mil followers Septiembre 2010 Casademont Zaragoza 10.744 0 50,3 mil followers Enero 2012 24
Club Joventut Badalona 8.500 4 46,4 mil followers Febrero 2011 Coosur Real Betis 7.626 0 67,7 mil followers Noviembre 2009 Barça 7.585 19 585,2 mil followers Abril 2010 Gipuzkoa Basket 11.500 0 28,5 mil followers Octubre 2009 Herbalife Gran Canaria 9.875 0 73,4 mil followers Junio 2010 Iberostar Tenerife 5.000 0 44,8 mil followers Julio 2011 Monbus Obradoiro 5.060 0 32,7 mil followers Abril 2010 MoraBanc Andorra 5.000 0 20,5 mil followers Septiembre 2009 Movistar Estudiantes 13.109 0 55,8 mil followers Enero 2009 Real Madrid 13.109 35 670,9 mil followers Febrero 2013 RETAbet Bilbao Basket 10.014 0 77,4 mil followers Agosto 2009 San Pablo Burgos 9.454 0 20,1 mil followers Septiembre 2015 TD Systems Baskonia 15.504 4 88,3 mil followers Octubre 2009 Unicaja Málaga 10.642 1 82,8 mil followers Enero 2011 UCAM Murcia 7.454 0 65,4 mil followers Octubre 2009 Urbas Fuenlabrada 5.700 0 30,7 mil followers Junio 2011 Valencia Basket 9.000 1 145,1 mil followers Febrero 2010 Tabla 1. Tabla de datos de los equipos de la ACB (Fuente propia). 3.5.1 Clubes influyentes de la liga ACB Hay varias cosas que se deben tener en cuenta si se desea saber cuáles son los clubes más influyentes de la liga. Entre ellas podríamos tener en cuenta: 25
- Capacidad de sus estadios: Número de espectadores que pueden albergar en los mismos. - Número de títulos: Total de títulos conseguidos en ACB. - Número de seguidores: Cantidad de seguidores (o followers) en la red social Twitter. - Fecha de creación de la cuenta de Twitter: El momento que se creó la cuenta de cada club. Si observamos la tabla anterior podemos analizar la popularidad de los distintos equipos de la liga en base a los criterios que hemos definido con anterioridad. También cabe destacar que el año de fundación del club y el aforo de su estadio son datos menos relevantes para evaluar el engagement que el índice de victorias o la cantidad de followers en la red social Twitter. Ya que el estudio que se va a realizar depende de la interacción de los usuarios de Twitter y actualmente, con el estado de post-pandemia no ha sido posible que los aficionados acudiesen con normalidad a los estadios. Por lo que podríamos tener en cuenta varios puntos de vista sobre como enfocar los estudios: - Campeonatos: Únicamente hay 7 equipos que hayan conseguido un título de ACB, y dentro de ellos hay dos (Real Madrid y Barcelona) que acumulan un numero mucho mayor que los otros equipos que han conseguido, en el mejor de los casos 4 títulos. Además, la diferencia de títulos con Real Madrid (35 veces campeón) y Barça (Fue vencedor en 18 ocasiones) es notable entre los 5 equipos restantes sólo TDSystems Baskonia y Club Joventut Badalona cuentan con 4 títulos, el resto sólo han conseguido ganar en una ocasión. - Seguidores en Twitter: En este apartado hay un símil con el anterior, Real Madrid y Barça están muy distanciados de los demás equipos, sin embargo cabe destacar que Valencia Basket, que es un equipo que cuenta con 1 título de liga (2017) cuenta con más de 140.000 followers en su cuenta oficial. En otro orden de cosas, hay dos equipos que tienen más de 80.000 seguidores, Baskonia y Unicaja, ambos tienen en común con Valencia Basket que han sido campeones en, al menos una ocasión. - Fecha de creación de la cuenta de Twitter: Si observamos esta columna, podemos verificar que la mayoría de las cuentas están creadas en un intervalo de tiempo que comprende entre el 2009 y 2011 en la mayoría 26
de los casos, habiendo alguno que se creó en 2015 (pero este equipo participa en la liga ACB desde hace menos tiempo, por lo que no es relevante). - Capacidad de los estadios: Es notable comprobar que el estadio con mayor capacidad de toda la liga es el de TD Systems Baskonia, el cual se encuentra en Vitoria (recordemos que ha sido mencionado con anterioridad en este análisis. 2.6. El uso de las redes sociales y el nivel de interacción (engagement) de los clubes de la Liga Endesa ACB Realizar un análisis del uso de las redes sociales y el engagement de los clubes de la liga ACB [8] puede ser interesante ya que el estudio (obtendremos una visión genérica de cómo introducen conceptos como engagement en clubes deportivos, también podemos destacar el hecho de que en el artículo elaboran una relación entre el engagement corporativo y el deportivo, en que se basan los anteriormente citados.) Es importante resaltar que las RRSS en las que se apoya son Facebook y Twitter, que nos aporta una visión similar a nuestro caso. El modus operandi del estudio de los antes citados se puede resumir en varias fases: Introducción: Se ponen en conocimiento del lector varios conceptos sobre los cuales van a trabajar posteriormente (RRSS, Engagement desde el punto de vista empresarial) Método: Desglosan una serie de apartados referentes a cómo van a realizar el estudio (Participantes, Instrumentos para realizar las mediciones, Fórmulas que emplean para analizar las métricas, Procedimiento y el método de análisis de los datos finales) Resultados: Partiendo de unas ponderaciones que ellos mismos establecen, fundamentándose en el número de victorias, años de fundación de los equipos, aforo de espectadores y Engagement en Facebook y Twitter. Una vez recogidos todos esos datos los enmarcan en la figura 10. Conclusiones: Expone las conclusiones finales del artículo además de una serie de aplicaciones prácticas las que podrían ser tenidas en cuenta por los responsables de las RRSS de los equipos de baloncesto. Teniendo en cuenta lo antes expuesto, podemos señalar ciertos conceptos útiles o relevantes los que están extraídos del artículo anterior, con el fin de profundizar más en ellos. El primer concepto relevante es el concepto RRSS. Como indica Vivar [9] las redes sociales han constituido un fenómeno de masas por lo que la información que se comparte, en la gran mayoría de los 27
casos proviene de usuarios. Así, una buena estrategia empresarial enfocada en el ámbito de las RRSS puede hacer cambiar mucho el curso de una empresa. Ya que como indican en el artículo “En consecuencia, las RRSS han cambiado la estrategia de comunicación de las empresas con los consumidores, ya que están apostando por favorecer que los consumidores tengan un mayor acceso a la información para comunicarse con cualquier persona, en cualquier lugar y en cualquier momento.” el tener un mayor acceso por parte de los usuarios favorece esa relación simbiótica entre el consumidor y el vendedor. Al tener un mayor conocimiento sobre lo que el cliente desea el vendedor puede ajustar mejor las características de sus productos para que estos se vendan mejor, lo que produce un efecto beneficioso en el consumidor, ya que el producto que él consigue se adapta mejor a los gustos o exigencias del demandante. Figura 10. Tabla de engagement en Twitter (Fuente: RivalIQ ). 28
3. Objetivo El objetivo de este trabajo se centra en estudiar y comprender las relaciones existentes entre el engagement de un partido y la actividad que ocurre en las redes sociales, en concreto Twitter. El objetivo final es lograr predecir el comportamiento de Twitter ante el juego de los diferentes clubs de la ACB. Para ello será necesario cumplir con los siguientes subobjetivos. - Estudiar el comportamiento de Twitter ante las diferentes acciones que ocurren en los partidos. - Determinar cuales son las variables que definen la relación entre el partido y la actividad en redes: Tipos de jugada (triples, tiros sobre la bocina, tiros libres…), distintos tipos de momentos dentro del partido (no es lo mismo comparar la actividad en el primer minuto del primer cuarto que en el último momento de una prórroga), origen de la jugada (decisión arbitral, tangana…) - Formular la relación entre el partido físico y la actividad de Twitter mediante reglas en función de las variables - Validar la propuesta a través del análisis para lograr predecir la actividad de TW en función de la actividad del partido. El objetivo relevante al plano económico es que todo sea coste 0, si descontamos todos los otros gastos inherentes a realizar este trabajo (consumo de internet, eléctrico, horas de trabajo, equipamiento, etc.). 29
4. Metodología La manera de la que se va a proceder es aplicando el método científico. Según podemos constatar en el artículo del Instituto Aragonés de ciencias de la salud[10]. Para ello, concretamente se plantea la utilización del método hipotético-deductivo. Se trata de un método teórico sistemático, emplea un orden estricto con el fin de justificar la validez de las conclusiones que se obtienen. Tiene base empírica puesto que los fenómenos se observan de manera directa para conseguir que los datos documenten el conocimiento. Además, tiene naturaleza circular, constantemente es posible poner en duda lo que antes se había considerado como válido, de esta manera nos aseguramos de que no hay ninguna verdad dogmática. Empleando la denominada Rueda de Wallace podemos comprobar lo descrito anteriormente, en ella aparecen diversas fases que podrían resumirse en 4 puntos: - Observar el fenómeno a estudiar. - Crear una serie de hipótesis que traten de explicar el fenómeno en cuestión (esta es la parte inductiva) - Deducir las posibles consecuencias de las hipótesis planteadas (fase deductiva) - Tratar de refutar o confirmar las premisas o enunciados comparándolos con otros ejemplos basados en muestras de datos similares. (Fase inductiva) Figura 11. Rueda de Wallace (Fuente: Instituto Aragonés de ciencias de la salud). 30
También puede leer