martes, 24 de abril de 2018

Big Data para el baloncesto

Resultado de imagen de big data nba

Desde hace años en la NBA se está aplicando el Big Data para intentar entrenar y hacer jugadas de mejores formas. Y no solo eso, sino que también es aplicada a la hora de escoger los jugadores en el Draft. Sin embargo, en la ACB (ni siquiera en Europa) se aplica esta tecnología. Sí que es verdad que hay varios estudios diciendo quien es el mejor tirador, que jugador debería jugar, etc. pero nada de ello llega a considerarse más de Smart Data. De hecho, en EEUU hay un congreso (vídeo de un panel de este año, https://www.youtube.com/watch?v=jL2ZSMQOOS4) de dos días de duración que se dedica solamente al Big Data orientado al baloncesto: el Sports Analytics Conference (SSAC), organizado por el MIT Sloan (en Boston). Se organizan decenas de paneles de discusión, competiciones hackaton, concursos delante de inversores y en la vertiente académica, se publican alrededor de 30 artículos científicos.

A la hora de la recopilación de datos en la NBA los campos de juego cuentan con sistemas multi-cámara instalado en los techos de los pabellones para hacer el tracking de los jugadores en los ejes X y Y. Luego empresas como STATS o Second Spec proporcionan estos servicios a las diferentes franquicias. Estas cámaras son capaces de tomar 25 imágenes por segundo para captar todos los movimientos al milímetro. Por otro lado algunos jugadores también llevan cámaras portátiles en las camisetas para poder obtener videos de los defensores. Después, las empresas, son capaces de codificar los datos en 12 dimensiones de orientación debido a como tenía el jugador posicionados los brazos. Esto añade otra capa de complejidad a las multi-cámaras del techo, ya que estas no son capaces de detectar la altura en la que se encuentran los brazos o el cuerpo del defensor. Además de los sistemas ya comentados, también se recoge información de las estadísticas que están en las bases de datos correspondientes (NBA, NCAA, universidades, otras ligas de otros países…). Esto se utiliza sobre todo a la hora de seleccionar a los jugadores para el Draft.

Las aplicaciones más básicas de este tipo de tecnología van desde hacer jugadas teniendo en mente el defensor hasta la confección teórica de diferentes jugadas y ver como resultarían en distintos escenarios. De hecho, para esta última  aplicación ya hay una empresa que tiene un software (Bhostgusters) licenciado, aunque todavía no comercializado (vídeo demostrativo de Bhostguster, https://www.youtube.com/watch?v=W2V7FBlSnpI). Al otro extremo de las aplicaciones al uso, nos encontramos con otras que podrían ser más interesantes. Una de ellas es la creación de un jugador fantasma para ver cómo se comportaría frente a nuestro jugador y así aprender como este debería de reaccionar en cada situación. También hay softwares que son capaces de identificar con un 95% de exactitud por el movimiento de los jugadores durante todas las posesiones del encuentro el equipo que es, siendo el peor catalogado los Phoenix Suns con un 65%. Sin embargo, no han conseguido su segundo objetivo, que era gracias al ‘deep learning’ que la maquina fuera capaz de predecir por una simple jugada el equipo que era. Se han quedado en un 24% de acierto. No obstante, al puntualizar que el jugador estrella de la franquicia estaba en pista el porcentaje de acierto subía al 42%. También hay otros que prevén cuando hacer un tiro de 2 (y desde que distancia) o cuando es mejor realizar un tiro de 3, incluso que porcentaje de tiro de 2 frente al de 3 has de tener para aumentar tus posibilidades de vencer en el encuentro.

Softwares más avanzados son capaces, mediante cadenas de Markov (un tipo especial de proceso estocástico discreto en el que la probabilidad de que ocurra un evento depende solamente del evento inmediatamente anterior), determinar en cada situación cual sería la mejor elección. Se plantea el curso de la posesión como una serie de estados finitos, donde el jugador con el balón tiene un posible conjunto de acciones (mantener el balón, pasar o tirar), cada una con una probabilidad (cuanto más lejos o más presionado, menor será la probabilidad de tiro) y una recompensa asociada, el número de puntos que se pueden anotar. Todo este conjunto de probabilidades constituye una cadena de posibles eventos y probabilidades de transición, que confluyen en una métrica para evaluar la eficiencia del tiro, es decir: la probabilidad que tiene un jugador de anotar un lanzamiento dada una secuencia de eventos (pases y movimiento) y una presión defensiva concreta. Pero no solo se puede aplicar en el ataque, sino que también puede ser aplicada de forma pasiva, es decir en defensa. Un claro ejemplo es cuando hacer una defensa 2 contra 1 (2c1). Es necesario calcular el riesgo de hacer una defensa doble, ya que si se consigue hacer un pase fructífero se puede conseguir un tiro cómodo. Para ello se modela una cadena de Markov partiendo el campo en diferentes trozos y sabiendo qué jugador tiene el balón. Luego, un defensor cercano (diferente al que defiende al jugador con balón) tiene dos acciones posibles: hacer el 2c1 o no hacerlo, y la recompensa en este caso se mide con los puntos no encajados. Por si fuera poco, otros factores como el peso del jugador defensor, el rango de tiro del jugador con el balón, la posesión o el marcador también se tienen en cuenta en este modelo. Como resultado curioso del estudio, resaltan que a jugadores emblemáticos como Lebron no merece la pena hacer un 2c1 (me imagino que meterán de igual manera teniendo uno o dos defensores o sacaran una asistencia que se convertirá en canasta), pero si a otros a los cuales les puede la presión.

Aun en vista de las grandes mejoras que podría ofrecer el Big Data muchas franquicias son reticentes a la hora de aplicarlas. Un claro ejemplo de ello es el Draft, donde los General Managers (GM) prefieren basarse en sus instintos, jugadores de universidades conocidas (principalmente porque son más vistos por los ojeadores) o jugadores más altos o con más envergadura para ser escogidos en la primera ronda del Draft. Respecto a este último punto, según los GM el físico es algo innato, mientras que la técnica individual se puede trabajar y mejorar. Y aunque eso es verdad, los datos avalan que los jugadores que controlan mejor el balón son los que más éxito suelen tener a la larga. Y más que los puntos anotados los factores que más positivamente influyen en el rendimiento de la NBA son el porcentaje de rebotes y de pérdidas, ambas relacionadas con el control del balón.

Por último, una aplicación todavía no utilizada en el Big Data seria el uso de la información para saber cada jugador en qué posición debería jugar. Normalmente, la posición de los jugadores viene determinada por su altura, sin embargo, últimamente en la ACB se han visto cambio de posiciones que han beneficiado notablemente a las estadísticas de los jugadores. Dos casos cercanos de ellos sería el de Dejan, que al pasar de alero a escolta ha triplicado su números. Se puede pensar que gracias a los cm extras que les saca a sus defensores tiene esa ventaja, y podría serlo, pero ahora os presento un ejemplo del otro extremo. Devin ha pasado de jugar de 4 en la segunda liga de Turquia a 5 en la Liga Endesa, la cual es más dura defensivamente y físicamente hablando. Thomas pese a ser más pequeño que sus oponentes, tiene una movilidad extra que le da la ventaja que le propiciado a duplicar sus puntos.

No hay comentarios:

Publicar un comentario

Pedimos por favor que la gente sea respetuosa.