Hace unos días estuvimos compartiendo nuestro proyecto con Deportes en la Z, atendiendo a una invitación que cortésmente nos extendiera José Luis Mendoza. Apenas empezado el primer segmento de nuestra intervención, en la segunda pregunta que se nos hiciera al grupo que visitábamos el programa, ya estábamos entrando en materia sabermétrica y la cuestionante principal era: ¿Cómo percibe nuestra cultura beisbolera a este "moderno" lenguaje numérico?
En este intercambio de ideas, planteábamos el por qué nos auxiliamos de ciertas estadísticas sabermétricas para poder interpretar mejor los números fríos y a la vez saber diferenciar desempeños "suertudos" de los extraordinarios. Puse como ejemplo la relación existente entre promedio de bateo (AVG.) y carreras anotadas por un equipo cualquiera contra la relación existente entre el OPS (On Base Plus Slugging) y las carreras anotadas. Este es el ejemplo más digerible al momento de tratar de explicar las bondades de la sabermetría a un desconocedor del tema.
Históricamente, nos hemos moldeado para entender tres medidores de desempeño por encima de cualquier otra "línea numérica" y estos son Promedio de bateo, Cuadrangulares y Empujadas. Si bien estos tres medidores son el sine qua non mediante el cual otorgamos el premio al Jugador Más Valioso, a simple vista nos dicen muy poco en cuanto al aporte del jugador a las victorias del equipo. El OPS (On Base Plus Slugging) fue la primera métrica avanzada que fue ampliamente aceptada y difundida por el conglomerado estudioso del Béisbol. Este medidor suma el OBP (On-Base Percentage) y el SLG (Slugging). En otras palabras, mide tanto la capacidad del bateador de embasarse como la capacidad de conectar para poder.
Jorge Tallaj, en su columna ¿Se relacionan el OPS colectivo y las Carreras Anotadas? desarrolla el tema a profundidad, así que los remitimos a esa entrada para los que quieran profundizar un poco más.
Contrario a la creencia poco fundamentada de que las estadísticas sabermétricas son abstractas, vemos como el OPS (On Base Plus Slugging) nos ayuda a relacionar la realidad con un medidor que hasta no hace mucho, era parte de los indicadores no convencionales.
Es por esto que hoy traemos la estadística avanzada RC (Runs Created) o Carreras Creadas.
El término RC (Runs Created) o carreras creadas, fue desarrollado por Bill James conjuntamente con su fórmula en el añ0 1979. El propósito de este estimador, es cuantificar el aporte individual de un jugador al carreraje total del equipo. La razón por la cual esta estadística es ampliamente aceptada radica en el hecho de que podemos ver como el carreraje real de un equipo, suele estar dentro de un rango de 5% con relación al estimador. En nuestra introducción mencionábamos como hemos condicionado nuestra percepción para que el paradigma que evalúa el desempeño de un bateador sea la "línea numérica" de Promedio de bateo, Cuadrangulares y Empujadas. Estos índices son buenos medidores para decirnos lo que sucedió en el terreno de juego, pero no nos permiten evaluar objetivamente el aporte individual ya que no toman en cuenta el contexto situacional.
Detengámonos a pensar por un instante. ¿Quién tiene mayor capacidad remolcadora? ¿Un bateador abridor o un cuarto bate? De estos dos, ¿Cuál de los dos encuentra más corredores en las bases cuando le toca el turno de batear? Estos medidores dependen mucho de la oportunidad, y pueden estar inflados o no, dependiendo de la calidad de los compañeros de equipo con los que cuente. El propósito de estas estadísticas de nueva generación es precisamente aislar los eventos, de manera tal que podamos evaluar al jugador "vacío". ¿Qué está haciendo el jugador independientemente de sus compañeros y del entorno situacional? Esa es la pregunta que siempre debe tomarse en cuenta.
Continuando con la subjetividad de la "línea numérica" ya mencionada, tenemos los Cuadrangulares y Carreras Remolcadas, ambas estadísticas de conteo. Las estadísticas de conteo se acumulan a lo largo del tiempo y a mayor cantidad de turnos, mayor será el total. El Promedio de Bateo es una relación y puede estar condicionada por el período que se toma en cuenta. Las estadísticas de relación son muy volátiles en períodos muy cortos.
Desde entonces, James ha introducido varios cambios a la fórmula, incorporando aspectos ofensivos como Bases Robadas y Atrapado Robando para ajustar los márgenes de error del estimador. Hay varias fórmulas "técnicas" para las RC (Runs Created), algunas incluso desarrolladas exclusivamente para el bateo situacional, pero nos concentraremos en la mas utilizada desde 2002, que es la versión de James incluida en el Bill James Handbook.
Para fines de nuestra Liga, si queremos obtener el número de RC para un equipo, basta con multiplicar el OBP (On-Base Percentage) por el SLG (Slugging) por el número de veces al bate y obtendremos un número de Carreras Creadas o RC (Runs Created), con no más de un 8% de diferencia. Para fines de un jugador en particular es preferible utilizar la fórmula técnica propuesta por James, ya que la fórmula básica no saca al jugador que queremos evaluar del contexto y lo toma en cuenta. Algo que sabemos que es imposible, ya que un jugador no interactúa con sí mismo. Es como si el bateador estuviera en primera base al momento de él mismo conectar un Cuadrangular y se le acrediten 2 remolcadas.
Dado que la fórmula logra estimar con precisión aceptable el total de carreras que un equipo debió anotar una vez las comparamos con las carreras reales, podemos extrapolar este análisis estadístico al jugador individual y a través del resultado, cuantificar la producción del jugador en términos de cuantas carreras representó del total del equipo. No hay otra estadística de conteo (Cuadrangulares, Remolcadas o Carreras Anotadas) ni de proporción (Promedio de Bateo, OBP, SLG) que mida la contribución real ofensiva como un todo, sin tomar en cuenta la situación en la que se encontraba el bateador.
Esta es una de las maravillas de las estadísticas sabermétricas.
Donde:
Variables:
En lugar de utilizar la fórmula más básica o la fórmula técnica de Bill James, utilizaremos la variante que nos dió el menor porcentaje de error, con solo un 7.5%. La fórmula es la siguiente:
Utilicemos los datos de los Gigantes del Cibao en el 2010 a manera de ejemplo, para desarrollar nuestra fórmula.
Desarrollando la fórmula para los demás equipos, hemos preparados dos tablas para las temporadas 2010-2011 y 2011-2012.
Como podemos apreciar en ambas, podemos decir que para una liga donde solo se juegan 50 partidos entre sies equipos, un margen de error entre un 7.5% y un 8% es aceptable.
La finalidad de este breve análisis, es partir de lo general a lo particular. Si el caso aplica a un todo, ¿por qué no llevarlo a su mínima expresión? En este caso, lo general es el equipo y lo particular sería el jugador. Si puedo estimar teóricamente la cantidad de carreras que un equipo produce, tomando en cuenta todos los renglones ofensivos y no solo los tradicionales, hacerlo para el jugador nos da la posibilidad de evaluar su contribución al equipo, más allá de las Carreras Remolcadas o Carreras Anotadas y hacerlo completamente independiente del contexto.
Usemos los números de Carlos Peguero durante la Serie Regular de la Temporada 2011-2012 para hacer el cálculo individual por jugador para el RC.
A continuación, la tabla que muestra los cinco mejores productores de carreras para sus equipos durante la Temporada 2011-2012:
A la tabla mostrada más arriba le hemos agregado una segunda columna, que muestra las RC27. Esta estadística nos dice cuantas carreras podría anotar un equipo si las 9 posiciones en el line-up fueran ocupadas por este jugador. Dado que la fórmula para RC27 toma en cuenta la cantidad de outs entregados por el bateador, a menor cantidad de outs, mayor numero de RC27.
Carlos Peguero fue el bateador que más produjo para su equipo y esto no nos sorprende, tomando en cuenta que fue lider en Bases Totales Alcanzadas, Total de Extra-Bases Conectados, Bases por Bolas Intencionales y Cuadrangulares. Sin embargo, entre los líderes de RC, tiene el tercer mejor RC27 y esto se debe a que utilizó mas outs que Arias y Bogusevic para alcanzar sus números ofensivos.
De nuevo, los números de última generación procuran poner al bateador/lanzador en el vacío, para poder evaluar su desempeño en función de su colaboración al equipo, sin tener que depender de su entorno (line up con corredores que se embasan, posisción favorable en el line up, line up con hombres remolcadores, etc), que a veces favorece o desfavorece según sea la alineación y escapa por completo del control del jugador.