DESHOJANDO LA MARGARITA CON TABLAS PIVOTE DE EXCEL

Jorge AndradeSOFTWARE5 Comments

Tal vez los jóvenes de hoy no lo sepan pero hace algunos años se imprimían todos los tabulares o banners del estudio; si eran mil tablas o cruces estadísticos se llevaba el mamotreto de mil o más hojas empastado o engargolado en uno o varios tomos junto con el sumario ejecutivo y se le entregaba al cliente el día de la presentación. Eso es importante, decía mi jefe, es el “size impression”. Así el cliente pensaba: qué bárbaro, qué bruto, como trabaja este wey.

Ya desde aquel entonces veía muy poco útil imprimir todo ese montón de tablas pero el asunto era apantallar. Afortunadamente, eso ya se acabó, me refiero a imprimir los tabulares no a la onda de apantallar. La verdad es que todavía dudo que haya muchos clientes que sepan leer este tipo de tablas y más ahora que se entregan en formato digital (ya sea Word o Excel) pues es más difícil ver dónde empieza y dónde termina el asunto.

Veo dos razones por las que no es tan fácil leer a través de todas esas tablas, la primera tiene que ver con el propio usuario ya que no sabe como procesarla el mismo; es decir, nunca ha procesado los datos de una encuesta en formato tabular o ha usado el software que sirve para esos menesteres; la segunda está relacionada con los conceptos básicos de la estadística. Por ejemplo, cuántos saben lo que es una mediana. No se rían, es en serio, no todos lo saben.

Parece que las cosas empiezan a cambiar debido a la fuerte crisis económica mundial y al impresionante paso de la tecnología de la computación lo que ha traído consigo presupuestos más cortos para investigación y mayores exigencias en tiempo y resultados. Estos cambios permanentes, valga la expresión, están forzando a los jóvenes a conocer y adentrarse más en las herramientas de que disponen para su trabajo, una de ellas son las tablas dinámicas o pivote de Excel.

Uno de los primeros programas que recuerdo para procesar datos tabulares era el Survey; uy, estoy hablando de la época de los dinosaurios y también el SPSS, luego vino Quantum que desplazó a ambos, hasta que lo compró SPSS; sin embargo, ahora que éste ha sido vendido a IBM siento que las cosas no pintan bien para este programa tan popular (ya sabemos lo que se puede esperar de IBM). Por otro lado, en los últimos años el programa Gandía Barbwin ha alcanzado un buen lugar como software especialista para procesar datos; la facilidad y rapidez con la que hace los cruces de información son más que bien sabidos, así como su versatilidad para manipular la base de datos. Por supuesto, ha habido muchos otros programas de proceso de datos que han utilizado los mercadólogos pero esos no han sido tan populares. Bueno, la cosa está así: hasta el día de hoy los cruces de información se siguen haciendo con este tipo programas especializados ¿Por qué casi nadie en investigación de mercados utiliza tablas pivote de Excel para hacer cruces de información?

Proceso en tablas dinamicas

Antes de responder a la pregunta déjame chismearte bien. Una tabla pivote es una característica o utilidad que trae Excel desde su versión 5, oséase desde el siglo pasado, que sirve para hacer cruces de información de forma resumida (frecuencias, porcentajes, promedios, desviaciones estándar, etcétera) y para dejártelo más claro, es la función más poderosa que tiene Excel. Al igual que muchos otros programas ha venido evolucionando y en la versión de Excel 2007 se introdujeron bastantes cambios que lo hacen ver como una opción seria para procesar los datos de una encuesta ¿Por qué? Hay varias razones pero te voy a citar unas cuantas:

1. La capacidad de Excel se incrementó hasta poder manejar más de un millón de casos y dieciséis mil variables.

2. Con Excel generas en automático tablas y gráficas dinámicas que tienen un mejor “look” que la mayoría de los otros programas ¿será esa una de las razones por la que los clientes piden la base de datos en Excel?

3. Los nuevos formatos condicionales te permiten hacer un chorro de cosas que le dan visibilidad y notoriedad a los datos.

4. La base de datos de la que dispones al momento en tus encuestas en línea o con dispositivos móviles casi siempre está en Excel (también está disponible en otros formatos pero Excel es el básico). Eso te brinda ventajas para tu proceso y presentación de resultados.

5. ¿Cuánta gente conoces que no use Excel o Power Point para hacer sus presentaciones, gráficas, tablas o esquemas. Ta difícil, verdad?

6. Si bien, los macros y la sencillez para aprender su lenguaje (VBA-Visual Basic For Applications) ya existían desde los tiempos de Adán y Eva, con las nuevas tablas dinámicas puedes ahorrarte muchas pero muchas hrs. de trabajo y esfuerzo.

7. Si eres de los que les gusta apantallar todavía lo puedes hacer con las tablas pivote de Excel; al menos hasta ahorita que todavía hay clientes que no dan acuse de recibo.

8. Son una maravilla para filtrar por periodos las mediciones de un tracker (véase la imagen de abajo, actualizada al 2014).

tabular del tracker

Esas son las “good news” ahora ahí te van las malas noticias:

1. No puedes ponderar la base de datos (en un próximo post hablaremos sobre ponderación) o manipular la base de datos como en un SPSS o Gandía, por ejemplo.

2. No puedes procesar preguntas multi-respuesta ni generar netos (eso también luego lo vemos).

3. No hay forma de encadenar preguntas en un banner; es decir, si quieres cruzar una pregunta por sexo y edad tienes que hacer dos tablas por separado una para sexo y otra para edad.

4. No es posible obtener todos los estadísticos a los que estamos acostumbrados, por ejemplo, la famosa mediana.

5. Ni tampoco tenerlos todos juntos, por ejemplo si quieres porcentajes y frecuencias simplemente no hay de piña o pides frecuencias o porcentajes.

6. Ya ni hablar de las diferencias estadísticamente significativas.

Toma en cuenta que estamos hablando de aspectos muy específicos del procesamiento de encuestas (netos, ponderación, banners, etc.) y que Excel no fue pensado para eso. Sin embargo, Excel 2010 ha incorporado el lenguaje DAX (Data Analysis Expressions) que es muy parecido a las funciones que ya tiene Excel pero lo puedes usar en tus tablas dinámicas o pivote, a través del software PowerPivot el cual es un complemento de Excel 2010. Muchas cosas que no podía manejar Excel 2007 ahora las puede hacer Excel 2010-PowerPivot, pero ¡Espérate! no te alarmes, PowerPivot es gratis y el lenguaje es igual a lo que estás acostumbrado a usar en Excel. Por otro lado; si tienes bases de datos de más de un millón de casos, con PowerPivot puedes manejar hasta 100 millones ¿te parece suficiente?

De todas formas ¿Por qué molestarse en aprender tablas dinámicas y VBA para manipularlas, si puedes seguir procesando mejor con tu software habitual? Como dice Bob Dylan: “la respuesta mi amigo está en el viento”. En otras palabras, se trata de tendencias, para mi es claro que Excel seguirá evolucionando y que cada vez más clientes irán involucrándose con los datos ¿Y que es lo que tienen más a la mano, mejor saben manejar y para ellos es más versátil? ¡Correcto! Excel. No les pidas que procesen en SPSS o Gandía no lo van a hacer o ¿ya nadie recuerda el experimento de Quantum con su famoso Quanvert que era un programa especial diseñado para el cliente con el fin de que el mismo hiciera sus cruces? Sencillamente no funcionó. Por otro lado, hay todo un mundo de gente que ha creado complementos (add-ins) para subsanar las limitaciones de Excel; así como comunidades enormes de ayuda en Internet. Sé que necesitas procesar en tu programa favorito porque los clientes te seguirán pidiendo el inmenso archivo de tablas pero recuerda que anteriormente también te pedían el marmotreto de tablas impreso y eso se acabó; pronto, muy pronto también ese archivo digital con todas las tablas será obsoleto; el cliente solo pedirá su base de datos preparada para hacer sus cruces el mismo ya sea en tablas dinámicas u otro software.

Por el momento, antes de despedirme te doy los tips de como manejamos las tablas dinámicas:

1. Arreglamos la base de datos de forma tal que dependiendo del tipo de variable la tabla dinámica arroje las estadísticas adecuadas. Es decir, si son variables discretas como sexo, nse, marca más frecuente, etc. Excel arroja frecuencias y porcentajes; en caso de que sean variables de intervalo Excel te da promedios y los famosos top two boxes (esto nosotros lo arreglamos mediante macros).

2. Dado que no puedes encadenar variables o hacer banners múltiples, generamos cada una de las tablas dinámicas que necesitamos de cada variable de cruce por separado. Por ejemplo, si necesitamos cruzar por sexo y nse (nivel socio-económico), hacemos una tabla cruzada por sexo contra la base o frecuencia y otra con los porcentajes y lo mismo hacemos con la variable nse.

3. Hacemos una tabla muy mona bien formateada para entregar al cliente la cual vinculamos mediante formulas a las tablas dinámicas que se generaron en el paso 2 para que aparezcan los datos de esos cruces en ella. Nota importante, no usamos el comando “GetPivotData” (se encuentra en las opciones de la tabla dinámica) ya que necesitamos que la tabla cambie cada vez que el cliente hace un nuevo cruce. El comando “GetPivotData” es útil cuando lo que cambia es la base de datos y no las variables de cruce; como por ejemplo, en un tracker son extremadamente útiles.

4. Creamos los macros para que el cliente pueda elegir otras variables de cruce dentro de su base de datos con base al tipo de variable como explicamos en el punto 1.

5. Utilizamos los formatos condicionales para resaltar los totales o cualquier otra regla que desees enfatizar. Por ejemplo, si metes diferencias estadísticamente significativas puedes señalarlas con círculos de colores.

6. Finalmente ocultamos todas las hojas de Excel donde están las tablas dinámicas y sólo dejamos visibles dos hojas: una con la base de datos de la encuesta y otra con el reporteador y los controles de los macros.

¿Complicado o requiere de mucho esfuerzo? Si le preguntas a alguien que sabe manejar macros te dirá que es muy fácil y sobre el esfuerzo; tal vez pero no te llevará más de un día hacerlo y considera que después no lo volverás a repetir nunca más ya que seguirás usando los mismos macros a menos de que cambies o decidas ajustar a otras versiones de Excel.

¿Será que algún día los clientes decidan deshojar la margarita con tablas pivote de Excel? Yo creo que si.

Hasta la próxima.

¡Compártelo a tus amigos(as)!...Tweet about this on TwitterShare on LinkedInShare on FacebookShare on Google+Email this to someone
Jorge AndradeDESHOJANDO LA MARGARITA CON TABLAS PIVOTE DE EXCEL

5 Comments on “DESHOJANDO LA MARGARITA CON TABLAS PIVOTE DE EXCEL”

  1. Canek Riestra

    Yo amo Excel. En serio. Y sólo me gustaría añadir cerecitas al pastel que creo ya cubriste estupendamente con el post:

    * Creo que el cliente sigue pidiendo la base de datos en Excel, además de la familiaridad con el programa, porque el mismo Excel es un puente informático entre los programas de DBM. Su programación es virtualmente universal y es muy fácil vincular datos de diferentes fuentes y programas. Cuando las organizaciones usan programas foráneos, lo más sencillo es exportar en Excel y de ahí reconvertir.
    * También creo que SPSS tardará mucho en que le vaya mal. Más bien lo que he visto que está pasando en el mundo informático de la investigación es que están desagregando los programas a aplicaciones muy concretas. SPSS mismo se dividió en 4 grupos de software que hacen una sola tarea (para tabulares yo uso Desktop Reporter, ahora llamado SPSS Data Collection Survey Reporter), y para reportear datos se están poniendo de modas las nubes y gestores en línea como Tableau y QlikView; y para levantar datos están proliferando los programas cargables a web y a mobile devices, con precios cada vez más accesibles. Como que la tendencia es “zapatero a tus zapatos”.
    * A mí me gusta definir la diferencia entre Excel y otras plataformas en que Excel es un programa para hojas de cálculo, no para bases de datos. Aún sabiendo que prácticamente todo dato se puede administrar en Excel, precisamente por esta propiedad universal es que Excel no se meterá en competir sus propiedades con los gestores de datos y los reporteadores, pues tendría que limitar otras propiedades para que funcione bien. Excel es como el hermano mayor, que aunque no se mete con sus primitos, todos acudirán a él en busca de consejo.

    Saludos!!!!

    1. Jorge Andrade

      Gracias Canek por todos tus comentarios. He estado preguntando en foros de Excel y otros lugares como ponderar la base de datos en él y nadie ha podido decírmelo pero Jesús Romero que trabaja con nosotros dio con la solución y te aseguro que más de uno se va a quedar con la boca abierta como yo. Así que no te pierdas el próximo post será todo una primicia, cortesía de nuestro amigo Jesús Romero. Saludos y nuevamente muchas gracias por seguirnos y enriquecer este blog con tus comentarios.

  2. Abraham Barrientos

    Hola Jorge, excelente el análisis que haces sobre el tema de las limitaciones de la tabla pivote de Excel para analizar datos procedentes de encuestas. Te comento que mucha gente subestima la complejidad de los datos de una encuesta. Muchos son los que se embarcan en Excel, y los mas atrevidos a desarrollar sus propios sistemas de tabulación y análisis. Al final todos, todos terminan por darse cabezasos hasta que se rinden.

    Aca te de dijo el link de Rotator Survey, se trata de un esfuerzo serio para subsanar todas esas limitaciones y aproximarse al modelaje y análisis de un estudio cuantitativo estandar. Gandia Barb Win me parece excelente herramienta, desafornutadamente no es fácil de usar y tecnológicamente quedó relegada. SPSS es compleja y dificil de usar y tecnológicamente primitiva. Me gustaría vieras RotatorSurvey, el cual combina potencia con amigabilidad.

    Suerte
    Abraham

    http://www.rotatorsurvey.com/

  3. Eduardo Pinedo

    Excelente artículo Jorge. Felicitaciones por lo ameno, interesante y útil que resulta tu artículo. Llegamos a él investigando sobre tablas dinámicas o pivotantes, lo cual hicimos porque estamos diseñando un proyecto para ofrecer un servicio de procesamiento de datos en Marketing, Investigación, educación, salud, etc. en Venezuela y, justamente pensamos que la mejor forma de hacerlo es utilizando dichas tablas. Podrías darnos una idea de cómo conceptualizarlo y cómo venderlo?

    1. Jorge Andrade

      Gracias por tus comentarios Eduardo. No estás hablando de hacer un add-in (software) para comercializar ¿Verdad? Si quieres puedes contactarme por Skype en jorge.andrade.rios y lo peloteamos un poco.
      Saludos.

Leave a Reply

Your email address will not be published. Required fields are marked *