Data science

Cómo utilizar ChatGPT para realizar análisis de datos (I)

Lanzado en noviembre de 2022 por OpenAI, ChatGPT se ha introducido rápidamente en el mundo «humano», convirtiendo palabras como «IA»[1], » Machine Learning»[2] y «Language Model»[3] en términos de uso común, o casi. En pocas palabras, ChatGPT es un complejo modelo de inteligencia artificial (entrenado sobre un corpus de textos prácticamente ilimitado y configurado con una estrategia combinada de refuerzo y aprendizaje supervisado), desarrollado para la generación de contenidos en formato texto a través de una interacción conversacional tipo «chatbot». Es decir, se formulan peticiones en lenguaje natural y se evalúan las respuestas.
 
Pero, ¿cómo puede utilizarse ChatGpt en el ámbito del Análisis de Datos para agilizar procesos y sugerir caminos? En esta sección presentaremos algunos posibles usos de ChatGPT en el análisis de datos: desde la generación de conjuntos de datos sintéticos hasta el análisis exploratorio enriquecido (con gráficos y modelos estadísticos), pasando por la necesaria documentación complementaria.

ChatGPT Prompting Strategies

Task 1: Generación de código

Prompt de importación/exportación de datos

Task 2: Generación de código

Ejemplo: Solicitud de implementación de una funcionalidad

Estrategia de composición del prompt:

  • Especifica el lenguaje de programación (por ejemplo, Python).
  • Especifica el formato de archivo (CSV/JSON….) y la estructura de datos, si se dispone de un conjunto de datos.
  • Detalla sin ambigüedades la funcionalidad que debe implementarse.
  • Da ejemplos de las propiedades y/o la forma del resultado deseado.
Prompt de solicitud para implementar una funcionalidad

Task 3: Creación de datos resumidos

Ejemplo: Creación de un conjunto de datos de muestra que respete determinadas características

Estrategia de composición del prompt:

  • Especifica el dominio de aplicación
  • Indica el formato y la estructura de datos deseados (para la estructura tabular, especifica: número de columnas, encabezado, tipo de datos, rango de valores… y define lo que representan).
  • Pide a ChatGPT que te proporcione una serie de preguntas a las que responder para caracterizar mejor el contexto.
  • Da ejemplos de datos o describir la disposición de los datos [opcional pero recomendado si la estructura es compleja]

 

Supongamos que está trabajando en el desarrollo de un proyecto con fines de demostración, un caso de uso, para proponerlo a clientes potenciales, pero no dispone de un conjunto de datos apropiado. Si nos interesa generar un número modesto de valores, en su mayoría de naturaleza categórica (no numérica) y con bastante variabilidad, sin duda podemos utilizar ChatGPT para crear un dataset resumido. En el ejemplo siguiente, se establecerá el dominio de aplicación, después se pedirá a ChatGPT que formule una serie de preguntas que considere útiles para comprender mejor nuestra consulta, task y, por último, el conjunto de datos sintético.

Contexto y tarea definidos con la técnica Ask Before Answer. La interacción comienza con la delimitación del contexto de la aplicación y continúa con la indicación de la tarea que debe realizarse, seguida de una petición explícita de que se formulen preguntas adecuadas para aumentar la precisión de la respuesta y, por tanto, tales que guíen al usuario a la hora de especificar todos los detalles pertinentes. A continuación se presentan algunas de las preguntas planteadas por ChatGPT y que constituyen, como podemos adivinar, el corazón de esta estrategia de prompting, capaz de guiar incluso a los usuarios menos expertos en la formulación completa de la solicitud antes de que ésta sea asumida por el modelo.

Prompt de Creación inmediata de datos resumidos
Respuesta ChatGPT
Texto generado guardado como Excel
Visualización de datos

Conclusiones

Hemos descubierto cómo ChatGPT puede revolucionar el Análisis de Datos, destacando la importancia de las estrategias de prompting para lograr resultados precisos, por ejemplo, en la generación de código y la creación de conjuntos de datos sintéticos.

No te pierdas el próximo episodio, en el que exploraremos otras aplicaciones útiles de ChatGPT en el Análisis de Datos, desde el análisis exploratorio (EDA) hasta la documentación.

Lee todos nuestros artículos sobre Data Science

¿Quiere conocer las últimas novedades sobre Fivetran y las nuevas tecnologías de data science?

Visualitics Team
Este artículo ha sido escrito y editado por uno de nuestros consultores


Fuente:
[1] www.trends.google.com
[2] www.trends.google.com
[3] www.trends.google.com

Compártelo ahora en tus redes sociales o por correo electrónico:

Suscríbete al boletín

Para estar informado sobre las novedades de Tableau y Alteryx, sobre nuestros productos y servicios y sobre los próximos eventos de Visualitics, suscríbete a nuestro boletín. ¡Puedes elegir el tipo de envío que prefieres y darte de baja en cualquier momento!
¿Qué novedades quieres recibir?
¿Qué empresa trata tus datos?

VISUALITICS PARTNERS, S.L. (en adelante, “VISUALITICS“)

¿Por qué tratamos los datos que te pedimos?

Únicamente tratamos tus datos para poder prestarte los servicios de VISUALITICS + info

¿Cuál es la legitimación para este tratamiento de tus datos?

Estos datos son necesarios para llevar a cabo la prestación de los servicios ofrecidos por VISUALITICS + info

¿Se van a hacer cesiones o transferencias con tus datos?

Si así lo consientes, tus datos podrán ser cedidos a terceras empresas. + info

¿Cuáles son mis derechos?

El interesado tiene derecho a ejercitar su derecho de:

– Acceso, rectificación, supresión, oposición, portabilidad de los Datos, limitación del tratamiento y a no ser objeto de decisiones automatizadas individualizadas + info

¿Tienes dudas?

Tanto si tienes alguna o sugerencia como si quieres darte de baja ponte en contacto con nosotros enviando un email a la siguiente dirección: info@visualitics.es