ChatGPT Prompting Strategies
En el centro de la interacción con ChatGpt está el concepto de prompt, el mensaje del usuario que proporciona el contexto y las instrucciones para la interacción.
En general, las estrategias de prompting giran en torno a dos fases, con contornos más o menos precisos:
- Exposición del contexto: en esta fase se proporciona información al modelo, se puede ser más o menos específico, pero se puede imaginar cómo la precisión de las respuestas generadas es potencialmente directamente proporcional a la precisión y cantidad de la información;
- Definición de la tarea: aquí se establece claramente, sin ambigüedades, la tarea que debe realizar el modelo. Una tarea compleja puede subdividirse en subtareas secuenciales, de modo que la ejecución del intérprete de código interno de ChatGPT pueda comprobarse a tiempo y corregirse en caso necesario.
Estos pasos son cruciales para guiar eficazmente a ChatGPT en la generación de respuestas relevantes y precisas, mejorando así la experiencia global de interacción. En la ciencia de datos, esto abarca desde la escritura de código específico para determinadas funcionalidades, por ejemplo, la gestión de la importación y exportación de datos, hasta el análisis, incluidos gráficos y modelos estadísticos, y la creación de documentación. Pero vayamos al grano, explorando algunos posibles usos de ChatGPT en el análisis de datos, junto con indicaciones para componer prompts óptimos para cada tarea.
A partir de la versión 4 de ChatGPT (para cuentas Plus), en cada conversación el usuario dispone de un entorno virtual (virtual environment), en el que se ejecuta un intérprete de Python (que incluye la herramienta de Advanced Data Analysis), capaz de ejecutar código escrito en este lenguaje. ¿Pero escrito por quién? Por ChatGPT, ¡por supuesto!
Task 1: Generación de código
Ejemplo: Importación / Exportación de datos
Estrategias de composición del prompt:
- Especifica el lenguaje de programación (por ejemplo, Python).
- Indica el formato de archivo (CSV/JSON….) y la estructura de datos deseada.
- Proporciona ejemplos de datos o describe la disposición de los datos [opcional pero recomendado si la estructura es compleja].
Task 2: Generación de código
Ejemplo: Solicitud de implementación de una funcionalidad
Estrategia de composición del prompt:
- Especifica el lenguaje de programación (por ejemplo, Python).
- Especifica el formato de archivo (CSV/JSON….) y la estructura de datos, si se dispone de un conjunto de datos.
- Detalla sin ambigüedades la funcionalidad que debe implementarse.
- Da ejemplos de las propiedades y/o la forma del resultado deseado.
Task 3: Creación de datos resumidos
Ejemplo: Creación de un conjunto de datos de muestra que respete determinadas características
Estrategia de composición del prompt:
- Especifica el dominio de aplicación
- Indica el formato y la estructura de datos deseados (para la estructura tabular, especifica: número de columnas, encabezado, tipo de datos, rango de valores… y define lo que representan).
- Pide a ChatGPT que te proporcione una serie de preguntas a las que responder para caracterizar mejor el contexto.
- Da ejemplos de datos o describir la disposición de los datos [opcional pero recomendado si la estructura es compleja]
Supongamos que está trabajando en el desarrollo de un proyecto con fines de demostración, un caso de uso, para proponerlo a clientes potenciales, pero no dispone de un conjunto de datos apropiado. Si nos interesa generar un número modesto de valores, en su mayoría de naturaleza categórica (no numérica) y con bastante variabilidad, sin duda podemos utilizar ChatGPT para crear un dataset resumido. En el ejemplo siguiente, se establecerá el dominio de aplicación, después se pedirá a ChatGPT que formule una serie de preguntas que considere útiles para comprender mejor nuestra consulta, task y, por último, el conjunto de datos sintético.
Contexto y tarea definidos con la técnica Ask Before Answer. La interacción comienza con la delimitación del contexto de la aplicación y continúa con la indicación de la tarea que debe realizarse, seguida de una petición explícita de que se formulen preguntas adecuadas para aumentar la precisión de la respuesta y, por tanto, tales que guíen al usuario a la hora de especificar todos los detalles pertinentes. A continuación se presentan algunas de las preguntas planteadas por ChatGPT y que constituyen, como podemos adivinar, el corazón de esta estrategia de prompting, capaz de guiar incluso a los usuarios menos expertos en la formulación completa de la solicitud antes de que ésta sea asumida por el modelo.
A continuación se muestra una posible respuesta.
El texto generado puede ahora copiarse y pegarse en un editor de texto y guardarse como CSV, listo para ser utilizado como conjunto de datos de muestra, enriqueciéndolo quizás con una columna para la fecha.
Y añadiendo algunas visualizaciones.
Conclusiones
Hemos descubierto cómo ChatGPT puede revolucionar el Análisis de Datos, destacando la importancia de las estrategias de prompting para lograr resultados precisos, por ejemplo, en la generación de código y la creación de conjuntos de datos sintéticos.
No te pierdas el próximo episodio, en el que exploraremos otras aplicaciones útiles de ChatGPT en el Análisis de Datos, desde el análisis exploratorio (EDA) hasta la documentación.
Lee todos nuestros artículos sobre Data Science
¿Quiere conocer las últimas novedades sobre Fivetran y las nuevas tecnologías de data science?
Visualitics Team
Este artículo ha sido escrito y editado por uno de nuestros consultores
Fuente:
[1] www.trends.google.com
[2] www.trends.google.com
[3] www.trends.google.com
Compártelo ahora en tus redes sociales o por correo electrónico: