Vamos a ver cómo sacar el máximo partido a los modelos de lenguaje generativo, específicamente a GPT (Generative Pretrained Transformer) de OpenAI.
Si te interesa la inteligencia artificial, y quieres aprender a ponerla de tu lado, este post es para ti.
¿Qué es GPT?
GPT es un modelo de lenguaje generativo desarrollado por OpenAI. Es capaz de generar texto que es sorprendentemente coherente y relevante para una amplia gama de tareas. Pero, como cualquier herramienta, hay formas de usarla que pueden mejorar los resultados que obtenemos.
Estrategias para Mejorar los Resultados con GPT
Aquí te presento seis estrategias que puedes usar para obtener mejores resultados de GPT:
- Escribe instrucciones claras: GPT aun no puede leer tu mente. Si las respuestas son demasiado largas, pide respuestas breves. Si son demasiado simples, solicita escritura a nivel de experto. Cuanto menos tenga que adivinar GPT lo que quieres, más probable será que lo obtengas sea lo que buscas. En este punto es importante resaltar que ser explícito puede reducir bastante las alucinaciones de estos sistemas, que es uno de sus mayores problemas.
- Proporciona texto de referencia: GPT puede inventar respuestas falsas con una confianza impresionante, especialmente cuando se le pregunta sobre temas esotéricos o se le piden citas y URLs. Proporcionar un texto de referencia a GPT puede ayudar a responder con menos alucinaciones.
- Divide las tareas complejas en subtareas más simples: Al igual que en Ingeniería de Software es una buena práctica descomponer un sistema complejo en un conjunto de componentes modulares, igualmente lo es para las tareas enviadas a GPT. Las tareas complejas tienden a tener tasas de error más altas que las tareas más simples.
- Dale tiempo para “pensar”: Si se le pide a GPT que multiplique 17 por 28, es posible que no lo sepa de inmediato, pero aún puede trabajar para obtener una respuesta. Pedir una cadena de razonamiento antes de una respuesta puede ayudar a GPT a razonar su camino hacia respuestas correctas de manera más confiable.
- Utiliza herramientas externas: Compensa las debilidades de GPT alimentándolo con las salidas de otras herramientas. Por ejemplo, un sistema de recuperación de texto puede informar a GPT sobre documentos relevantes. Un motor de ejecución de código puede ayudar a GPT a hacer matemáticas y ejecutar código.
- Prueba los cambios de manera sistemática: Mejorar el rendimiento es más fácil si puedes medirlo. En algunos casos, una modificación a un prompt puede lograr un mejor rendimiento en algunos ejemplos aislados pero conducir a un rendimiento general peor en un conjunto de ejemplos más representativo.
Tácticas para Mejorar los Resultados con GPT
Cada una de las estrategias mencionadas anteriormente puede ser implementada con tácticas específicas. Estas tácticas están destinadas a proporcionar ideas para cosas que puedes probar. No son de ninguna manera completamente exhaustivas, y deberías sentirte libre de probar ideas creativas no representadas aquí.
Escribe Instrucciones Claras
Táctica: Incluye detalles en tu consulta para obtener respuestas más relevantes
Para obtener una respuesta altamente relevante, asegúrate de que las solicitudes proporcionen cualquier detalle o contexto importante. De lo contrario, estás dejándole al modelo adivinar lo que quieres decir.
Táctica: Pide al modelo que adopte una personalidad
El mensaje del sistema puede utilizarse para especificar la personalidad que el modelo debe adoptar en sus respuestas. Por ejemplo, puedes pedirle al modelo que incluya al menos un chiste o comentario con un tono específico en cada párrafo.
Táctica: Indícale de forma explícita que no quieres que se invente cosas si no las sabe
Simple y llanamente dile explícitamente algo como ‘Si no sabes la respuesta, dime ‘No lo se’, pero no te inventes una respuesta. Esta obviedad reduce significativamente el porcentaje de alucinación por parte del sistema.
Proporciona texto de referencia
Táctica: Instruye al modelo para responder utilizando un texto de referencia
Si podemos proporcionar al modelo información confiable que sea relevante para la consulta actual, entonces podemos instruir al modelo para que utilice la información proporcionada para componer su respuesta.
Divide las tareas complejas en subtareas más simples
Táctica: Usa la clasificación de intenciones para identificar las instrucciones más relevantes para una consulta de usuario
Para tareas en las que se necesitan muchos conjuntos independientes de instrucciones para manejar diferentes casos, puede ser beneficioso clasificar primero el tipo de consulta y usar esa clasificación para determinar qué instrucciones son necesarias.
Dale Tiempo a GPT para “Pensar”
Táctica: Instruye al modelo para que elabore su propia solución antes de apresurarse a una conclusión
A veces obtenemos mejores resultados cuando instruimos explícitamente al modelo para que razone a partir de principios básicos antes de llegar a una conclusión.
Utiliza Herramientas Externas
Táctica: Usa la búsqueda basada en incrustaciones para implementar la recuperación eficiente de conocimientos
Un modelo puede aprovechar fuentes externas de información si proporcionamos una forma de buscar dinámicamente información relevante para la pregunta que se está haciendo.
Prueba los Cambios de Manera Sistemática
Táctica: Evalúa las salidas del modelo con referencia a respuestas estándar de oro
Mejorar el rendimiento es sólo posible si puedes medirlo. Por lo tanto, para estar seguro de que un cambio es netamente positivo para el rendimiento, puede ser necesario definir un conjunto de pruebas exhaustivo.
Recuerda, el aprendizaje es un viaje, no un destino. Así que sigue explorando, sigue preguntando, sigue aprendiendo. Y mientras lo haces, no olvides disfrutar del viaje. Nos vemos en el próximo post, donde seguiremos explorando juntos las maravillas y los desafíos de la Tecnología. ¡Hasta la próxima!