GPT-4 hace que ChatGPT sea más inteligente, pero no solucionará sus defectos

Con su extraña capacidad de mantener una conversación, responder preguntas y escribir prosa, poesía y código coherentes, el chatbot ChatGPT ha obligado a muchas personas a repensar el potencial de la inteligencia artificial.

La startup que creó ChatGPT, OpenAI, anunció recientemente una nueva versión muy esperada del modelo de IA en su núcleo.

El nuevo algoritmo, conocido como GPT-4, que precede a GPT-3, un modelo innovador de generación de texto que OpenAI anunciado en 2020, que luego se adaptó para crear ChatGPT el año pasado.

El nuevo modelo obtiene una puntuación más alta en una variedad de pruebas diseñadas para medir la inteligencia y el conocimiento en humanos y máquinas, informa OpenAI. También comete menos errores y puede responder tanto a imágenes como a texto.

Sin embargo, GPT-4 tiene los mismos problemas que han afectado a ChatGPT y hacen que algunos expertos en IA se muestren escépticos sobre su utilidad, incluidas las tendencias a «alucinar» con información incorrecta, mostrar sesgos sociales problemáticos y comportarse mal o asumir personajes perturbadores cuando se les da una » antagónico”.

OpenAI mostró varias demostraciones y datos de pruebas comparativas para mostrar las capacidades de GPT-4 y muestra un rendimiento superior a nivel humano en varios exámenes y pruebas diseñados para personas, como un examen simulado de derecho.

ChatGPT

También obtiene una puntuación más alta que GPT-3 en otros informes diseñados para evaluar el conocimiento y el razonamiento, en materias que incluyen biología, historia del arte y cálculo. Y obtiene mejores calificaciones que cualquier otro modelo de lenguaje de IA en las pruebas diseñadas por científicos informáticos para medir el progreso en dichos algoritmos.

GPT-4 también puede realizar ingeniosos trucos vistos anteriormente en GPT-3 y ChatGPT, como resumir y sugerir modificaciones en fragmentos de texto.

También puede hacer cosas que sus predecesores no pudieron, incluso actuar como un tutor que ayuda a guiar a los estudiantes hacia las respuestas correctas y discute el contenido de las fotografías.

Por ejemplo, si se proporciona una foto de los ingredientes en la encimera de la cocina, GPT-4 puede sugerir una receta adecuada. Si se proporciona con un gráfico, puede explicar las conclusiones que se pueden extraer de él.

ChatGPT llamó la atención del público con una asombrosa capacidad para abordar muchas preguntas y tareas complejas a través de una interfaz conversacional fácil de usar. El chatbot no entiende el mundo como lo hacen los humanos y solo responde con palabras que estadísticamente predice que deben seguir a una pregunta.

Pero ese mecanismo subyacente también significa que ChatGPT y sistemas similares a menudo inventan hechos. Y a pesar de los esfuerzos de OpenAI para hacer que el modelo sea resistente al abuso, se puede incitar a que se comporte mal, por ejemplo, sugiriéndole que haga un juego de roles que se niega a hacer cuando se le pregunta directamente.

OpenAI afirma que GPT-4 tiene un 40 por ciento más de probabilidades de proporcionar «respuestas fácticas» e indican que GPT-4 tiene un 82 por ciento menos de probabilidades de responder a solicitudes que deberían rechazarse. La compañía no detalló con qué frecuencia la versión anterior, GPT-3, proporciona respuestas objetivamente incorrectas o responde a solicitudes que debería rechazar.

El furor en torno a esta inteligencia artificial también ha avivado el interés en la construcción de nuevas empresas o el uso de tecnología de inteligencia artificial similar y ha pillado a algunas empresas de imprevisto.

Google, que ha pasado años invirtiendo en investigación de IA y que inventó algunos de los algoritmos clave utilizados para construir GPT y ChatGPT, está trabajando de manera intensa por ponerse al día. El trabajo de investigación de OpenAI sobre GPT-4 revela pocos detalles de cómo se construyó GPT-4 o cómo funciona, citando la competencia en torno a estas nuevas herramientas de IA, así como los riesgos que plantean.

Las capacidades de ChatGPT y programas de IA similares han suscitado un debate sobre cómo la IA puede automatizar o revolucionar algunos trabajos de oficina. Las iteraciones más avanzadas pueden ser capaces de adquirir nuevas habilidades.

Aunque por el momento hay que recordar que es solo un chatbot y aún queda mucho tiempo para que podamos verlo controlando una central nuclear o realizar algún tipo de trabajo que pueda conllevar algún riesgo.

Te puede interesar