16 abr. 2025

ChatGPT no conoce el 20% del léxico español y en el 80% restante comete errores

Desde que llegó al mercado hace un año, ChatGPT, una inteligencia artificial capaz de crear contenidos originales y tareas relacionadas con la lengua, se ha convertido en una herramienta de enorme popularidad. Ahora, un estudio señala que desconoce el 20% del léxico español y que comete errores en el 80% restante.

ChatGPT_42880560.png

ChatGPT no conoce el 20% del léxico español y en el 80% restante comete errores

Según datos de OpenAI —la empresa que creadora—, cada semana, cien millones de personas usan este chatbot para hacer tareas relacionadas con el lenguaje.

Pero aunque esta herramienta está entrenada para mantener conversaciones y generar textos, se sabe que puede producir respuestas que parecen plausibles, pero que son completamente erróneas.

Para evaluar el rendimiento de ChatGPT y su capacidad real, un equipo de investigadores españoles ha desarrollado una aplicación, denominada ChatWord, que permite evaluar el conocimiento léxico de ChatGPT en varios idiomas.

Para ello, se usó como referencia las palabras recogidas en el diccionario de la Real Academia de la Lengua y las que aparecen en El Quijote de Miguel de Cervantes.

Lea más: Usuarios de Google Meet podrán pedir a la IA que les sustituya en sus reuniones virtuales

El estudio reveló que de las más de 90.000 palabras incluidas en el diccionario de la Real Academia de la Lengua, el modelo ChatGPT3.5turbo desconoce aproximadamente el 20%, es decir, unas 18.000 palabras.

Además, del 80% restante de las palabras del diccionario y del 90% de las palabras del Quijote, ChatGPT cometió errores en cerca del 5% de los términos.

Un conocimiento muy pobre

El estudio recuerda que un hispanohablante reconoce 30.000 palabras de media, es decir, casi un tercio del léxico español, un dato que puede parecer pobre comparado al de una máquina, advierten los autores.

Pero, “como pasa muchas veces con los sistemas de inteligencia artificial, no es oro todo lo que reluce, y al analizar los significados que da ChatGPT de las palabras, vemos que hay un porcentaje no despreciable en que el sentido que señala es incorrecto”, explica Javier Conde, coautor del trabajo.

“Quizás ChatGPT no sea hoy en día tan sabio como aparenta”, añade.

Además, el estudio recuerda que los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés), basados en inteligencia artificial y diseñados para procesar y comprender lenguaje natural en una escala enorme —como ChatGPT— no usan palabras que no conocen.

Recibí las noticias en tu celular: Canal de WhatsApp Última Hora

Pero para Pedro Reviriego, también coautor de la investigación, el dato es preocupante porque si estos sistemas solo usan las palabras que conocen, resulta “muy factible un escenario en que el contenido recién generado tenga un número cada vez menor de palabras distintas”, y de escasa riqueza léxica, avisa.

La aplicación ChatWords es un sistema de acceso público, diseñada para ser fácil de usar y ampliar.

Los investigadores quieren evaluar otros idiomas y LLM para comprender mejor el conocimiento léxico que tienen las herramientas de inteligencia artificial y cómo evoluciona a medida que aparecen nuevas versiones y herramientas.

Fuente: EFE

Más contenido de esta sección
El Gobierno de Estados Unidos planea cerrar casi 30 embajadas y consulados en diversos países, entre ellos, muchos europeos como Malta o Francia, según documentos internos del Departamento de Estado a los que ha tenido acceso la cadena CNN.
La ex primera dama peruana, Nadine Heredia, esposa del ex presidente Ollanta Humala, ingresó este martes en la Embajada de Brasil en Lima y solicitó asilo a ese país, horas después de ser condenada a 15 años de prisión por lavado de activos al recibir aportes de Odebrecht para las campañas de su marido en 2006 y 2011, informó la Cancillería de la nación andina.
Dalma Maradona, una de las hijas de Diego Armando Maradona, declaró este martes por primera vez en el juicio contra siete profesionales de la salud por la muerte del ídolo argentino, y apuntó contra el equipo médico a cargo de los cuidados de su padre y reveló que la vivienda en la que falleció estaba en malas condiciones, tenía “olor a pis” y “era un asco”.
Mark Zuckerberg ha vuelto este martes a los tribunales de Washington, EEUU, en la segunda jornada del juicio contra su compañía Meta, la matriz de Facebook acusada de comprar Instagram y WhatsApp para ahogar a posibles competidores.
La presencia del papa en los ritos de la Semana Santa seguirá siendo una incógnita y por el momento delegó en dos cardenales el oficio de las misas del Jueves y Viernes Santo, además del vía crucis en el Coliseo, para el que Francisco ha escrito las meditaciones que se leerán en el anfiteatro romano.
Los palestinos muertos en ataques israelíes en Gaza desde que comenzó la guerra llegaron este martes hasta los 51.000, después de que el Ministerio de Sanidad del Gobierno de Hamás en la Franja registrara la muerte a lo largo del lunes de 17 personas a causa de la ofensiva, que se extiende ya más de año y medio.