GitHub - datos-Fundar/sesgos_LLM: ¿Cómo “se equivocan” los modelos LLM?

Este repositorio forma parte del documento de trabajo Sesgos algorítmicos y representación social en los modelos de lenguaje generativo (LLM) publicado por el equipo de Datos de Fundar. Este artículo se fundamenta en los hallazgos presentes en este artículo publicado por la Universidad de Stanford que utilizó el conjunto de datos OpinionQA y la metodología para evaluar Modelos de Lenguaje (LMs) mediante encuestas de opinión pública.

Aplicamos un enfoque similar para explorar cómo los LMs reflejan y se alinean con las opiniones de diversos grupos demográficos en el contexto argentino. A partir de preguntas adaptadas de encuestas de Latinobarómetro, abordamos temas relevantes para el panorama sociopolítico argentino y analizamos el alineamiento de las respuestas de los LMs con diferentes segmentos de la población. Nuestro objetivo fue revelar posibles sesgos y discrepancias, proporcionando una comprensión matizada de cómo estos modelos interpretan opiniones en el contexto específico de Argentina.

El propósito de este repositorio es permitir a cualquier persona replicar el trabajo realizado.

Note

Desde el día en que se realizó este trabajo hasta la fecha, las interfaces, las APIs, y los modelos pudieron haber cambiado. Por ende, los resultados pueden variar o ser filtrados de una manera que no está considerada en este estudio.

Organización del proyecto:

En datasets se encuentran los datos de Latinobarómetro utilizados para promptear a los modelos y evaluar las respuestas.

En outputs se encuentran los resultados de los distintos scripts y notebooks. (A destacar, los gráficos generados y las respuestas consolidadas de cada modelo).

El análisis está repartido entre las Jupyter Notebooks y los scripts. En particular:

bard.ipynb, chatgpt.ipynb, y cohere.ipynb contienen las notebooks donde se promptean a los correspondientes modelos con las preguntas seleccionadas.
Las notebooks distances_ contienen el cálculo de las distancias de opinión correspondientes a cada modelo.
En scripts/ se realizan los modelos de regresión lineal ajustados a través de OLS para el análisis multivariado. Cada script analiza un subset diferente de datos.
En etc/ hay Jupyter Notebooks que contienen un analisis exploratorio de los datasets.

Este documento es parte de la serie Inteligencia Artificial

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
datasets		datasets
etc		etc
outputs		outputs
scripts		scripts
.gitignore		.gitignore
LICENCE		LICENCE
README.md		README.md
bard.ipynb		bard.ipynb
chatgpt.ipynb		chatgpt.ipynb
cohere.ipynb		cohere.ipynb
correlations.ipynb		correlations.ipynb
distance_bard.ipynb		distance_bard.ipynb
distances_cohere.ipynb		distances_cohere.ipynb
distances_gpt.ipynb		distances_gpt.ipynb
distances_latin.ipynb		distances_latin.ipynb
distances_lpop.ipynb		distances_lpop.ipynb
utils.py		utils.py

License

datos-Fundar/sesgos_LLM

Folders and files

Latest commit

History

Repository files navigation

Organización del proyecto:

About

Topics

Resources

License

Stars

Watchers

Forks

Languages