Large Language Models - HanjieChen/Reading-List GitHub Wiki

Misc

RLHF

The PRISM Alignment Project: What Participatory, Representative and Individualised Human Feedback Reveals About the Subjective and Multicultural Alignment of Large Language Models
Pretraining Language Models with Human Preferences
Training language models to follow instructions with human feedback
Pinpoint, Not Criticize: Refining Large Language Models via Fine-Grained Actionable Feedback

Efficiency

Agents

Challenges and Open Questions

Evaluation

Long-horizon

Trustworthiness

Editing

Safety/Privacy

Instructional Fingerprinting of Large Language Models

Psychology and Personalization