Do Personality Traits Interfere? Geometric Limitations of Steering in Large Language Models

Pranav Bhandari; Usman Naseem; Mehwish Nasim

Do Personality Traits Interfere? Geometric Limitations of Steering in Large Language Models

Pranav Bhandari, Usman Naseem, Mehwish Nasim

Abstract

Personality steering in large language models (LLMs) commonly relies on injecting trait-specific steering vectors, implicitly assuming that personality traits can be controlled independently. In this work, we examine whether this assumption holds by analysing the geometric relationships between Big Five personality steering directions. We study steering vectors extracted from two model families (LLaMA-3-8B and Mistral-8B) and apply a range of geometric conditioning schemes, from unconstrained directions to soft and hard orthonormalisation. Our results show that personality steering directions exhibit substantial geometric dependence: steering one trait consistently induces changes in others, even when linear overlap is explicitly removed. While hard orthonormalisation enforces geometric independence, it does not eliminate cross-trait behavioural effects and can reduce steering strength. These findings suggest that personality traits in LLMs occupy a slightly coupled subspace, limiting fully independent trait control.

Anthology ID:: 2026.findings-acl.1463
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 29284–29293
Language:
URL:: https://aclanthology.org/2026.findings-acl.1463/
DOI:
Bibkey:
Cite (ACL):: Pranav Bhandari, Usman Naseem, and Mehwish Nasim. 2026. Do Personality Traits Interfere? Geometric Limitations of Steering in Large Language Models. In Findings of the Association for Computational Linguistics: ACL 2026, pages 29284–29293, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Do Personality Traits Interfere? Geometric Limitations of Steering in Large Language Models (Bhandari et al., Findings 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.findings-acl.1463.pdf
Checklist:: 2026.findings-acl.1463.checklist.pdf

PDF Cite Search Checklist Fix data