Факторизованная языковая модель ( FLM ) является расширением традиционной языковой модели, представленной Джеффом Билмесом и Катрин Кирхгоф в 2003 году. В FLM каждое слово рассматривается как вектор из k факторов: FLM предоставляет вероятностную модель , в которой предсказание фактора основано на родителях . Например, если представляет токен слова и представляет тег части речи для английского языка, выражение дает модель для предсказания текущего токена слова на основе традиционной модели Ngram , а также тега части речи предыдущего слова.
Основным преимуществом факторизованных языковых моделей является то, что они позволяют пользователям указывать лингвистические знания, такие как связь между словосочетаниями и частями речи в английском языке или морфологическую информацию (основы, корни и т. д.) в арабском языке.
Как и модели N-грамм , методы сглаживания необходимы при оценке параметров. В частности, обобщенный откат используется при обучении FLM.