Модели цензурированной регрессии — это класс моделей , в которых зависимая переменная цензурируется выше или ниже определенного порога. Обычно используемая модель на основе правдоподобия для адаптации к цензурированной выборке — это модель Тобита , [1] но также были разработаны квантильные и непараметрические оценщики . [2] [3] Эти и другие модели цензурированной регрессии часто путают с моделями усеченной регрессии . Модели усеченной регрессии используются для данных, в которых отсутствуют целые наблюдения, так что значения зависимой и независимой переменных неизвестны. Модели цензурированной регрессии используются для данных, в которых неизвестно только значение зависимой переменной, а значения независимых переменных по-прежнему доступны.
Цензурированные зависимые переменные часто возникают в эконометрике . Типичным примером является предложение труда . Данные о часах, отработанных работниками, часто доступны, а модель предложения труда оценивает связь между отработанными часами и характеристиками работников, такими как возраст, образование и семейное положение. Однако такие оценки, выполненные с использованием линейной регрессии, будут смещены из-за того, что для людей, которые не работают, невозможно наблюдать количество часов, которые они бы отработали, если бы имели работу. Тем не менее, мы знаем возраст, образование и семейное положение для этих наблюдений.