Смещение из-за самоотбора
Смеще́ние из-за самоотбо́ра (англ. self-selection bias), понятие, используемое в статистике и эконометрике для характеристики ситуации, в которой объекты самостоятельно отбираются в группы или же вероятность попадания их в группу зависит от каких-либо индивидуальных характеристик. В результате не достигается надлежащая рандомизация (случайность), что не позволяет гарантировать репрезентативность выборки, предназначенной для статистического анализа. Нерепрезентативность выборки влияет на статистическую значимость тестов и приводит к смещению оценок параметров статистической модели. Таким образом, игнорирование смещения из-за самоотбора может приводить к ложным выводам, полученным на основе таких исследований. Смещение из-за самоотбора является одной из разновидностей систематической ошибки отбора (англ. selection bias, sample selection bias).
Смещение из-за самоотбора является серьёзной проблемой в исследованиях в области социологии, психологии, экономики и других социальных наук. В частности, данная проблема возникает в исследованиях по заработным платам. Агенты самостоятельно принимают решение о выходе на рынок труда, которое обусловлено рядом факторов: уровнем образования, социальным статусом, семейным положением, количеством детей, доходом домохозяйства. В результате исследователь наблюдает уровни заработных плат только тех агентов, которые вышли на рынок труда.
Проблема смещения из-за самоотбора была впервые обнаружена британским экономистом Э. Д. Роем (1920–2003) в 1951 г. В 1970-е гг. проблема преимущественно рассматривалась применительно к эконометрике, в этот же период были разработаны методы получения оценок, учитывающих смещение из-за самоотбора, например модель Хекмана.