В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
В статистике бенчмаркинг — это метод использования вспомогательной информации для корректировки весов выборки, используемых в процессе оценки , с целью получения более точных оценок итоговых показателей.
Предположим, у нас есть совокупность , где каждая единица имеет связанную с ней «стоимость» . Например, это может быть заработная плата работника или стоимость товара . Предположим, мы хотим оценить сумму всех . Поэтому мы берем выборку из , получаем вес выборки W ( k ) для всех выбранных , а затем суммируем для всех выбранных .
Одно свойство, обычно общее для весов, описанных здесь, заключается в том, что если мы суммируем их по всем выбранным , то эта сумма является оценкой общего числа единиц в популяции (например, общей занятости или общего числа элементов). Поскольку у нас есть выборка, эта оценка общего числа единиц в популяции будет отличаться от истинной общей численности популяции. Аналогично, оценка общей численности (где мы суммируем по всем выбранным ) также будет отличаться от истинной общей численности популяции.
Мы не знаем, какова истинная общая стоимость населения (если бы мы знали, не было бы смысла в выборке!). Тем не менее, часто мы знаем, какова сумма по всем единицам в популяции. Например, мы можем не знать общие доходы населения или общие расходы населения, но часто мы знаем общую занятость или общий объем продаж. И даже если мы не знаем их точно, часто существуют обследования, проведенные другими организациями или в более раннее время, с очень точными оценками этих вспомогательных величин. Одной из важных функций переписи населения является предоставление данных, которые можно использовать для сравнительного анализа более мелких обследований.
Процедура бенчмаркинга начинается с того, что сначала популяция разбивается на ячейки бенчмаркинга. Ячейки формируются путем группировки единиц, которые имеют общие характеристики, например, похожие , но можно использовать все, что повышает точность окончательных оценок. Для каждой ячейки мы позволяем быть суммой всех , где сумма берется по всем выбранным в ячейке . Для каждой ячейки мы позволяем быть вспомогательным значением для ячейки , которое обычно называется «целевым показателем бенчмарка» для ячейки . Затем мы вычисляем фактор бенчмарка . Затем мы корректируем все веса, умножая его на фактор бенчмарка , для ее ячейки . Конечный результат заключается в том, что оцененное [сформированное путем суммирования ] теперь будет равно общему целевому показателю бенчмарка . Но более важным преимуществом является то, что оценка общего [сформированного путем суммирования ] будет иметь тенденцию быть более точной.
Бенчмаркинг иногда называют «постстратификацией» из-за его сходства со стратифицированной выборкой . Разница между ними заключается в том, что при стратифицированной выборке мы заранее решаем, сколько единиц будет отобрано из каждой страты (эквивалентно ячейкам бенчмаркинга); при бенчмаркинге мы выбираем единицы из более широкой совокупности, а число, выбранное из каждой ячейки, является делом случая.
Преимущество стратифицированной выборки заключается в том, что количество выборок в каждой страте можно контролировать для получения желаемых результатов точности. Без этого контроля мы можем получить слишком много выборки в одной страте и недостаточно в другой — действительно, возможно, что выборка не будет содержать членов из определенной ячейки, в этом случае бенчмаркинг не удастся, поскольку , что приведет к проблеме деления на ноль. В таких случаях необходимо «свернуть» ячейки вместе, чтобы каждая оставшаяся ячейка имела адекватный размер выборки.
По этой причине бенчмаркинг обычно используется в ситуациях, когда стратифицированная выборка нецелесообразна. Например, при выборе людей из телефонного справочника мы не можем сказать, сколько им лет, поэтому мы не можем легко стратифицировать выборку по возрасту. Однако мы можем собрать эту информацию от людей, включенных в выборку, что позволяет нам проводить бенчмаркинг с демографической информацией.