Множественное вменение для обработки отсутствующих данных о результатах при оценке относительного риска

Множественное вменение - популярный подход к обработке недостающих данных в медицинских исследованиях, но мало что известно о его применимости для оценки относительного риска. Стандартные методы для вменения неполных двоичных результатов включают логистическую регрессию или предположение о многомерной нормальности, тогда как относительные риски обычно оцениваются с использованием логарифмических биномиальных моделей. Неясно, может ли неправильное указание модели вменения в этой настройке привести к смещению оценок параметров.

Методы

Используя смоделированные данные, мы оценили эффективность множественного вменения для обработки недостающих данных до оценки скорректированных относительных рисков на основе правильно указанной многомерной биномиальной логарифмической модели. Мы рассмотрели произвольный образец пропущенных данных как в переменных исхода, так и в переменных воздействия, при этом отсутствующие данные были вызваны отсутствием случайных механизмов. Сосредоточившись на стандартных методах множественного вменения на основе моделей, отсутствующие данные были вменены с использованием многомерного нормального вменения или полностью условной спецификации с логистической моделью вменения для результата.

Результаты

Многофакторное нормальное вменение плохо работало в моделировании исследования, постоянно давая оценки относительного риска, которые были смещены в сторону нуля. Несмотря на превосходство по эффективности многомерного нормального вменения, полностью условная спецификация также дает несколько смещенные оценки, причем большее смещение наблюдается для более высоких значений распространенности исходов и более высоких относительных рисков. Удаление вмененных результатов из наборов данных анализа не улучшило производительность полностью условной спецификации.

Выводы

Как многомерное нормальное вменение, так и полностью условная спецификация дали смещенные оценки относительного риска, предположительно из-за того, что оба используют неверно заданную модель вменения. Основываясь на результатах моделирования, мы рекомендуем исследователям использовать полностью условную спецификацию вместо многомерного нормального вменения и сохранять вмененные результаты в анализе при оценке относительных рисков. Однако полностью условная спецификация не лишена недостатков, поэтому необходимы дальнейшие исследования для определения оптимальных подходов к оценке относительного риска в рамках системы множественного вменения.

Задний план

Относительный риск - это суммарная мера эффекта для бинарных исходов, которая часто представляет интерес в медицинских исследованиях [1,2,3,4]. В отличие от отношения шансов, относительный риск прост для интерпретации и коллапсируем по ковариатным стратам [5]. Для редких исходов относительные риски можно оценить с помощью моделей логистической регрессии, поскольку в этом случае отношение шансов приблизительно соответствует относительному риску [4]. Для более общих результатов отношение шансов переоценивает относительный риск, поэтому для оценки относительного риска требуются альтернативы логистической регрессии. Стандартный подход к оценке относительного риска напрямую заключается в подборе обобщенной линейной модели с биномиальным распределением ошибок и лог-связью, известной как лог-биномиальная модель [6, 7]. Поскольку лог-связь допускает предсказанные вероятности больше единицы, проблемы сходимости с этой моделью не редкость,особенно для моделей, содержащих непрерывные ковариаты или исходы с высокой распространенностью [6, 7]. Было предложено несколько альтернативных подходов к оценке относительного риска для решения проблемы неудачной сходимости с лог-биномиальной моделью, с модифицированной регрессией Пуассона с использованием лог-связи и устойчивой дисперсией ошибок [8] одним из наиболее часто используемых методов.

Общей чертой эпидемиологических расследований является отсутствие данных, что может привести к смещенным и неэффективным оценкам параметров при неправильной обработке во время статистического анализа. Среди более строгих подходов к обработке недостающих данных широко применяется метод множественного вменения (MI) [9] благодаря его гибкости и доступности в статистических программных пакетах [10]. MI включает подгонку статистической модели к наблюдаемым данным для оценки значений недостающих данных. Чтобы учесть неопределенность отсутствующих данных, для каждого отсутствующего наблюдения вменяется несколько значений, в результате чего получается несколько полных наборов данных. После анализа оценки параметров из нескольких наборов данных соответствующим образом объединяются для получения единой оценки MI. Стандартные реализации MI предполагают, что данные отсутствуют случайно (MAR),что происходит, когда вероятность пропуска данных зависит только от наблюдаемых данных [11]. При условии соблюдения этого предположения и правильного определения статистических моделей, используемых для вменения и анализа, MI дает согласованные и асимптотически эффективные оценки параметров [9].

Для произвольных шаблонов отсутствующих данных (т. Е. Отсутствующие данные, встречающиеся в любой переменной, в любом шаблоне для переменных), два стандартных основанных на модели метода MI представляют собой полностью условную спецификацию (FCS) [12,13,14], также известную как цепочка уравнения и многомерное нормальное вменение (MVNI) [15]. FCS включает определение серии одномерных моделей вменения, по одной для каждой переменной с отсутствующими данными. Стандартное программное обеспечение использует логистическую регрессию для вменения неполных двоичных результатов, которая предполагает линейную зависимость между логарифмическими шансами риска и другими переменными в модели вменения. Неполные коварианты аналогичным образом могут быть рассчитаны с использованием соответствующих одномерных моделей (например, линейная регрессия для непрерывных ковариат). Напротив, MVNI предполагает, что все переменные в модели вменения подчиняются многомерному нормальному распределению.Для неполных двоичных результатов также требуется дополнительный этап округления после MVNI для преобразования непрерывных вмененных значений в двоичные значения, пригодные для анализа [16]. Хотя FCS и MVNI оценивались в условиях, когда целью является оценка отношения шансов с использованием логистической регрессии [12, 16, 17], мало что известно об их эффективности, когда целью является оценка относительного риска. Важно отметить, что неясно, может ли условное исчисление результатов с использованием логистической регрессии в FCS или при многомерном нормальном предположении в MVNI привести к смещенной или неэффективной оценке, когда анализ включает лог-биномиальную модель.Хотя FCS и MVNI оценивались в условиях, когда целью является оценка отношения шансов с использованием логистической регрессии [12, 16, 17], мало что известно об их эффективности, когда целью является оценка относительного риска. Важно отметить, что неясно, может ли условное исчисление результатов с использованием логистической регрессии в FCS или при многомерном нормальном предположении в MVNI привести к смещенной или неэффективной оценке, когда анализ включает лог-биномиальную модель.Хотя FCS и MVNI оценивались в условиях, когда целью является оценка отношения шансов с использованием логистической регрессии [12, 16, 17], мало что известно об их эффективности, когда целью является оценка относительного риска. Важно отметить, что неясно, может ли условное исчисление результатов с использованием логистической регрессии в FCS или при многомерном нормальном предположении в MVNI привести к смещенной или неэффективной оценке, когда анализ включает лог-биномиальную модель.

Популярной альтернативой стандартной реализации MI для обработки недостающих данных как в переменных результата, так и в переменных воздействия является подход «множественное вменение, затем удаление» (MID), при котором наблюдения с вмененными результатами исключаются из анализа [18]. Хотя MID не рекомендуется, когда модель вменения содержит вспомогательные переменные для результата (т. Е. Переменные, которые не являются частью анализа, но которые помогают прогнозировать отсутствующие значения результатов) [19], этот подход может предложить небольшой выигрыш в эффективности по сравнению со стандартным MI при вменении. и модели анализа одинаковы. Что касается оценки относительных рисков, то утверждалось, что удаление условно исчисленных результатов до анализа может помочь минимизировать систематическую ошибку, вносимую неверно указанной моделью вменения для результата [18].Если вменение неполных бинарных результатов с использованием FCS или MVNI приведет к смещенной оценке относительного риска, заявленная сила MID может уменьшить это смещение.

Эта статья направлена ​​на (i) оценку эффективности FCS и MVNI для обработки недостающих данных о результатах при оценке относительного риска и (ii) исследование того, улучшает ли удаление условно исчисленных результатов перед анализом производительность FCS и MVNI в этой настройке. Остальная часть статьи изложена следующим образом. В следующем разделе мы более подробно опишем методы FCS и MVNI, обратив внимание на потенциальные ограничения. Далее следует описание методов моделирования, использованных для достижения целей статьи, и краткое изложение результатов моделирования. Наконец, мы завершаем статью обсуждением основных выводов и предоставлением практических рекомендаций.

Методы

Полностью условная спецификация

FCS включает определение серии одномерных моделей вменения, по одной для каждой переменной с отсутствующими данными [12,13,14], с моделями, адаптированными в соответствии с распределением вмененной переменной. Для каждой переменной с отсутствующими данными алгоритм FCS начинает с замены отсутствующих значений случайно выбранными наблюдаемыми значениями или средним значением для той же переменной. Затем генерируются вменения путем оценки каждой одномерной модели по очереди, с ограничением для участников с наблюдаемыми значениями для рассматриваемой переменной и с использованием вмененных значений для других переменных; на каждом этапе отсутствующие значения заменяются результатами их апостериорного прогнозного распределения. Этот процесс продолжается до тех пор, пока все неполные переменные не будут вменены, и повторяется несколько раз для стабилизации результатов, что приводит к созданию единого вмененного набора данных.Дополнительные условно исчисленные наборы данных получаются путем независимого повторения этого процесса.

Несмотря на свою гибкость, FCS не лишена ограничений. Одной из проблем этого подхода является возможность определения одномерных моделей вменения, в которых подразумеваемые условные распределения не соответствуют действительному совместному распределению. Потенциальным следствием этого является то, что результаты могут варьироваться в зависимости от порядка одномерных моделей вменения в рамках процедуры FCS. К счастью, эта проблема, похоже, мало влияет на результаты на практике [12, 13, 17, 20]. Еще один недостаток FCS заключается в том, что его внедрение в настройках, содержащих большое количество неполных переменных, может занять много времени, поскольку для каждой неполной переменной в модели вменения необходимо указывать одномерные модели вменения.

Многомерное нормальное вменение

MVNI - это совместный подход к моделированию вменения, при котором предполагается, что все переменные в модели вменения подчиняются многомерному нормальному распределению. Впервые реализованный Шафер [15], MVNI использует алгоритм Монте-Карло цепи Маркова (известный как увеличение данных) для вменения. Первоначально пропущенные значения рассчитываются на основе предполагаемых начальных значений параметров многомерного нормального распределения. Обычно они получаются из доступных данных с использованием алгоритма максимизации ожидания. Затем обновленные значения параметров для многомерного нормального распределения извлекаются из их апостериорного распределения на основе наблюдаемых и условно рассчитанных данных. Этот итеративный процесс подстановки пропущенных значений и отрисовки обновленных значений параметров продолжается до тех пор, пока эти значения не сойдутся к стационарному распределению [15, 21]. После этих итераций «приработки»берется набор вмененных значений. Чтобы уменьшить зависимость между вмененными значениями, перед получением следующего набора вмененных значений выполняются дополнительные итерации.

Благодаря своей сильной теоретической основе, MVNI является привлекательным методом, когда выполняется многомерная нормальность, но такое предположение не всегда реалистично, особенно когда модель вменения содержит бинарные переменные. Хотя несколько авторов сообщили о хорошей производительности MVNI для бинарных переменных [15, 16, 20, 22], по-прежнему трудно делать глобальные заявления об устойчивости этого подхода к нарушениям многомерной нормальности, будь то в конкретном случае бинарных переменных или в более общем смысле.

Имитационное исследование

Эффективность FCS и MVNI для обработки недостающих данных о результатах при оценке относительного риска оценивалась с помощью моделирования данных. Чтобы приписать любые недостатки в производительности методу MI, а не увлекаться сложностью данных, мы сосредоточились на относительно простых сценариях моделирования. В каждом сценарии моделирования 2000 наборов данных размером n= 1000 были сгенерированы из лог-биномиальной модели log P( Y= 1) = β0 + β1 X1 + β2 X2 , где X1 и X2были бинарными или нормально распределенными переменными воздействия, а Y- бинарным результатом. Относительно большой размер выборки был выбран, чтобы избежать нулевых ячеек в перекрестных таблицах с результатами. После генерации полных наборов данных значения в X2 и Yбыли установлены как отсутствующие в соответствии с указанным механизмом MAR, чтобы создать произвольный образец отсутствующих данных в этих двух переменных. Затем пропущенные значения были многократно вменены с использованием FCS или MVNI с m= 20 вменениями. Для FCS отсутствующие значения в Yбыли вменены с использованием модели логистической регрессии, в то время как вменения для двоичных или нормально распределенных X2были созданы из модели логистической или линейной регрессии соответственно. Для каждого вменения использовалось в общей сложности 20 циклов, причем результат вменялся последним. Для MVNI отсутствующие значения были вменены с использованием алгоритма Монте-Карло цепи Маркова с выдержкой 200 итераций. После вменения с помощью MVNI вмененные значения в результате были округлены до двоичных значений с использованием адаптивного округления, которое было рекомендовано по сравнению с альтернативными методами округления [16]. Наконец, полные наборы данных, сохраняющие или удаляющие условно исчисленные результаты, были проанализированы с использованием логарифмических биномиальных моделей (или модифицированной регрессии Пуассона, если необходимо), с оценками параметров для β1 и β2, объединенных по наборам данных с использованием правил Рубина [9]. Поскольку исход Yбыл сгенерирован в рамках модели анализа, любые недостатки в работе можно отнести к методу МИ. Для справки, полный анализ случая (CCA), ограниченный участниками с полными данными как по Y, таки по X2, также проводился в каждом сценарии моделирования.

Имитационное исследование 1: категориальные воздействия

В имитационном исследовании 1 X1 и X2 были сгенерированы как бинарные переменные с распространенностью 0,50 и относительным риском их связи (RR ( X1 , X2 )) 2 или 3, чтобы вызвать умеренное или сильное смешение, соответственно. При моделировании значений для результата Y, β1 и β2 были установлены равными log (2) или log (3), чтобы дать условные относительные риски (т.е. RR ( Y, X1 | X2 ) и RR ( Y, X2) | X1)) 2 или 3. Наконец, была выбрана точка пересечения β0, чтобы получить общую распространенность результата 0,10 или 0,30. После генерации полных наборов данных значения Yи X2 были установлены как отсутствующие в соответствии с одним из двух механизмов MAR:

Скоординировано: logit P( отсутствует Y) = logit P( отсутствует X2 ) = α+ λX1 .

Напротив: logit P( отсутствует Y) = α+ λX1 , logit P( отсутствует X2 ) = α+ λ(1 - X1 ).

В рамках скоординированного механизма участники с отсутствующими данными часто пропускали Yи X2 , тогда как при противоположном механизме участники с отсутствующими данными имели тенденцию отсутствовать либо Y,либо X2 (но не оба сразу). Для обоих механизмов параметр λбыл установлен на 1 или 2, чтобы указать на умеренный или сильный механизм пропуска данных соответственно, в то время как параметр αбыл выбран для получения 30% недостающих данных в Yи X2.. В совокупности это привело к отсутствию 4 шаблонов данных и 32 сценариям моделирования. После вменения полные наборы данных были проанализированы с использованием лог-биномиальных моделей. При условии, что MVNI применялся с адаптивным округлением для вмененных значений в X2 (в дополнение к Y), в этой настройке не было проблем сходимости с лог-биномиальной моделью.

Имитационное исследование 2: Непрерывное воздействие

Для моделирования 2 исследования X1 и X2 были сгенерированы из двумерного нормального распределения со средним значением 0, дисперсией 0,20 и корреляцией (corr ( X1 , X2 )) 0,30 или 0,70. Снова β1 и β2 были установлены на log (2) или log (3), чтобы получить условные относительные риски 2 или 3, в то время как β0 был выбран, чтобы дать распространенность исхода 0,10 или 0,30. Одной из проблем при моделировании данных в рамках лог-биномиальной модели с неограниченными непрерывными ковариатами является возможность генерирования вероятностей «успеха» больше единицы. При выборе дисперсии для X1 иX2 , мы стремились максимизировать размер стандартизированных условных относительных рисков при минимизации вероятностей недействительных успехов. При дисперсии 0,20 вероятность недействительного успеха была редкой, за исключением ситуаций, в которых преобладание исхода составляло 0,30, а условные относительные риски - 3 (где 5,4% вероятностей успеха превышали единицу). После предыдущих исследований по моделированию относительного риска (например, [23]), X1 и X2 были повторно выбраны в этих случаях, чтобы гарантировать действительные вероятности успеха.

Положив \ ( _1 = _1 / \ sqrt \ left ( _1 \ right)>\) скоординированные и противоположные механизмы отсутствующих данных были адаптированы для непрерывной настройки следующим образом:

Скоординировано: logit P( отсутствует Y) = logit P( отсутствует X2 ) = α+ λZ1 .

Напротив: logit P( отсутствует Y) = α+ λZ1 , logit P( отсутствует X2 ) = α- λZ1 .

В соответствии с модельным исследованием 1, λбыло установлено на 1 или 2, а αбыло выбрано для получения 30% недостающих данных в Yи X2 . Это снова привело к отсутствию 4 шаблонов данных и 32 сценариям моделирования. Поскольку несходимость с лог-биномиальной моделью была значительной проблемой в этой настройке, часто возникающей для некоторых, но не для всех вмененных наборов данных в рамках одного моделирования, мы решили проанализировать все полные наборы данных с использованием модифицированной регрессии Пуассона.

Сравнения

Эффективность подходов МИ при оценке параметров β1 и β2была оценена с точки зрения систематической ошибки (средняя разница между оценкой и истинным значением) и охватом оцененных 95% доверительных интервалов (доля 95% доверительных интервалов, содержащих истинное значение). При 2000 смоделированных наборах данных для каждого сценария моделирования в 95% случаев ожидается, что покрытие будет находиться в диапазоне от 0,94 до 0,96 для истинного покрытия 0,95. Для каждого параметра средняя стандартная ошибка в рамках моделирования (обозначается средней стандартной ошибкой), стандартная ошибка оценок параметров по смоделированным наборам данных (обозначается эмпирической стандартной ошибкой) и среднеквадратичная ошибка (средняя квадратическая разница между оценкой и истинное значение). Все анализы были выполнены в SAS версии 9.4 (SAS Institute, Inc., Кэри, Северная Каролина). Множественное вменение производилось с использованием процедуры MI,в то время как анализ проводился с использованием процедур GENMOD и MIANALYZE. Код SAS для реализации исследования моделирования доступен в Дополнительном файле 1: Веб-приложение.

Результаты

Имитационное исследование 1: категориальные воздействия

В таблице 1 показаны результаты для категориальной настройки воздействия в сценариях с сильным механизмом пропуска данных ( λ= 2), где RR ( X1 , X2 ) = 2 и β1 = β2 = log (3). Аналогичные результаты наблюдались для RR ( X1 , X2 ) = 3, в то время как абсолютные смещения подходов вменения были меньше по величине, когда λ= 1 и β1 = β2.= журнал (2). Полные результаты для всех сценариев моделирования доступны в Дополнительном файле 1: Веб-приложение. MVNI плохо работал в 32 сценариях моделирования, постоянно давая оценки β2, которые были смещены в сторону нуля (диапазон смещения от 0,32 до -0,10). Смещение -0,32, показанное в таблице 1 для распространенности исходов 0,30 при скоординированном механизме, приравнивается к оценке относительного риска 2,19 по сравнению с истинным значением 3; покрытие в этом сценарии составляло всего 0,55. Смещение меньше беспокоило β1 (диапазон смещения от 0,08 до 0,07). Удаление условно исчисленных результатов после MVNI привело к некоторому снижению абсолютного смещения для β2 , хотя оценки для β1были умеренно отклонены от нуля при таком подходе (диапазон смещения от 0,02 до 0,11). Интересно, что средние и эмпирические стандартные ошибки были заметно увеличены при удалении вмененных результатов после MVNI. По сравнению с MVNI (без делеции) MVNI с делецией приводил к небольшому увеличению среднеквадратичной ошибки для β1 , но имел тенденцию к уменьшению среднеквадратичной ошибки для β2 .

В отличие от MVNI, FCS показала довольно хорошие результаты для категориальных воздействий, с абсолютной погрешностью, превышающей только 0,10 для коэффициента β2 в сценариях с сильным скоординированным механизмом, с распространенностью исходов 0,30 и где β1 = β2 = log (3). Исключая сценарии моделирования, в которых смещение для β2 превышало 0,10, охват оцененных 95% доверительных интервалов для β1 и β2 оставался близким к номинальным уровням (диапазон от 0,93 до 0,96). По сравнению с FCS (без делеции) FCS с делецией привел к небольшому снижению абсолютного смещения для β2.при скоординированном механизме распространенности исходов 0,30, но небольшое увеличение абсолютной систематической ошибки при противоположном механизме для распространенности тех же результатов. Между FCS и FCS с делецией была небольшая разница в средних стандартных ошибках, эмпирических стандартных ошибках и среднеквадратических ошибках, хотя оба подхода были менее точными, чем MVNI.

Интересно, что CCA продемонстрировал небольшое смещение в сценариях моделирования, включающих категориальные воздействия, с максимальным абсолютным смещением 0,06 как для β1, так и для β2 . Как и ожидалось, при отбрасывании информации из частично наблюдаемых случаев CCA был заметно менее эффективным, чем подходы MI, особенно для коэффициента β1 для полностью наблюдаемого воздействия X1 .

Имитационное исследование 2: Непрерывное воздействие

Чтобы гарантировать, что любые недостатки в работе в настройке непрерывного воздействия могут быть отнесены к методу MI, а не к использованию модифицированной регрессии Пуассона для оценки относительных рисков, точность этого метода была сначала проверена на полных наборах данных (то есть до значений в Yи X2 были установлены как отсутствующие). Обнадеживает то, что несмещенные оценки для β1 и β2 наблюдались во всех сценариях моделирования (абсолютное смещение ≤0,01), с расчетными 95% -ными доверительными интервалами, демонстрирующими соответствующий охват (т.е. в диапазоне от 0,94 до 0,96) (результаты не показаны).

Дефицит ИМ был более выражен при непрерывном воздействии, чем при категориальном воздействии. В таблице 2 показаны результаты для сценариев с сильным механизмом пропуска данных ( λ= 2), где corr ( X1 , X2 ) = 0,70 и β1 = β2 = log (3). Аналогичная картина результатов наблюдалась и в других сценариях моделирования, хотя абсолютные смещения были меньше по величине для λ= 1 и β1 = β2 = log (2). Как показано в таблице 2, MVNI произвел оценки для β1 и β2.которые были смещены в сторону нуля, причем наибольшая абсолютная погрешность наблюдалась для β1 при противоположном механизме с распространенностью исходов 0,10 (оценка относительного риска 1,68 по сравнению с истинным значением 3). Во всех 32 сценариях моделирования среднее смещение MVNI составляло -0,21 для β1 (диапазон от 0,58 до -0,10) и -0,12 для β2 (диапазон от -0,27 до -0,06). Удаление условно исчисленных результатов после MVNI уменьшило смещение этого метода вменения, хотя умеренное смещение оставалось для β2.в сценариях с преобладанием исхода 0,30. Стоимость этого уменьшения смещения была значительно выше средней стандартной ошибки по сравнению с MVNI. С точки зрения точности, удаление вмененных результатов после MVNI привело к уменьшению среднеквадратичной ошибки относительно MVNI без удаления в сценариях моделирования 26/32 и 12/32 для β1 и β2 соответственно.

FCS также произвел оценки β1 и β2, которые были смещены в сторону нуля, хотя и в меньшей степени, чем MVNI. Смещение -0,24, показанное в таблице 2 для распространенности исхода 0,30 при скоординированном механизме, приводит к оценке относительного риска всего 2,37 по сравнению с истинным значением 3. В дополнение к более экстремальным сценариям моделирования заметное смещение для β2 ( абсолютная систематическая ошибка>0,10) была очевидна в сценариях моделирования с распространенностью исходов 0,10, умеренным механизмом пропуска данных или где β1 = β2= журнал (2). Удаление вмененных результатов после FCS имело тенденцию к уменьшению смещения этого подхода вменения, при этом абсолютное смещение уменьшилось в сценариях моделирования 28/32 и 26/32 для β1 и β2 соответственно. Компромиссом для этого снижения смещения была существенная потеря точности. В 32 сценариях моделирования средние стандартные ошибки были на 14,4% больше для β1 и на 8,1% больше для β2.с удалением вмененных результатов после FCS по сравнению с только FCS. Следствием существенной потери точности при удалении вмененных результатов после FCS была потеря общей точности, при этом среднеквадратичная ошибка увеличивалась по сравнению с FCS без удаления в сценариях моделирования 30/32 и 26/32 для β1 и β2. соответственно.

Другой заслуживающий внимания результат настройки непрерывной экспозиции заключался в том, что средние стандартные ошибки были постоянно больше, чем эмпирические стандартные ошибки. В среднем по 32 сценариям моделирования средние стандартные ошибки для β1 и β2 были на 25,8% и 17,9% больше, чем эмпирические стандартные ошибки соответственно для MVNI, на 14,4% и 11,9% больше для MVNI с удалением, на 10,4% и 9,5% больше для FCS. , и на 14,3% и 12,1% больше для FCS с делецией. Расхождения были наиболее заметны в сценариях моделирования с преобладанием исхода 0,30. В сценариях, где β1 и β2были оценены с небольшим смещением, вероятности охвата также имели тенденцию быть намного выше номинального уровня 0,95. В совокупности эти результаты предполагают, что расчетные доверительные интервалы были слишком широкими.

Как и в случае категориальных воздействий, CCA демонстрирует небольшую систематическую ошибку, но имеет тенденцию давать неэффективные оценки β1 в сценариях, включающих непрерывное воздействие. Интересно, что CCA произвел более точные оценки β2, чем два подхода MID; в 32 сценариях моделирования средние стандартные ошибки для β2 были на 9,3% меньше с CCA по сравнению с обоими подходами к удалению.

Анализ чувствительности

В свете относительно низкой эффективности подходов MI для оценки относительного риска, мы провели дополнительный анализ, чтобы выяснить, были ли результаты чувствительны к выбору, сделанному во время подбора моделей вменения, или к рассматриваемым параметрам моделирования. Во-первых, мы исследовали производительность простого округления после MVNI в качестве альтернативы адаптивному округлению. Хотя различия были минимальными в большинстве сценариев, MVNI привнес немного больше смещения в настройки как категориального, так и непрерывного воздействия, когда вместо адаптивного округления использовалось простое округление (результаты не показаны). Затем мы исследовали эффективность FCS с результатом, вмененным до, а не после неполной ковариаты X2.. Эта модификация мало повлияла на результаты (также не показано). Затем мы исследовали эффективность четырех подходов MI в сценариях, включающих n= 250, а не n= 1000 наблюдений. Исключая сценарии моделирования с двоичными X1 и X2, где уменьшенный размер выборки привел к нулевым ячейкам в перекрестных таблицах, включающих результат (то есть, когда модели лог-биномиального анализа не сходятся), это изменение мало повлияло на смещение и охват параметра. оценки (результаты не показаны).

Несколько Учитывались «нулевые» настройки моделирования. В таблице 3 показаны результаты для непрерывных X1 и X2 при скоординированном механизме пропущенных данных для распространенности исходов 0,30. Эталонным случаем для сравнений в этой таблице был ранее рассмотренный сценарий моделирования с сильным механизмом пропущенных данных ( λ= 2), где corr ( X1 , X2 ) = 0,70 и β1 = β2 = журнал (3). Как показано в таблице, четыре подхода MI продолжали давать смещенные оценки параметров, когда воздействия не зависели друг от друга (т. Е. Corr ( X1 , X2 ) = 0). Когда результат не был связан с одним из воздействий, оценки параметров оставались смещенными только для воздействия, которое предсказывало результат; небольшая систематическая ошибка наблюдалась с любым подходом к ИМ, когда оба воздействия не были связаны с исходом. Наконец, систематическая ошибка была уменьшена, но все еще очевидна, когда данные отсутствовали полностью случайным образом. Аналогичная картина результатов наблюдалась с двоичными X1 и X2., а для распространенности исходов 0,10. Полные результаты этих анализов чувствительности доступны в Дополнительном файле 1: Веб-приложение.

Наконец, чтобы оценить, можно ли объяснить недостатки производительности FCS исключительно ошибочно указанной моделью логистического вменения для результата, мы рассмотрели дополнительные сценарии моделирования, в которых отсутствующие данные ограничивались только Yили X2 (с логитом P( отсутствует) = α+ λX1 ). Поскольку данные отсутствовали в одной переменной, недостающие значения были вменены 20 раз с использованием логистической или линейной регрессии, в зависимости от ситуации. В таблице 4 показаны результаты для распространенности исхода 0,30, λ= 2 и β1 = β2 = log (3) для категориальных воздействий с RR ( X1 , X2 ) = 2 или непрерывная экспозиция с corr ( X1 , X2 ) = 0,70. Для сравнения также представлены результаты для исходного сценария моделирования FCS в рамках согласованного механизма. Как показано в таблице, оценка оставалась смещенной, когда отсутствующие данные были ограничены X2 . Действительно, для непрерывных экспозиций смещение для β2 было больше, когда отсутствующие данные ограничивались X2, по сравнению с тем, когда отсутствующие данные ограничивались Y. Таким образом, кажется, что недостатки FCS были, по крайней мере, частично связаны с выбором модели условного вменения для неполной ковариаты X2 . Стоит отметить, что смещение после вменения непрерывного X2 с помощью одномерной линейной модели, как показано в таблице 4, также предполагает, что дефицит производительности, наблюдаемый с MVNI в настройке непрерывного воздействия, частично был вызван несоответствующими вмененными значениями в воздействии. (и не только результат).

Обсуждение

Учитывая широкое использование ИМ и популярность относительного риска, отсутствие исследований по применению ИМ для оценки относительного риска вызывает удивление. В этом исследовании мы продемонстрировали, что стандартные методы ИМ, основанные на моделях, могут давать предвзятые оценки относительного риска с чрезмерно широкими доверительными интервалами, когда данные представляют собой MAR. Дефицит эффективности был особенно очевиден, когда анализ включал непрерывное воздействие и в условиях с более высокими относительными рисками, более сильными механизмами отсутствия данных и более высокой распространенностью результатов. Эти результаты вызывают опасения по поводу использования стандартных методов МИ для оценки относительного риска.

Основная цель этого исследования состояла в том, чтобы сопоставить эффективность MVNI и FCS для обработки недостающих данных о результатах при оценке относительного риска. MVNI работал хуже, чем FCS, давая оценки относительного риска, которые часто были существенно смещены в сторону нуля, как для категориальных, так и для непрерывных воздействий. Хотя было показано, что MVNI устойчив к нарушениям многомерного нормального предположения в целом ряде других параметров, например, при оценке отношения шансов или работе с ненормальными переменными подверженности [16, 20], такая устойчивость к ошибочной спецификации модели вменения не была очевидно здесь. Напротив, FCS хорошо себя зарекомендовала, когда анализ включал категориальные воздействия, только привнося заметную систематическую ошибку для распространенности исхода 0,30, сильный механизм пропущенных данных и большие относительные риски.Эффективность была менее удовлетворительной при наличии непрерывного воздействия, с заметным смещением к нулю, также очевидным в условиях, предполагающих умеренные относительные риски или распространенность исходов 0,10. Даже когда относительные риски для непрерывного воздействия оценивались с небольшой погрешностью, FCS давала слишком широкие доверительные интервалы. Хотя мы бы рекомендовали FCS вместо MVNI для оценки относительного риска на основе представленных здесь результатов моделирования, очевидно, что этот подход не лишен недостатков.Хотя мы бы рекомендовали FCS вместо MVNI для оценки относительного риска на основе представленных здесь результатов моделирования, очевидно, что этот подход не лишен недостатков.Хотя мы бы рекомендовали FCS вместо MVNI для оценки относительного риска на основе представленных здесь результатов моделирования, очевидно, что этот подход не лишен недостатков.

Вторичной целью этого исследования было оценить, улучшает ли удаление вмененных результатов эффективность ИМ для оценки относительного риска. Сосредоточившись на FCS как на наиболее эффективном методе ИМ, мы наблюдали небольшую разницу между FCS с удалением условно исчисленных результатов и без него для моделей анализа, включающих категориальные воздействия. При наличии непрерывных воздействий удаление условно исчисленных результатов после FCS было связано с частичным уменьшением абсолютной систематической ошибки за счет значительного увеличения средних стандартных ошибок; интересный вывод, учитывая, что удаление повышает точность оценки в условиях, когда модели анализа и вменения совпадают [18]. Потеря точности с MID в настройках непрерывной экспозиции предполагает, что вмененные значения в результате содержали информацию, которая была полезна для анализа,что может быть связано с несоответствиями между моделями вменения и анализа. Конечно, поскольку модель вменения была указана неправильно, эта дополнительная информация (из вмененных значений результатов) также может привести к увеличению систематической ошибки в обычном анализе МИ. В любом случае нам трудно рекомендовать MID для оценки относительного риска на основе этих результатов, особенно потому, что этот подход рекомендуется только в условиях, когда вспомогательные переменные для результата недоступны [19].особенно потому, что этот подход рекомендуется только в условиях, когда вспомогательные переменные для результата недоступны [19].особенно потому, что этот подход рекомендуется только в условиях, когда вспомогательные переменные для результата недоступны [19].

Хотя логистическая регрессия является стандартным выбором для вменения двоичных результатов в программное обеспечение для реализации FCS, очевидно, что эта модель не оптимальна для оценки относительного риска. Поскольку учет смешения различается между отношением шансов и относительным риском [24], возможно, неудивительно, что в этом исследовании моделирования наблюдались нарушения производительности при использовании FCS. Это поднимает вопрос о том, следует ли использовать альтернативную модель условного вменения для результата с FCS при оценке относительного риска, представляющего интерес. Если предположить, что модель анализа задана надлежащим образом, очевидным кандидатом для сведения к минимуму проблем неправильной спецификации модели вменения является лог-биномиальная модель, однако проблемы с несходимостью могут быть значительным ограничением в контексте FCS.Поскольку относительные риски часто оцениваются с использованием модифицированной регрессии Пуассона, другой возможностью может быть условное исчисление результатов с использованием регрессии Пуассона. Одна из трудностей этого подхода заключается в том, что вмененные значения результатов будут подсчетами и, таким образом, повлекут за собой использование модифицированной регрессии Пуассона в анализе или использование метода округления перед анализом с помощью логарифмической биномиальной модели. Для этого не разработаны методы округления. Другой важной проблемой может стать включение надежной оценки дисперсии ошибки в модель вменения, поскольку обычная регрессия Пуассона имеет тенденцию переоценивать стандартную ошибку для относительного риска [8]. Хотя были предложены другие подходы для оценки относительных рисков (например, регрессия Кокса с постоянным временем риска [25]), например регрессия Пуассона,они обычно требуют использования устойчивой дисперсии ошибок, которую необходимо учитывать при условном исчислении. Этого сложно добиться с помощью современного программного обеспечения MI.

В дополнение к неправильно определенной логистической модели для вменения результата, анализ чувствительности показал, что систематическая ошибка, вносимая FCS, также может быть отнесена на счет условных моделей, используемых для вменения ковариат. Расчет непрерывной ковариаты с использованием линейной регрессии в FCS предполагал линейную связь между ковариатой и результатом, что несовместимо с моделью генерации данных. Аналогичный аргумент применяется для вменения двоичных ковариант с использованием логистической регрессии. В недавней статье Бартлетт и его коллеги [26] предложили модификацию стандартного алгоритма FCS таким образом, что неполные коварианты вменяются из моделей, совместимых с предполагаемой моделью анализа. Хотя в этом контексте подход кажется многообещающим,необходимы дальнейшие исследования, чтобы понять его свойства и пригодность для оценки относительного риска.

Из-за проблем сходимости с лог-биномиальной моделью в настройке непрерывной экспозиции мы решили проанализировать все условно рассчитанные наборы данных с использованием популярного модифицированного подхода регрессии Пуассона. Результаты моделирования показали, что этот метод хорошо работает при отсутствии недостающих данных, что согласуется с предыдущими исследованиями метода [8, 23, 25]. Интересное соображение, которое возникло после вменения, заключалось в том, следует ли использовать модифицированную регрессию Пуассона для анализа всех вмененных наборов данных или только тех наборов данных, где логарифмическая биномиальная модель не сходится. Мы выбрали первый подход, так как он был проще в реализации и больше соответствовал правилам Рубина, однако последний также можно было рассмотреть в дальнейшей работе.

Учитывая отсутствие механизмов данных, рассмотренных в исследовании моделирования, неудивительно, что CCA произвел оценки параметров с небольшим смещением. Известно, что для отсутствующих данных в одномерном исходе CCA дает объективные и полностью эффективные оценки коэффициентов регрессии, когда вероятность отсутствия данных зависит только от полностью наблюдаемых ковариат [27,28,29]. Для отсутствующих данных, ограниченных ковариантой, CCA, как известно, несмещен (но не полностью эффективен), если вероятность пропущенных данных не зависит от результата, обусловленного другими ковариатами в модели [30]. Оба эти условия были выполнены в исследовании моделирования, где вероятность пропуска данных в Yи X2 зависела только от полностью наблюдаемой ковариаты X1.. Очевидно, что эти условия не всегда выполняются в более сложных практических условиях, и CCA может внести значительную систематическую ошибку, когда данные представляют собой MAR. Принимая во внимание потенциальную предвзятость и неэффективность CCA, мы не поддерживаем его использование вместо MI для обработки произвольных шаблонов отсутствующих данных при оценке относительного риска.

Хотя мы ожидаем аналогичные недостатки с MVNI и FCS в более сложных практических условиях, трудно сделать окончательные выводы из ограниченного набора сценариев моделирования. Несомненно, было бы полезно дальнейшее изучение эффективности этих методов MI в реальных наборах данных (где механизм недостающих данных неизвестен) и в сценариях моделирования с различными ковариатными характеристиками, распространенностью результатов и механизмами отсутствующих данных. Еще одним ограничением настоящего исследования является то, что мы не оценивали альтернативы стандартным модельным методам ИМ для обработки недостающих данных. В частности, мы не рассматривали метод обратного взвешивания вероятностей, который включает в себя взвешивание полных случаев в анализе в соответствии с обратной вероятностью того, что они являются полным случаем [31].Мы решили сосредоточиться на МИ, поскольку он, как известно, более эффективен, чем обратное вероятностное взвешивание, особенно при наличии вспомогательных переменных и для произвольных шаблонов отсутствующих данных. Однако в свете недостаточной производительности МИ, дальнейшие исследования могли бы изучить использование обратного вероятностного взвешивания в этой ситуации. В рамках системы MI мы не рассматривали менее широко используемые методы, основанные на моделях, такие как общая модель местоположения для смесей непрерывных и категориальных переменных, или непараметрические методы, такие как условное исчисление hot deck. Опять же, дальнейшие исследования могут рассмотреть возможность использования этих подходов для оценки относительного риска.дальнейшие исследования могли бы изучить использование обратного взвешивания вероятностей в этой обстановке. В рамках системы MI мы не рассматривали менее широко используемые методы, основанные на моделях, такие как общая модель местоположения для смесей непрерывных и категориальных переменных, или непараметрические методы, такие как условное исчисление hot deck. Опять же, дальнейшие исследования могут рассмотреть возможность использования этих подходов для оценки относительного риска.дальнейшие исследования могли бы изучить использование обратного взвешивания вероятностей в этой обстановке. В рамках системы MI мы не рассматривали менее широко используемые методы, основанные на моделях, такие как общая модель местоположения для смесей непрерывных и категориальных переменных, или непараметрические методы, такие как условное исчисление hot deck. Опять же, дальнейшие исследования могут рассмотреть возможность использования этих подходов для оценки относительного риска.

Выводы

Таким образом, стандартные методы ИМ, основанные на моделях, могут давать необъективные и неэффективные оценки относительного риска из-за неправильного определения модели вменения. Если для обработки недостающих данных будет выбран MI, мы рекомендуем исследователям избегать MVNI и вместо этого использовать FCS без удаления для оценки относительных рисков. Однако необходимы дальнейшие исследования для определения оптимальных подходов к оценке относительного риска в рамках системы ИБ.

ПОПУЛЯРНЫЕ СТАТЬИ