Надлежащая оценка влияния соседства на здоровье человека: интеграция случайных и фиксированных эффектов в многоуровневую логистическую регрессию

Клаус Ларсен, Хуан Мерло, Соответствующая оценка влияния соседства на здоровье человека: интеграция случайных и фиксированных эффектов в многоуровневую логистическую регрессию, Американский журнал эпидемиологии , том 161, выпуск 1, 1 января 2005 г., страницы 81–88, https: // doi .org / 10.1093 / aje / kwi017

Абстрактный

Модель логистической регрессии часто используется в эпидемиологических исследованиях, позволяя получить отношение шансов или интерпретацию относительного риска. Вдохновленная теорией линейных нормальных моделей, модель логистической регрессии была расширена, чтобы учесть коррелированные ответы путем введения случайных эффектов. Однако модель не наследует интерпретационные особенности нормальной модели. В этой статье авторы утверждают, что существующие меры неудовлетворительны (а некоторые из них даже неправильны) при количественной оценке результатов многоуровневого анализа логистической регрессии. Авторы предлагают меру неоднородности, среднее отношение шансов, которое количественно определяет неоднородность кластера и облегчает прямое сравнение между ковариатными эффектами и величиной неоднородности с точки зрения хорошо известных отношений шансов.Количественная оценка ковариат на уровне кластера осмысленным способом является проблемой при многоуровневой логистической регрессии. С этой целью авторы предлагают меру отношения шансов, интервальное отношение шансов, которое учитывает эти трудности. Авторы демонстрируют эти два показателя, исследуя неоднородность между районами и влияние ковариат на уровне района на двух примерах - посещение государственного врача и госпитализация при ишемической болезни сердца - с использованием данных 1999 года о 11 312 мужчинах в возрасте 45–85 лет в Мальмё, Швеция.Авторы демонстрируют эти два показателя, исследуя неоднородность между районами и влияние ковариат на уровне района на двух примерах - посещение государственного врача и госпитализация при ишемической болезни сердца - с использованием данных 1999 года о 11 312 мужчинах в возрасте 45–85 лет в Мальмё, Швеция.Авторы демонстрируют эти два показателя, исследуя неоднородность между районами и влияние ковариат на уровне района на двух примерах - посещение государственного врача и госпитализация при ишемической болезни сердца - с использованием данных 1999 года о 11 312 мужчинах в возрасте 45–85 лет в Мальмё, Швеция.

Поступила в печать 3 октября 2003 г .; принята к печати 30 августа 2004 г.

Во все большем числе эпидемиологических исследований применяется многоуровневый регрессионный анализ для изучения связи между районом проживания (например, район) и индивидуальным здоровьем (1, 2). Большинство исследований сосредоточено на традиционных показателях ассоциации, таких как фиксированные эффекты, с использованием регрессионных моделей для связи между характеристиками района (или кластера) и индивидуальным здоровьем. Другие подходы к многоуровневому регрессионному анализу сосредоточены на определении компонентов изменчивости состояния здоровья (3). В некоторых случаях возникают сложные вопросы, например: «Стоит ли изучать связь между характеристиками района и здоровьем, когда вариация в районе очень мала?» (4).Ни чистый регрессионный анализ с фиксированными эффектами, ни расчет внутриклассовых корреляций не могут дать достаточного понимания, чтобы дать удовлетворительный ответ на такие вопросы.

Разделение дисперсии на разные уровни (например, районный и индивидуальный) является непременным условием многоуровневого регрессионного анализа, и его рассмотрение актуально как по статистическим причинам (улучшенная оценка), так и по основным эпидемиологическим причинам (количественная оценка важности районов для понимание индивидуального здоровья) (5). Однако, в отличие от нормально распределенных непрерывных переменных, компоненты дисперсии сложно исследовать, когда речь идет о переменных дихотомического отклика. Принуждение к классическим схемам интерпретации тратит впустую информацию и может быть неуместным. Необходимы новые меры для количественной оценки эффектов и, в конечном итоге, для лучшего понимания данных.

В этой статье наша цель - выделить два ранее описанных показателя (6): медианное отношение шансов (MOR) и интервальное отношение шансов (IOR). Эти меры облегчают интеграцию и представление как фиксированных, так и случайных эффектов в логистической регрессии.

МОТИВАЦИЯ ДЛЯ НОВЫХ МЕРОПРИЯТИЙ РАЗМЕРА ЭФФЕКТА В ДВУХУРОВНЕВЫХ МОДЕЛЯХ С ДИХОТОМНЫМИ ОТВЕТАМИ

Многомерное нормальное распределение представляет собой привлекательную основу для статистического моделирования, когда данные о переменной отклика являются непрерывными и нормальными. Однако, когда переменная ответа дихотомическая, распределение неверно, и поэтому выводы, основанные на нормальном распределении, вероятно, будут ошибочными.

При формулировании двухуровневой модели принято предполагать нормальность для вариации на уровне кластера (уровень 2) и предполагать независимость единиц внутри кластера (уровень 1) в зависимости от переменной кластера, таким образом создавая модель, в которой индивиды слабо коррелированы внутри кластеров. В многомерном нормальном случае интерпретация как фиксированных эффектов, так и случайных эффектов (индивидуальная остаточная ошибка и кластерная вариация) проста. Это неверно в случае дихотомических переменных отклика из-за нелинейной связи между ковариатами и переменной отклика (обычно логит-отношение).

Выбор модели логистической регрессии приводит к выбору между двумя различными интерпретациями отношения шансов параметров с фиксированными эффектами, индивидуальной интерпретацией и интерпретацией, усредненной по совокупности (7, 8). При использовании подхода, усредненного по численности населения, неоднородность считается помехой, тогда как предметно-ориентированный подход открывает возможность количественной оценки неоднородности на основе двухуровневой модели (6).

Другое дело - количественная оценка компонента дисперсии. Обычно исследователи либо вычисляют так называемый коэффициент внутриклассовой корреляции на основе оценки компонентов дисперсии и остаточной дисперсии, либо сообщают о компоненте дисперсии, ни один из которых не является очень полезным. Было предложено множество различных мер внутриклассовой корреляции (9). Тем не менее, внутриклассовые корреляции имеют серьезные недостатки интерпретации (10) для бинарных ответов. Во-первых, внутриклассовая корреляция может быть интерпретирована как доля от общей вариации, относящаяся к вариациям между кластерами, или как корреляция между людьми в одном и том же кластере. То есть внутриклассовая корреляция не передает информацию относительно вариаций между кластерами. Следовательно,это не очень полезная мера при определении того, является ли кластеризация важным фактором. Во-вторых, внутриклассовая корреляция несопоставима с фиксированными эффектами, которые имеют интерпретацию отношения шансов. Это прискорбно, потому что случайные эффекты не сильно отличаются от фиксированных эффектов по своей природе; случайные эффекты - это фиксированные эффекты с дополнительным предположением о распределении. Поэтому кажется естественным количественно оценить вариации между случайными эффектами, используя отношения шансов. В качестве альтернативы можно использовать сам компонент дисперсии, но его довольно сложно интерпретировать, поскольку он находится в логарифмической шкале отношения шансов.случайные эффекты - это фиксированные эффекты с дополнительным предположением о распределении. Поэтому кажется естественным количественно оценить вариации между случайными эффектами, используя отношения шансов. В качестве альтернативы можно использовать сам компонент дисперсии, но его довольно сложно интерпретировать, поскольку он находится в логарифмической шкале отношения шансов.случайные эффекты - это фиксированные эффекты с дополнительным предположением о распределении. Поэтому кажется естественным количественно оценить вариации между случайными эффектами, используя отношения шансов. В качестве альтернативы можно использовать сам компонент дисперсии, но его довольно сложно интерпретировать, поскольку он находится в логарифмической шкале отношения шансов.

В этой статье мы объединяем интерпретации фиксированных и случайных эффектов в предметно-ориентированном подходе, объясняя использование показателей MOR и IOR в случае двухуровневой модели логистической регрессии.

Модель

Рассмотрим популяцию из N особей. У каждого индивидуума есть вектор ковариат x, и каждый индивидуум принадлежит к одному из K кластеров. Параметры, соответствующие ковариатам, находятся в векторе β. В K взаимно независимый переменный кластер, у 1 , у 2 ,. u K , не подлежат оценке, поскольку сами по себе они не представляют интереса; скорее, необходимо количественно оценить различия между кластерами. Следовательно, предполагается нормальное распределение для u , и параметры, характеризующие это распределение, могут затем использоваться для характеристики неоднородности, вызванной случайными эффектами.

Переменная ответа Y является дихотомической переменной. То есть для каждого индивидуума наблюдается, = 0 или 1 Y. Модель имеет два уровня.

Уровень 1. Для человека с ковариатным вектором x, соответствующим k- му кластеру, вероятность наблюдения Y = 1 равна

Уровень 2: Для этого человека уравнение второго уровня

где u k ∼ N (0, σ 2). Вектор ковариации xсодержит ковариаты индивидуального уровня (уровень 1) и уровня кластера (уровень 2). Хотя нет различий в формулировке модели, есть различия при интерпретации эффектов переменных, меняющихся в пределах кластеров, и переменных уровня кластера.

Для переменных, меняющихся в пределах кластера, обычные интерпретации отношения шансов применяются для сравнения лиц, принадлежащих к одному кластеру; например, гендерный эффект можно интерпретировать как отношение шансов между женщиной и мужчиной, принадлежащими к одному кластеру и с одними и теми же ковариатами, за исключением пола.

Для переменных, различающихся на уровне кластера, количественная оценка труднее; обычная интерпретация отношения шансов неверна, потому что необходимо сравнивать людей с разными случайными эффектами, поскольку интересующая переменная не меняется между индивидами внутри кластера. Мера для этой ситуации описана ниже в разделе «IOR».

Представляет интерес количественная оценка кластеризации как чего-то другого, кроме вариации базовой линейной шкалы, потому что это трудно интерпретировать и связать с фиксированными эффектами, которые количественно оцениваются в терминах отношения шансов. Следовательно, было бы полезно иметь интерпретацию отношения шансов кластерной вариации. Мера описана ниже.

MOR

MOR количественно оценивает вариацию между кластерами (вариация второго уровня) путем сравнения двух человек из двух случайно выбранных разных кластеров. Рассмотрим двух человек с одинаковыми ковариатами, случайно выбранных из двух разных кластеров. MOR - это среднее отношение шансов между человеком с более высокой предрасположенностью и человеком с более низкой предрасположенностью.

MOR очень легко вычислить, потому что это простая функция кластерной дисперсии σ 2:

где Φ (·) - кумулятивная функция распределения нормального распределения со средним 0 и дисперсией 1, Φ –1 (0,75) - 75-й процентиль, а exp (·) - экспоненциальная функция. Теоретический вывод формулы приведен в Приложении.

Эта мера всегда больше или равна 1. Если MOR равно 1, нет никаких различий между кластерами (нет вариации второго уровня). Если между кластерами имеется значительная вариация, MOR будет большим. Этот показатель напрямую сопоставим с отношениями шансов фиксированных эффектов.

IOR

IOR - это мера фиксированных эффектов для количественной оценки влияния переменных на уровне кластера. Рассмотрим двух человек с разными ковариатами уровня кластера, x1 и x2 . IOR - это интервал для отношений шансов между двумя людьми с ковариатными моделями x1 и x2 , покрывающий средние 80 процентов отношений шансов.

Рассчитать IOR лишь немного сложнее, чем MOR. Нижняя и верхняя границы интервала равны

где Φ –1 (0.10) = –1.2816 и Φ –1 (0.90) = 1.2816 - 10-й и 90-й процентили нормального распределения со средним значением 0 и дисперсией 1. Теоретический вывод формулы приведен в Приложении.

Интервал узкий, если вариация между кластерами мала, и широкая, если вариация между кластерами велика. Если интервал содержит 1, изменчивость кластера велика по сравнению с влиянием переменной уровня кластера. Если интервал не содержит 1, влияние переменной уровня кластера велико по сравнению с необъяснимой вариацией между кластерами.

Согласно модели, отношение шансов может принимать любое значение от нуля до бесконечности. Однако, чтобы придать значение IOR, естественно указать интервал, который, вероятно, будет содержать отношение шансов при случайном выборе двух человек с двумя конкретными наборами ковариат. Было предложено указать 80-процентный интервал (6), и это разумно, поскольку оно покрывает большую часть отношения шансов. Обратите внимание, что IOR не является доверительным интервалом.

ПРИМЕРЫ

Известно, что разные географические границы могут по-разному влиять на один и тот же ответ, проблема, которая в медицинской географии известна как «проблема изменяемой единицы площади» (11). Аналогичным образом, одно и то же определение соседства может по-разному влиять на разные индивидуальные результаты. Более того, необходимо также учитывать временную или продольную перспективу, чтобы определить индивидуальное воздействие окружающей среды, поскольку люди перемещаются между разными областями в течение своей жизни. Следовательно, при поперечном анализе влияния соседства на здоровье следует ожидать, что на атеросклеротические заболевания с длительным естественным течением (например, ишемическая болезнь сердца) лишь незначительно влияют фактические территориальные границы соседства. Следуя тем же рассуждениям, результаты, связанные с поведением (например,выбор конкретного врача) может быть более восприимчивым к влиянию соседей.

Многоуровневый анализ показал, что социально-экономические характеристики окружающей среды влияют на индивидуальный риск ишемической болезни сердца (12). Однако вариативность соседства кажется низкой (13).

В Швеции стоимость не является конкретным фактором, определяющим выбор людей между частным или государственным практикующим врачом, поскольку советы графств поддерживают и то, и другое с экономической точки зрения. Однако частные врачи находятся за пределами государственной системы здравоохранения и поэтому менее восприимчивы к стратегиям здравоохранения, проводимым советами графств. Предпочтение государственного практикующего врача перед частнопрактикующим врачом может указывать на дисфункцию в некоторых частях государственной системы здравоохранения, но это также может быть объяснено индивидуальными предпочтениями, требованиями и ожиданиями, связанными с социально-экономическим положением. Повышенная конфиденциальность медицинских карт в частном секторе - еще один фактор, который может объяснить индивидуальные предпочтения. Более того, место проживания может повлиять на индивидуальные решения помимо индивидуальных характеристик.

Используя многоуровневый подход, мы исследовали вероятность госпитализации по поводу ишемической болезни сердца и вероятность посещения государственного практикующего врача по сравнению с частнопрактикующим врачом среди шведских мужчин. Мы приводим два примера, а затем некоторые комментарии по вопросам, которые еще не были рассмотрены.

Популяция исследования и оценка переменных

Исследуемая популяция состояла из 11312 мужчин в возрасте 45–85 лет, проживающих в 98 из 110 районов города Мальмё, Швеция. Все мужчины посещали врача в течение 1999 года. Информация была получена из Регистра использования медицинских услуг в Сконе, Швеция (14).

Для анализа в качестве переменной кластера (уровень 2) использовалась переменная «соседство». Были рассмотрены две независимые переменные индивидуального уровня (уровень 1): «возраст», который представлял собой переменную с четырьмя категориями с категориями 65–69, 70–74, 75–79 и 80–85 лет, и «образование», что является дихотомическим показателем наличия 9 или менее лет обучения в школе. В анализе также использовалась объясняющая переменная уровня кластера (уровень 2), «образование в районе». Эта переменная была дихотомическим индикатором уровня образования района, который был ниже медианного значения для всех районов. В примере 1 переменная ответа была индикатором того, был ли человек госпитализирован по поводу ишемической болезни сердца (код 1) или нет (код 0). Ишемическая болезнь сердца была определена при выписке из больницы в 1999 г. Соответствующие коды в соответствии сМеждународная классификация болезней , десятая редакция, включает I20 (стенокардия), I21 (острый инфаркт миокарда), I22 (последующий инфаркт миокарда) и I50 (сердечная недостаточность). В примере 2 переменной ответа было то, посещал ли человек государственного врача (код 1) или нет (код 0). Мы ограничили наш анализ лицами, которые пользовались системой здравоохранения и посещали терапевта хотя бы один раз в течение 1999 года.

Параметры в модели случайных эффектов оценивались с использованием ограниченного итеративного обобщенного метода наименьших квадратов. Для проведения анализа использовался программный пакет MLwiN (15) версии 1.1. Экстрабиномиальные вариации систематически исследовались во всех моделях, и не было никаких указаний на недостаточную или избыточную дисперсию.

Осредненные по совокупности параметры рассчитывались по приближенной формуле (7)

где - параметр, усредненный по совокупности, - параметр, специфичный для конкретного предмета. Кластерная дисперсия составляет.

Пример 1: госпитализация по поводу ишемической болезни сердца

В примере 1 рассматриваются две модели. В модели 1 возраст и индивидуальное образование были включены вместе с эффектом случайного соседства. Модель 2 была расширением модели 1, которая также включала ковариантное образование в районе кластера.

В обоих анализах выяснилось, что пожилые люди с большей вероятностью будут госпитализированы, чем более молодые люди, и что менее образованные люди с большей вероятностью будут госпитализированы, чем более образованные. Оценки, показанные в таблице 1, были очень похожи в двух моделях, но были некоторые различия (подробно обсуждаемые ниже). Оценки параметров были преобразованы в отношения шансов, которые показаны в таблице 2.

Индивидуальные фиксированные эффекты зависят от случайных эффектов. То есть их можно интерпретировать как отношения шансов для сравнений внутри кластера. Для переменной индивидуального образования отношения шансов для низкого уровня образования по сравнению с высоким уровнем составили 1,25 в модели 1 и 1,22 в модели 2. Эти отношения шансов зависят от возраста и района проживания.

Обратите внимание, что приведенные выше отношения шансов верны только для сравнения лиц, принадлежащих к одному кластеру. При сравнении людей из разных кластеров необходимо рассчитать IOR или отказаться от интерпретации, зависящей от предмета, и рассмотреть усредненные по совокупности отношения шансов. Усредненное по совокупности отношение шансов - это отношение шансов между двумя людьми из разных кластеров. В моделях 1 и 2 оценки по шкале линейного предиктора сокращаются только в несколько раз.

соответственно. Это указывает на явно небольшую неоднородность кластеров. Таким образом, ослабление практически не заметно в этом анализе.

В модели 1 неоднородность кластера интерпретируется следующим образом. Рассмотрим двух случайно выбранных людей с одинаковыми ковариатами из двух разных кластеров (например, двух более образованных людей в возрасте 65–69 лет) и проведем гипотетический эксперимент по вычислению отношения шансов для человека с более высокой склонностью к госпитализации по сравнению с этим человеком. с меньшей склонностью. Повторение этого сравнения двух случайно выбранных людей приведет к ряду отношений шансов. Это распределение оценивается при оценке параметров и показано на рисунке 1 (в логарифмической шкале). Среднее значение этих отношений шансов между человеком с более высокой предрасположенностью и человеком с более низкой предрасположенностью оценивается в 1,17 в модели 1. Это низкое отношение шансов,и это предполагает, что эффект кластеризации невелик даже без включения каких-либо ковариат на уровне кластера. Когда включается районное образование (модель 2), необъяснимая неоднородность кластера (сравнение людей из районов одного типа - например, обоих районов с высоким уровнем образования) уменьшается, давая MOR 1,09, что является очень низким шансом. соотношение. Таким образом, существует очень небольшая разница между районами в предрасположенности к госпитализации по поводу ишемической болезни сердца.предрасположенность к госпитализации по поводу ишемической болезни сердца очень мало различается между районами.предрасположенность к госпитализации по поводу ишемической болезни сердца очень мало различается между районами.

Хотя кластерная неоднородность невелика в обеих моделях, интересно, что районное образование составляет довольно большую часть различий между кластерами. Лучше всего это можно увидеть из IOR следующим образом. IOR составляет [1,07; 1.50]. Это означает, что при случайном выборе двух человек с идентичными индивидуальными ковариатами (например, от 80 до 85 лет с низким индивидуальным уровнем образования) из района с низким уровнем образования и района с высоким уровнем образования, отношение шансов между двумя лежит в пределах интервала в 80% случаев. Расчетное распределение отношений шансов показано на рисунке 2 (в логарифмической шкале). В отношении этого интервала следует отметить две вещи. Во-первых, интервал не содержит 1. Это говорит о том, что эффект соседского образования велик по сравнению с эффектом кластера,потому что, очевидно, мало шансов, что человек из менее образованного района имеет меньшую склонность к госпитализации, чем человек из более образованного района. Во-вторых, интервал кажется относительно узким, что предполагает небольшую кластерную неоднородность (как и MOR). Следовательно, довольно большая доля (небольших) различий между районами в склонности к госпитализации может быть объяснена уровнем образования в районе.довольно большая доля (небольших) различий между районами в склонности к госпитализации может быть объяснена уровнем образования в районе.довольно большая доля (небольших) различий между районами в склонности к госпитализации может быть объяснена уровнем образования в районе.

Подход, усредненный по численности населения, не может передать столь же удовлетворительные последствия воздействия местного образования на склонность к госпитализации. Результаты такого анализа будут количественно выражены с точки зрения (слегка ослабленного) отношения шансов

и некоторая мера внутрикластерной ассоциации. В отличие от MOR и IOR, эти два показателя не содержат много информации о влиянии кластеризации на вероятность госпитализации.

Пример 2: посещение государственного или частного врача

В примере 2 рассматриваются две модели. В модели 3 возраст и индивидуальное образование были включены с эффектом случайного соседства. Модель 4 была расширением модели 3, которая также включала ковариантное образование в районе кластера.

Оценки параметров показаны в таблице 1, а отношения шансов показаны в таблице 2. Отношения шансов для индивидуального образования составили 1,28 и 1,27 в моделях 3 и 4, соответственно; это предполагает более высокую склонность к посещению государственного врача для менее образованных, в зависимости от возраста и района проживания.

Однако результаты, касающиеся кластеризации, сильно отличаются от результатов в примере 1, и это подразумевает существенные различия между оценками по конкретным предметам и усредненными по совокупности оценками в этом примере. В моделях 3 и 4 параметры линейного предсказателя ослабляются в несколько раз.

соответственно. Это дает усредненный для населения эффект 1,21 для индивидуального образования в обеих моделях. Эти эффекты предназначены для сравнения лиц одного возраста, принадлежащих к разным кластерам.

В модели 3 для двух людей с одинаковыми ковариатами индивидуального уровня MOR между человеком, живущим по соседству с более высокой склонностью к посещению общественного врача, и человеком, живущим по соседству с более низкой склонностью, составляет 3,61. Это высокое отношение шансов, предполагающее, что неоднородность значительна. Включение районного образования в качестве ковариаты снижает необъяснимую неоднородность между районами до MOR 3,33, который все еще остается высоким. Таким образом, склонность к посещению государственного врача сильно различается в зависимости от района. Это также отражено в очень широком IOR: [0,28; 27.3]. Интерпретация заключается в том, что если случайным образом выбираются два человека, один из района с низким уровнем образования, а другой - из района с высоким уровнем образования, и сравниваются их шансы на посещение государственного врача,средние 80 процентов отношения шансов будут находиться в пределах этого интервала. Интервал содержит 1, что означает, что районное образование не учитывает значительную часть неоднородности района. Кроме того, интервал довольно широк, отражая большое количество необъяснимых различий между районами в склонности к посещению государственного врача. Другие переменные уровня кластера необходимы для объяснения неоднородности кластера.Другие переменные уровня кластера необходимы для объяснения неоднородности кластера.Другие переменные уровня кластера необходимы для объяснения неоднородности кластера.

Подход, усредненный по численности населения, может привести к другому выводу. Усредненный по населению эффект обучения по месту жительства равен

Это, безусловно, самый важный из фиксированных эффектов, и он предполагает, что обучение по месту жительства действительно является важной переменной при анализе склонности к посещению государственного врача. Однако это не полностью согласуется с предыдущими интерпретациями, основанными на подходе случайных эффектов. Причина этого очевидного несоответствия - большая необъяснимая кластерная неоднородность, которая в методе усреднения по совокупности считается только неприятностью.

Другие вопросы, касающиеся MOR и IOR

В предыдущем исследовании (6) IOR для прописанного морфина при вызове двух разных врачей и указании «боли в спине» по сравнению с «другим» в качестве причины звонка был [2,08; 22.9]. Это пример большого кластерного эффекта (различия между врачами) наряду с сильным фиксированным эффектом (причиной вызова).

Возможна и другая, возможно, менее интересная ситуация - ситуация, когда существует относительно небольшая вариация между кластерами и незначительное влияние ковариаты на уровне кластера или его отсутствие. Хотя это может быть обычная ситуация, ее также, скорее всего, не заметят из-за ошибки типа II.

Также возможно включить непрерывные ковариаты на уровне кластера, используя формулы, приведенные выше в разделе «IOR», и интерпретация проста.

ОБСУЖДЕНИЕ

В этой статье мы обсуждаем интерпретационные аспекты многоуровневой модели логистической регрессии. Две меры, MOR и IOR, предлагаются и применяются к данным, касающимся влияния района на склонность людей посещать государственных врачей и их вероятность госпитализации из-за ишемической болезни сердца.

Что касается интерпретации фиксированных эффектов, выбор между обобщенными оценочными уравнениями и моделью случайных эффектов - это выбор между интерпретациями, усредненными по совокупности, и интерпретациями для конкретных субъектов. Какой из них выбрать, полностью зависит от предметного вопроса исследования. В примерах 1 и 2 эффект индивидуального обучения зависит от района проживания. Подход к конкретным предметам является правильным, поскольку он способствует измерению воздействия на индивидуальном уровне: каков прямой эффект от высокого индивидуального уровня образования по сравнению с низким уровнем для человека в его / ее конкретных условиях? В этом смысле предметно-специфические параметры являются более «чистыми» мерами воздействия индивидуального образования, поскольку они не ослабляются неизмеримой неоднородностью.

Общий аргумент в пользу модели случайных эффектов - возможность количественной оценки неоднородности интуитивно привлекательным способом. Как показано в четырех моделях в примерах, неоднородность может быть определена количественно с помощью характеристик из распределения отношений шансов между парами случайно выбранных людей из разных районов. Это дает меру неоднородности по шкале, знакомой исследователям, работавшим с моделью логистической регрессии, а именно отношения шансов.

Обычные интерпретации отношения шансов (обусловленные всеми другими ковариатами и случайными эффектами) подходят для ковариат, которые изменяются внутри кластера, тогда как они не подходят для ковариат на уровне кластера, потому что невозможно проводить сравнения внутри кластера. То есть все сравнения должны производиться между людьми, принадлежащими к двум разным кластерам, и, таким образом, отношение шансов больше не является фиксированной величиной, а является случайной величиной. Таким образом, неоднородность становится актуальной при количественной оценке эффекта ковариаты на уровне кластера. IOR включает как фиксированный эффект, так и кластерную неоднородность в интервале, что позволяет более подробно описать ковариантный эффект.

MOR и IOR были применены в двухуровневой модели для количественной оценки вариабельности между экспертами в исследовании маммографического скрининга (16). В других исследованиях использовалось попарное отношение шансов (17, 18), которое похоже на MOR и IOR в том смысле, что оно также основано на сравнении между парами людей. Однако там, где MOR и IOR количественно определяют неоднородность между кластерами, парное отношение шансов количественно определяет ассоциацию (соответствие / несоответствие) между парами индивидов внутри кластера.

И MOR, и IOR очень легко вычислить, поскольку они являются простыми функциями параметров модели. Таким образом, никаких дополнительных анализов не требуется. Карманного калькулятора с экспоненциальной функцией и функцией квадратного корня достаточно для вычисления мер по параметрам.

MOR и IOR могут быть расширены до многоуровневых моделей более высокого порядка, моделей с неиерархической структурой и моделей со случайными наклонами. Их также можно распространить на лог-линейные (Пуассона) и линейные (нормальные) отклики, а также на модели с ненормальными случайными эффектами.

БЛАГОДАРНОСТИ

Это исследование было поддержано грантами 2002-054 и 2003-0580 (главный исследователь, доктор Хуан Мерло) Шведского совета по трудовой жизни и социальным исследованиям.

Авторы выражают благодарность профессору Нильсу Кейдингу с кафедры биостатистики Копенгагенского университета за его комментарии к раннему черновику этой статьи. Авторы также благодарят доктора Базиля Ша из исследовательской группы по социальным детерминантам здоровья и медико-санитарной помощи Французского национального института здоровья и медицинских исследований за его комментарии к окончательной версии рукописи.

ПРИЛОЖЕНИЕ

Среднее отношение шансов (MOR)

Отношение шансов между двумя людьми с идентичными ковариатами из двух разных кластеров равно exp ( u 1 - u 2 ), где u 1 и u 2 - две случайные переменные кластера. Следовательно, отношение шансов для человека с более высокой предрасположенностью по сравнению с человеком с более низкой предрасположенностью равно. Поскольку предполагается, что данные для двух переменных кластера являются независимыми и нормально распределенными со средним нулевым значением и дисперсией σ 2, распределение может быть охарактеризовано кумулятивным распределением F следующим образом. При z >0

где Φ (·) - кумулятивная функция распределения для стандартного нормального распределения, то есть нормального распределения со средним значением 0 и дисперсией 1. Таким образом, функция плотности f (·) для распределения принимает следующий вид:

MOR - это медиана этого распределения, поэтому его можно рассчитать как решение уравнения F ( z ) = 0,5, что приводит к

Интервальное отношение шансов (IOR)

Отношение шансов между двумя людьми из двух разных кластеров с ковариатами x1 и x2 равно exp (β × ( x1 - x2 ) + ( u 1 - u 2 )). Поскольку данные для двух переменных кластера независимы и нормально распределены, отношение шансов логнормально распределено с кумулятивной функцией распределения G , где для z >0

Следовательно, плотность g (·) становится

-Percentile в распределении отношение шансов подходит G ( г ) = , что приводит к

В частности, 10-й процентиль равен

и 90-й процентиль

РИСУНОК 1.Модель 1: плотность распределения логарифмических соотношений шансов между человеком с более высокой предрасположенностью к госпитализации по поводу ишемической болезни сердца и человеком с более низкой предрасположенностью. Среднее значение в распределении логарифмических отношений шансов составляет 0,16. MOR, медианное отношение шансов.

РИСУНОК 1.Модель 1: плотность распределения логарифмических соотношений шансов между человеком с более высокой предрасположенностью к госпитализации по поводу ишемической болезни сердца и человеком с более низкой предрасположенностью. Среднее значение в распределении логарифмических отношений шансов составляет 0,16. MOR, медианное отношение шансов.

РИСУНОК 2.Модель 2: плотность распределения логарифмических соотношений шансов между человеком из менее образованного района и человеком из более образованного района, когда люди принадлежат к одной возрастной группе и имеют одинаковый личный образовательный уровень. 10-й и 90-й процентили в распределении логарифмических отношений шансов составляют 0,07 и 0,41 соответственно. IOR, интервальное отношение шансов.

РИСУНОК 2.Модель 2: плотность распределения логарифмических соотношений шансов между человеком из менее образованного района и человеком из более образованного района, когда люди принадлежат к одной возрастной группе и имеют одинаковый личный образовательный уровень. 10-й и 90-й процентили в распределении логарифмических отношений шансов составляют 0,07 и 0,41 соответственно. IOR, интервальное отношение шансов.

Оценки и стандартные ошибки из анализа госпитализаций по поводу ишемической болезни сердца (модели 1 и 2) и посещения государственного врача (модели 3 и 4), Мальмё, Швеция, 1999 г.

Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Оценивать SE * Оценивать SE Оценивать SE Оценивать SE
Переменные с фиксированными эффектами ([EQUATION])
Возрастная группа (лет)
70–74 против 65–69 0,458 0,132 0,458 0,132 0,116 0,066 0,116 0,066
75–79 против 65–69 0,498 0,137 0,506 0,137 0,262 0,073 0,264 0,074
80–85 против 65–69 0,733 0,142 0,750 0,142 0,437 0,083 0,442 0,083
Образование (низкое или высокое) 0,223 0,116 0.200 0,117 0,243 0,062 0,239 0,062
Соседское образование (низкое или высокое) - † 0,236 0,088 - 1.018 0,266
Случайные эффекты ([УРАВНЕНИЕ])
Район 0,028 0,025 0,009 0,020 1,815 0,278 1,593 0,246
Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Оценивать SE * Оценивать SE Оценивать SE Оценивать SE
Переменные с фиксированными эффектами ([EQUATION])
Возрастная группа (лет)
70–74 против 65–69 0,458 0,132 0,458 0,132 0,116 0,066 0,116 0,066
75–79 против 65–69 0,498 0,137 0,506 0,137 0,262 0,073 0,264 0,074
80–85 против 65–69 0,733 0,142 0,750 0,142 0,437 0,083 0,442 0,083
Образование (низкое или высокое) 0,223 0,116 0.200 0,117 0,243 0,062 0,239 0,062
Соседское образование (низкое или высокое) - † 0,236 0,088 - 1.018 0,266
Случайные эффекты ([УРАВНЕНИЕ])
Район 0,028 0,025 0,009 0,020 1,815 0,278 1,593 0,246

* SE, стандартная ошибка.

Оценки и стандартные ошибки из анализа госпитализаций по поводу ишемической болезни сердца (модели 1 и 2) и посещения государственного врача (модели 3 и 4), Мальмё, Швеция, 1999 г.

Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Оценивать SE * Оценивать SE Оценивать SE Оценивать SE
Переменные с фиксированными эффектами ([EQUATION])
Возрастная группа (лет)
70–74 против 65–69 0,458 0,132 0,458 0,132 0,116 0,066 0,116 0,066
75–79 против 65–69 0,498 0,137 0,506 0,137 0,262 0,073 0,264 0,074
80–85 против 65–69 0,733 0,142 0,750 0,142 0,437 0,083 0,442 0,083
Образование (низкое или высокое) 0,223 0,116 0.200 0,117 0,243 0,062 0,239 0,062
Соседское образование (низкое или высокое) - † 0,236 0,088 - 1.018 0,266
Случайные эффекты ([УРАВНЕНИЕ])
Район 0,028 0,025 0,009 0,020 1,815 0,278 1,593 0,246
Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Оценивать SE * Оценивать SE Оценивать SE Оценивать SE
Переменные с фиксированными эффектами ([EQUATION])
Возрастная группа (лет)
70–74 против 65–69 0,458 0,132 0,458 0,132 0,116 0,066 0,116 0,066
75–79 против 65–69 0,498 0,137 0,506 0,137 0,262 0,073 0,264 0,074
80–85 против 65–69 0,733 0,142 0,750 0,142 0,437 0,083 0,442 0,083
Образование (низкое или высокое) 0,223 0,116 0.200 0,117 0,243 0,062 0,239 0,062
Соседское образование (низкое или высокое) - † 0,236 0,088 - 1.018 0,266
Случайные эффекты ([УРАВНЕНИЕ])
Район 0,028 0,025 0,009 0,020 1,815 0,278 1,593 0,246

* SE, стандартная ошибка.

Соотношение шансов госпитализации по поводу ишемической болезни сердца (модели 1 и 2) и посещения государственного врача (модели 3 и 4), Мальмё, Швеция, 1999 г.

Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Переменные с фиксированными эффектами, изменяющиеся в пределах кластера Соотношение шансов
Возрастная группа (лет)
70–74 против 65–69 1,58 1,58 1,12 1,12
75–79 против 65–69 1,65 1,66 1,30 1,30
80–85 против 65–69 2,08 2,12 1,55 1,56
Образование (низкое или высокое) 1,25 1,22 1,28 1,27
Случайные эффекты Среднее отношение шансов
Район 1.17 1.09 3,61 3,33
Переменные с фиксированными эффектами, постоянные в пределах кластера Отношение шансов интервалов
Соседское образование (низкое или высокое) - * [1.07; 1.50] - [0,28; 27,3]
Госпитализация Визиты к общественному врачу
Модель 1 Модель 2 Модель 3 Модель 4
Переменные с фиксированными эффектами, изменяющиеся в пределах кластера Соотношение шансов
Возрастная группа (лет)
70–74 против 65–69 1,58 1,58 1,12 1,12
75–79 против 65–69 1,65 1,66 1,30 1,30
80–85 против 65–69 2,08 2,12 1,55 1,56
Образование (низкое или высокое) 1,25 1,22 1,28 1,27
Случайные эффекты Среднее отношение шансов
Район 1.17 1.09 3,61 3,33
Переменные с фиксированными эффектами, постоянные в пределах кластера Отношение шансов интервалов
Соседское образование (низкое или высокое) - * [1.07; 1.50] - [0,28; 27,3]

Соотношение шансов госпитализации по поводу ишемической болезни сердца (модели 1 и 2) и посещения государственного врача (модели 3 и 4), Мальмё, Швеция, 1999 г.

ПОПУЛЯРНЫЕ СТАТЬИ