Могут ли испытания лекарства от ВИЧ обеспечить баланс между потребностью в значимых данных и безопасностью участников?

Elle Aon/Shutterstock.com

Недавний анализ показывает, что в исследованиях по лечению ВИЧ до сих пор участвовало недостаточно участников, чтобы определить, когда лечение приносит умеренную пользу. В результате исследователи могут упустить возможность изучить и усовершенствовать комбинации лекарственных препаратов, которые в конечном итоге могли бы привести к излечению. Д-р Джиллиан Лау, д-р Дебора Кромер и их коллеги, чей анализ был опубликован в журнале Journal of Infectious Diseases, предлагают гибридный дизайн исследования, который позволит максимально повысить эффективность лечения при минимальном риске для участников.

Фон

Испытания по излечению от ВИЧ часто включают в себя “перерыв в аналитическом лечении”, который требует от людей с ВИЧ, участвующих в них, прекратить прием антиретровирусной терапии (АРТ), чтобы ученые могли наблюдать, как неконтролируемый ВИЧ реагирует на оцениваемые лекарства.

Участие в подобных клинических испытаниях может оказаться непростой задачей для человека с ВИЧ, который привык поддерживать неопределяемую вирусную нагрузку. Кроме того, предыдущее исследование, проведенное доктором Лау, показало, что многие люди с ВИЧ не были уверены в том, как работают испытания на излечение, и многие не были готовы к длительным периодам с выявляемой вирусной нагрузкой.

Исследователи ВИЧ-инфекции разрабатывают различные стратегии, чтобы попытаться вылечить ВИЧ. Некоторые методы лечения направлены на сокращение латентного резервуара ВИЧ-инфекции, которым являются иммунные клетки, инфицированные ВИЧ, но которые не продуцируют новый ВИЧ в течение многих месяцев или лет. Другие методы лечения направлены на повышение способности иммунной системы контролировать ВИЧ.

Существует два типа аналитических исследований по прерыванию лечения, используемых для оценки потенциальных методов лечения: исследования времени до вирусного отскока (TVR) и контрольные исследования. В исследованиях TVR, после того как участники прекращают АРТ, исследователи измеряют время, необходимое для того, чтобы вирусная нагрузка достигла определяемого уровня (50), а затем время, необходимое для достижения более высокого порога (часто 10 000), после чего участники возобновляют АРТ. Когда участникам, получающим лечение, требуется больше времени, чтобы достичь этих пороговых значений по сравнению с контрольной группой, это указывает на то, что терапия замедляет распространение вируса. Исследования TVR часто используются для оценки методов лечения, нацеленных на резервуар, и обычно они длятся всего несколько недель.

В контрольных исследованиях, как правило, оценивается, насколько хорошо иммунная система участников контролирует ВИЧ. В этих более длительных исследованиях (часто продолжающихся месяцы) исследователи позволяют вирусной нагрузке участников достичь высоких уровней, чтобы увидеть, сможет ли их иммунная система в конечном итоге контролировать вирус при нагрузках ниже первоначального уровня. Порог для возобновления АРТ-терапии обычно устанавливается на более высоком уровне (часто 100 000). Когда участники, проходящие лечение, могут контролировать ВИЧ при более низких уровнях вирусной нагрузки и в течение более длительного периода времени, чем в контрольной группе, это говорит о том, что терапия повышает их иммунитет к вирусу.

Хотя никаких конкретных рекомендаций, определяющих, как проводить исследования по прерыванию лечения, нет, в 2018 году группа исследователей ВИЧ собралась, чтобы обсудить этические аспекты и рекомендовать практические действия для снижения риска. Прекращение АРТ на время проведения этих исследований не только подвергает участников риску длительного выявления, а в некоторых случаях и высокой вирусной нагрузки, что увеличивает риск заболевания. Более высокая вирусная нагрузка также может привести к заражению ВИЧ-отрицательных половых партнеров участников.

До настоящего времени в большинстве исследований риск был снижен благодаря небольшому числу участников и отказу от использования контрольной группы, принимающей неактивное плацебо вместо лечения. Включение контрольной группы обычно важно, поскольку позволяет исследователям сравнить реакцию тех, кто принимает лекарства, и тех, кто их не принимает. Однако научное сообщество обсуждает этичность использования контрольных групп в такого рода испытаниях на излечение, поскольку они подвергают этих людей длительным периодам повышенной вирусной нагрузки без получения каких–либо – даже экспериментальных – лекарств.

Учеба

Доктор Лау и его коллеги использовали данные предыдущих клинических испытаний для создания математических моделей, которые позволили им оценить, как различные параметры клинического дизайна влияют на статистическую достоверность исследования.

Статистическая эффективность аналогична чувствительности тестирования. Например, тест на ВИЧ с чувствительностью 80% успешно выявил бы 80% людей, которые на самом деле являются ВИЧ-инфицированными, и не выявил бы 20% ВИЧ-положительных людей. Когда клиническое исследование, оценивающее лечебную терапию, рассчитано на достижение 80%-ной статистической достоверности и предполагает, что лечение действительно приносит пользу тем, кто его принимает, то вероятность выявления пользы в ходе исследования составляет 80%, а вероятность ее отсутствия – 20%.

Проще говоря, чем больше данных содержится в исследовании, тем большей статистической достоверностью оно обладает. Такие параметры, как количество участников, количество контрольных групп, продолжительность исследования и частота проведения анализов крови, влияют на статистическую достоверность исследования.

Результаты моделирования TVR-исследования

Лау и его коллеги смоделировали исследования TVR, рассчитанные на достижение 80%-ной статистической достоверности, чтобы увидеть, как количество участников, контрольные группы, продолжительность и частота проведения анализов крови влияют на их способность выявлять “снижение частоты реактивации”.

Этот термин относится к реактивации латентных клеток в резервуаре ВИЧ. Латентные клетки в резервуаре периодически и (как полагают ученые) случайным образом активизируются, производя больше вируса ВИЧ. Эта реактивация может привести к тому, что латентные клетки начнут продуцировать вирус, но при успешной АРТ вирусная нагрузка у человека остается неопределяемой, поскольку комбинация препаратов эффективно контролирует ее. При отсутствии АРТ, как и при испытаниях на прерывание лечения, когда латентные клетки реактивируются, они в конечном итоге продуцируют достаточно вируса для обнаружения. Когда исследователи оценивают способность терапии “снижать частоту реактивации”, на практике они оценивают способность терапии замедлять восстановление вирусной нагрузки после прекращения АРТ.

Анализ недавнего исследования TVR, в котором приняли участие 13 участников, показал, что их модель показала, что при 80%-ной мощности в ходе исследования были обнаружены методы лечения только с очень большим снижением реактивации (от 70 до 80%). Для того чтобы исследование TVR выявило снижение реактивации всего на 30%, потребуется 120 участников как в группе лечения, так и в контрольной группе. Поскольку в большинстве исследований TVR задействовано небольшое количество участников, они, скорее всего, не выявят значительных преимуществ лечения.

Может показаться нелогичным разрабатывать исследования по лечению для выявления более низких результатов лечения, когда конечной целью является получение максимально возможной пользы (т.е. лечение, которое приводит к 100%-ному снижению реактивации). Однако доктора Лау и Кромер сказали aidsmap.com что, поскольку мы находимся на начальной стадии поиска лекарства, нам необходимо определить, когда терапия приносит умеренную пользу, чтобы решить, заслуживает ли она дальнейшего изучения.

“Выплескиваем ли мы ребенка вместе с водой из ванны, когда отказываемся от всех этих исследований, потому что не видим разницы? И не упускаем ли мы чего-то из-за того, что они не были способны выявлять небольшие различия, которые мы могли бы использовать в дальнейшем и извлечь из них уроки?” Спросил доктор Кромер. “Независимо от того, как мы проводим эти исследования, мы будем упускать что-то из виду, потому что мы просто не рассматриваем достаточное количество людей”, – сказала она.

В дополнение к рекомендации большего числа участников, команда предлагает использовать “исторический контроль” для дополнения контрольных групп. Исторические данные из предыдущих исследований, в которых люди прерывали АРТ, могут увеличить количество включенных контрольных групп и улучшить способность исследования выявлять меньшие преимущества лечения. Они смоделировали гипотетическое исследование TVR, в котором приняли участие 50 участников и 50 контрольных групп. При 80%-ной мощности такая конструкция позволяет обнаруживать снижение реактивации до 43%. Добавление 150 контрольных данных за прошлые периоды (всего 200 контрольных данных) позволило бы в ходе того же испытания обнаружить снижение до 36%.

Это может быть незначительным улучшением, но использование исторического контроля может также уменьшить размер контрольной группы. “Возможно, нам даже не обязательно проводить настоящие плацебо-контролируемые исследования в будущем, если мы сможем получить доступ к историческим данным за 20 лет”, – сказал доктор Лау. Например, доктор Лау сказал, что если использование исторических данных может снизить вероятность попадания человека в группу плацебо с обычных 50% до 25%, то, возможно, больше людей захотят принять участие в этих исследованиях.

Их моделирование также показало, что практически не улучшилась способность выявлять снижение реактивации при увеличении продолжительности испытаний TVR более чем на пять недель. После этого их модель предсказывала улучшение в выявлении не более чем на 1%. Аналогичным образом, они не обнаружили практически никакой пользы от проведения лабораторного мониторинга чаще, чем раз в неделю. Наблюдение за людьми два раза в неделю едва позволило выявить снижение реактивации на 1%.

Исследователи провели отдельный анализ, чтобы оценить максимальный риск заражения ВИЧ во время исследований TVR, основываясь на предыдущих исследованиях, в которых оценивалась вероятность передачи инфекции при различных уровнях вирусной нагрузки, превышающих выявляемый предел. Они оценили максимальный риск передачи инфекции при условии, что участники занимались незащищенным сексом и что PrEP или другие стратегии профилактики не использовались. Кроме того, если еженедельный мониторинг не включает в себя отчетность о вирусной нагрузке в тот же день, то участник, которому необходимо возобновить АРТ (поскольку его вирусная нагрузка превысила 1000), скорее всего, будет задержан до следующего еженедельного визита, прежде чем сделать это.

Для этого сценария они подсчитали, что максимальный риск передачи инфекции в течение пятинедельного исследования TVR с порогом вирусной нагрузки 1000 для повторного начала АРТ составлял 3,6 из 1000 участников, занимавшихся гетеросексуальным сексом. Для тех, кто занимался проникающим анальным сексом, максимальный риск составлял около 7 из 1000, а для тех, кто занимался восприимчивым анальным сексом, максимальный риск составлял около 70 из 1000. Изменение структуры исследования, включающее быстрое тестирование на вирусную нагрузку и возобновление АРТ в тот же день, снижает предполагаемый максимальный риск до 0,9 из 1000 при гетеросексуальном сексе, 1,8 из 1000 при инсертивном анальном сексе и примерно до 18 на 1000 при рецептивном анальном сексе.

Результаты моделирования для исследования заданных значений

Поскольку контрольные исследования обычно оценивают иммунный контроль над ВИЧ, одна из сложностей заключается в том, что у некоторых людей, так называемых контролеров после лечения, иммунная система от природы хорошо справляется с ВИЧ после прекращения АРТ. Предыдущее исследование, получившее название CHAMP, показало, что около 4% людей с ВИЧ продолжали лечение (в этом исследовании это были люди, у которых вирусная нагрузка была ниже 400 по крайней мере в течение двух третей времени в течение 48 недель после прекращения АРТ). Исследование также показало, что контроль после лечения проводился гораздо чаще – примерно в 13% случаев – среди людей, которые начали лечение вскоре после заражения ВИЧ.

Исследования с установленными показателями должны обладать достаточной статистической достоверностью, чтобы проводить различие между преимуществами предлагаемой лечебной терапии и контролерами после лечения, которые продемонстрировали бы некоторую степень иммунного контроля после прекращения АРТ с предлагаемой лечебной терапией или без нее. Используя результаты исследования CHAMP, исследователи предположили, что исходный уровень контроля после лечения был ниже на 4%. Если целью исследования было выявить увеличение числа контролеров до 20% (это означает, что терапия помогла людям, которые не являются естественными контролерами после лечения, подавить вирус), их модель показала, что 24-недельное контрольное исследование со статистической достоверностью 80% позволило бы нужно 60 участников.

Из-за чрезвычайно высокой вирусной нагрузки в типичных исследованиях с установленными показателями (до 100 000) авторы сравнили, как использование более консервативного порога (1000) для возобновления АРТ повлияет на способность исследований с установленными показателями выявлять увеличение числа контролеров после лечения. Исследование CHAMP показало, что у 55% контролеров после лечения наблюдались первоначальные всплески вирусной нагрузки ниже 1000, и они продолжали контролировать вирусную нагрузку ниже 1000.

Используя эти данные, Лау и Кромер предположили, что использование порога в 1000 копий позволит замаскировать 45% контролеров после лечения, что затруднит обнаружение (снизит эффективность) случаев, когда терапия усиливает иммунный контроль участников над ВИЧ. Чтобы восстановить эффективность, потребуется больше участников. Как и в приведенном выше примере, предполагая 80-процентную мощность и цель выявления 20-процентного увеличения числа контролеров после лечения по сравнению с исходным уровнем в 4%, более низкий порог вирусной нагрузки повысил бы количество участников с 60 до 120 как в группе лечения, так и в контрольной группе.

Как и в случае с исследованиями TVR, исследователи также оценили максимальный риск передачи ВИЧ во время контрольных исследований, используя те же допущения, которые были описаны выше (отсутствие стратегий профилактики, незащищенный секс, отсутствие экспресс-тестирования на вирусную нагрузку и недельная задержка перед возобновлением АРТ). Из-за гораздо большей продолжительности испытаний и более высоких пороговых значений вирусной нагрузки (для этого они сослались на исследование с заданными показателями, в котором было задействовано 50 000 человек), они подсчитали, что максимальный риск передачи ВИЧ составляет 13 на 1000 при гетеросексуальном сексе, около 25 на 1000 при анальном сексе с проникновением и невероятно высокий показатель – 214 на 1000 для чувственного анального секса.

Предлагаемый дизайн гибридного испытания

Исследование заданных значений, как правило, более надежное, поскольку оно более продолжительное и генерирует больше данных, что означает, что оно, как правило, обладает большей статистической достоверностью, чем более короткие исследования TVR. “В этой статье говорится о том, что, по нашему мнению, соотношение между мощностью, которую вы получаете, не всегда является достаточным для того, чтобы оправдать повышенный риск, связанный с исследованием заданного значения”, – сказала доктор Дебора Кромер.

Основываясь на своем моделировании и оценках максимального риска передачи инфекции, исследователи предлагают использовать гибридную модель для испытаний по прерыванию лечения. В предлагаемой ими схеме испытания по прерыванию лечения должны начинаться с пятинедельного исследования TVR в соответствии с их выводами о том, что по истечении этого срока никаких преимуществ в выявлении не возникает. Хотя исследования TVR, как правило, используются, когда терапия нацелена на резервуар ВИЧ, у людей, реагирующих на терапию, направленную на повышение иммунитета, также наблюдается более медленное восстановление вирусной активности (если лечение было эффективным).

Начало испытания для оценки потенциального излечения с помощью исследования TVR позволило бы участникам значительно сократить продолжительность перерывов в лечении и в то же время позволило бы исследователям определить, показало ли это лечение достаточную пользу для перехода к более длительному исследованию с установленными значениями. Если клиницисты согласятся с необходимостью дальнейшего исследования и пациенты с вирусной нагрузкой ниже 1000 согласятся перейти к следующему этапу, они будут продолжать тщательное наблюдение в течение 24 недель или до тех пор, пока вирусная нагрузка участников не превысит 1000, после чего они возобновят АРТ.

Исследователи рекомендуют провести экспресс-тестирование на вирусную нагрузку и возобновить АРТ в тот же день, чтобы свести к минимуму риск передачи инфекции. По их оценке, ограничение контрольной дозы для тех, у кого уже наблюдается контроль над вирусной нагрузкой ниже 1000, снижение порога вирусной нагрузки для возобновления АРТ до 1000, ограничение продолжительности АРТ до 24 недель и включение тестирования на месте оказания медицинской помощи и АРТ в тот же день снижает максимальный риск передачи инфекции до 0,2 на 1000 для гетеросексуального секса, 0,35 на 1000 для вводного анального секса и 3,1 на 1000 для рецептивного анального секса — это значительное улучшение по сравнению с их оценкой для традиционных исследований с установленными показателями.

Если первоначальное исследование TVR покажет, что лечение не требует дальнейшего изучения (например, если не будет обнаружено никакой пользы), то исследователи смогут избежать затрат на проведение длительного исследования заданных значений.

Выводы

Исследователи пришли к выводу, что в исследованиях cure участвует недостаточно участников, что дает им достаточную статистическую силу для выявления умеренных преимуществ лечения. Поскольку в большинстве исследований cure также не используются контрольные рычаги, количественно оценить пользу от лечения чрезвычайно сложно. Исследователи рекомендуют сотрудничать в создании базы данных исторического контроля, которая позволила бы планировать исследования, не полностью полагаясь на контрольные группы плацебо. Однако они отмечают, что использование исторических контрольных данных означает включение людей, которые с большей вероятностью начали АРТ во время хронической ВИЧ-инфекции, и людей, использующих более старые препараты для АРТ, что может привести к путанице.

Тем не менее, сокращение числа людей, получающих плацебо, пороговых значений вирусной нагрузки, продолжительности испытаний и рисков передачи ВИЧ, может побудить большее число людей с ВИЧ участвовать в исследованиях по прерыванию лечения.

Хотя исследователи рекомендовали гибридный дизайн исследования, доктор Лау сказал, что они не намерены использовать этот подход в каждом будущем исследовании. Вместо этого они хотят, чтобы врачи, занимающиеся лечением ВИЧ, взвесили преимущества изучения чего-то, что способствует разработке лекарства, и риски, с которыми сталкиваются участники (и их сексуальные партнеры). “Где мы находим этот баланс и может ли эта гибридная модель изменить его в сторону чего-то более безопасного, научно обоснованного и более приемлемого для участников испытаний?”

Рекомендации

Лау Джей и др. Баланс статистической достоверности и риска при разработке клинических исследований по лечению ВИЧ. Журнал инфекционных заболеваний, онлайн-версия перед печатью, 2 февраля 2022 г.

doi: 10.1093/infdis/jiac032