☰

精準治療時代的臨牀試驗設計

關注小藥說藥，一起成長！

前言

傳統腫瘤學臨牀實踐依賴於羣體平均受益，通常來自未經選擇的患者的隨機臨牀試驗，幾十年來一直是藥物批准的基石。習慣上，治療決定基於腫瘤起源器官。然而，隨着腫瘤基因組學研究的不斷深入，已經證明了一個具有挑戰性的現實：單個腫瘤，特別是轉移性腫瘤，是異常複雜的。由於這種顯著的腫瘤異質性，腫瘤的最佳治療需要針對個體進行定製。

因此，下一代的臨牀試驗設計需要以患者爲中心，即基於腫瘤生物標誌物匹配患者的治療藥物；而不是以藥物爲中心，即針對特定臨牀試驗匹配患者。傳統的隨機、以藥物爲中心的臨牀試驗很重要，因爲它們減弱了混雜因素的影響；然而，它們也很麻煩，成本高昂，需要大量患者證明其臨牀益處。與未使用生物標誌物選擇患者的臨牀試驗相比，基於生物標誌物的臨牀試驗與改善的響應率、無進展生存率（PFS）和總生存率（OS）相關。

多種新的臨牀試驗設計，包括籃式和傘式試驗、平臺試驗和N/1患者中心研究，開始取代標準的I、II和III期方案，加速了藥物的評估和批准。此外，真實世界數據、數字應用程序和人工智能的利用，可能進一步加速這個進程。總的來說，臨牀試驗目前的發展趨勢，已經從以腫瘤類型爲中心轉向基因導向和組織學不可知的試驗，以及基於個體生物標誌物的創新自適應設計和個性化的組合治療策略。

傳統的臨牀試驗設計

傳統的I期癌症臨牀試驗在相對較少的患者中評估研究藥物的安全性和活性。第二階段研究檢查療效（無隨機化）和毒性。III期隨機對照試驗比較了研究和標準治療的結果。第四階段試驗，也被稱爲上市後監測試驗，在監管部門批准後評估藥物的安全性和有效性。研究藥物從I期到III期臨牀試驗需要花費極高的成本，從數百萬美元到數十億美元。然而，從開始第一階段試驗到獲得FDA上市批准的時間近年來有所減少。2016年，據報道，這一時間跨度約爲12年，但根據最近FDA的批准，這一時間可能短至5年。此外，雖然藥物傳統上是在三期隨機對照試驗後由FDA批准，但近年來，FDA批准藥物的時間變短，包括在具有顯著反應率的情況下，僅在I期試驗後就批准上市。

腫瘤隨機臨牀試驗的成功率約爲38%。批准的金標準試驗是盲法隨機研究，因爲它最大限度地減少了偏差。然而，隨機試驗有其自身的侷限性。例如，隨機試驗中的對照組通常是次優的，有時由有效性很低的可用治療組成。例如，PD-1/PD-L1抑制劑在非小細胞肺癌（NSCLC）患者中顯示出顯著的臨牀益處，但在一些試驗中，這是因爲與安慰劑相比進行的評估。此外，一些評估晚期NSCLC患者二線治療藥物的臨牀試驗僅使用了具有適度臨牀效益的化療藥物，例如多西他賽（NCT04427072）。最後，由於患者的基線特徵、共病、獨特的腫瘤分子譜和微環境的巨大變異性，即使精心計劃的試驗也無法解釋隨機組之間的所有差異。因此，在藥物開發中人們採用了創新的試驗設計，這些設計可能效率更高，並解決以上的問題。

第一代精準臨牀試驗

新設計包括多種類型的研究，主要包括籃式、傘式和平臺設計，以及其它的特殊設計。最近的數據表明，新一代的臨牀試驗數量正在迅速增加。

籃子試驗

籃子試驗是評估針對常見泛癌基因缺陷藥物的組織不可知試驗。超過30種藥物正在籃子試驗中進行評估。使用籃子試驗的成功例子包括用於錯配修復缺陷/高微衛星不穩定性（dMMR/MSI-H）腫瘤的pembrolizumab、用於含有NTRK融合腫瘤的entrectinib和larotrectinib，以及用於高腫瘤突變負荷（TMB-H）的pembrolizumab。

Pembrolizumab是第一個獲得FDA批准的腫瘤不可知藥物，該批准基於五項單臂試驗的結果（KEYNOTE-016，KEYNOTE-164，Keynon-012，KEYNOTE-028，KEYNOTE-158）。15種不同MSI-H/dMMR腫瘤類型的患者接受了Pembrollizumab治療。客觀應答率（ORR）爲39.6%，78%的應答者響應持續時間≥6個月。FDA對NTRK抑制劑larotrectinib的批准基於三項單臂臨牀試驗（LOXO-TRK-14001、SCOUT和NAVIGAGE）。在三項試驗的55名患者（17種腫瘤類型）中，ORR爲75%。

這些試驗招募了經過大量治療的不同腫瘤類型患者，或標準治療已用盡的患者。此外，參與這些試驗的選定患者患有侵襲性癌症，治療選擇有限。在此類患者中，預期後期的抗癌治療會產生較低的應答率，但在上述試驗中靶向治療的應答率明顯高於標準治療的預期。

跨腫瘤類型的基因組生物標誌物的意義在於：對於許多腫瘤類型不會單獨研究的患者，可用於選擇主動免疫治療或基因導向治療的實施。此外，籃子試驗的侷限性包括定義腫瘤驅動因素改變及其相互作用的分子複雜性，導致對靶向治療的耐藥性以及缺乏比較，一個特別的挑戰是不同腫瘤類型中某些分子改變的罕見性。

傘式試驗

傘形試驗評估了單一組織不同基因組/生物標誌物亞組的多種治療方法。該設計的一個顯著優點是同時評估多種不同治療方案對特定腫瘤類型的療效，從而解決患者間的異質性。傘式設計要求準確選擇驅動因素和匹配的藥物。因此，開發具有高有效性和靈敏度的多重分析對於準確識別每個治療組的患者至關重要。

成功進行的傘式試驗包括肺癌患者的Lung-MAP和ALCHEMIST試驗，以及乳腺癌患者的I-SPY-2和plasmaMATCH試驗。Lung-MAP試驗旨在通過使用200種基因分子譜分析將患者與多個試驗子研究相匹配來提高入組效率，根據藥物性能添加或刪除藥物。在未接受免疫治療的晚期非小細胞肺癌患者中，將ipilimumab聯合nivolumab與改善的PFS或OS無關。durvalumab和tremelimumab的聯合治療在先前已進行免疫治療的晚期NSCLC患者中具有最小活性（ORR，7%）。

I-SPY-2的結果導致藥物開發加速，從1期研究無縫過渡到3期研究。此外，PlasmaMATCH研究表明，血源循環腫瘤DNA（ctDNA）分析可以有效地選擇晚期乳腺癌患者進行突變導向治療。

傘式試驗的侷限性包括在罕見疾病中特別困難，因爲分子亞羣可能非常小，因此患者招募有限，試驗可能需要很長時間才能完成。此外，具有多個分子改變的患者可能有資格接受多個臂的治療。最後，多重生物標誌物分析的開發和驗證比單一生物標誌物更復雜。

平臺試驗

當在單一方案中評估多個假設時，主方案被視爲平臺試驗，可以以較低的成本產生更快的結果。平臺試驗的設計可能高度可變，例如某些試驗結合了貝葉斯算法，該算法允許適應性決策，如在試驗運行時擴展或刪除研究臂。其對終點的評估是連續的，隨着每個患者的加入，數據被重新分析。

平臺試驗的缺點包括難以實施複雜的設計以及行政和後勤的複雜性。在大量患者中測試多個假設的選定試驗中，研究完成可能需要長期隨訪評估，有時會增加研究成本，儘管這些研究通常仍允許有效的藥物開發。統計分析的複雜性一直是一個重大挑戰，特別是在極端異質患者羣體的情況下。

2007年開始的IMPACT1試驗是第一個跨腫瘤類型的精準腫瘤學基因組驅動的平臺試驗。IMPACT1證明，在臨牀試驗中，難治性癌症患者可以成功地匹配到合適的靶向治療，與相同試驗中登記的未匹配患者相比，結果有所改善，具有更高的ORR（匹配16.4% vs 非匹配5.4%，p<0.0001），更長的PFS（4.0月對2.8月，p<0.0001），以及更高的10年OS率（6%對1%，p<0.001）。繼IMPACT1研究之後，IMPACT2試驗於2014年啓動。IMPACT2是一項隨機臨牀試驗，評估了腫瘤分子譜在晚期癌症患者中選擇靶向治療的應用（NCT02152254）。在IMPACT2試驗中，與IMPACT1和其他精確腫瘤平臺試驗相比，患者被隨機分配接受基於腫瘤基因組改變分析選擇的治療。

其它平臺試驗還包括TAPUR、NCI-MATCH、DART和STAMPEDE等。目前已報告了TAPUR、NCI-MATCH和STAMPEDE試驗的選定治療組的結果，但其它多個治療組仍在評估中。這些平臺試驗的最終目標是作爲單一方案的一部分，平行有效地評估多個治療組，從而降低成本，及時獲得療效和毒性數據。

Octupus試驗

Octupus試驗是一個完整的I/II期試驗，評估多種藥物與主幹藥物的組合。例如QUIST-3.055研究，是一項IIb期對先前接受過免疫檢查點抑制劑治療的患者的聯合免疫療法研究，評估N-803與PD-1/PD-L1免疫檢查點抑制劑的不同組合的多因素研究。

QUILT-3.055研究的初步結果表明，IL-15受體激動劑N-803與各種檢查點抑制劑聯合使用，對先前在免疫治療中進展的不同腫瘤類型患者具有很好的療效。該研究設計能夠同時研究不同的治療組，從而可能識別出一種以上的有效藥物組合。

自適應設計

自適應設計使研究的動態發展成爲可能，通過早期丟棄無效的試驗臂，增加患者隨機分組以獲得更有效的治療，同時根據實時臨牀結果改進生物標誌物選擇。因此，與傳統的隨機試驗相比，這些試驗需要更少的參與者和更短的隨訪時間。添加新臂同時去除效果不佳的試驗臂是一個顯著優勢。然而，早期去除治療組可能存在侷限性，包括缺乏關於安全性或其他次要結果的令人信服的數據。後勤複雜性和對及時、高質量、密集的統計監測的需求是適應性試驗中經常遇到的挑戰。最後，不斷需要調整設計可能會使結果難以解釋。

近年來，自適應設計越來越多地應用於臨牀試驗。適應性試驗的一個例子是I-SPY-2試驗，這是一項多中心、II期、隨機臨牀試驗。該試驗包括多個治療組，與單獨標準治療相比，同時評估標準新輔助化療聯合創新藥物的療效。未被發現有效的治療組從研究中退出，而其他顯示出臨牀益處的治療組正在推進。I-SPY-2是第一批評估在乳腺癌新輔助化療中添加免疫治療的試驗之一。與單獨的標準治療相比，在治療三陰性乳腺癌患者時添加Pembrolizumab導致病理完全應答率增加3倍（60%對22%）。這項試驗特別重要，因爲它爲患者在病程早期提供了新的治療方法。

無縫設計

伸縮式臨牀試驗無縫地從I期過渡到II期和/或III期臨牀試驗，從而將所有階段合併到單個試驗中。這種設計可以縮短藥物開發的時間，並顯著降低管理成本。無縫策略的其他優勢包括：只選擇有前景的藥物用於後期試驗階段，同時放棄早期失敗的藥物；評估與其他治療藥物的組合；並在下一個試驗階段關注應答亞羣。

除了複雜的設計，在使用無縫設計進行試驗時還面臨其它挑戰。例如，在完成研究所需的較長時間內，情況可能會發生變化，實驗藥物可能會獲得監管批准，而難以解釋結果。重要的是，將第一階段的數據納入第二階段和第三階段，特別是在反應和毒性方面，具有挑戰性，因爲試驗是在第一階段和第二階段發生之前設計的。

GBM AGILE是一項多臂、無縫、II/III期平臺試驗。該試驗包括兩個階段；第一階段是貝葉斯自適應隨機篩選階段，根據與普通對照相比對OS的影響確定有效治療。該階段還評估臨牀指徵和生物標誌物狀態，以確定治療最有希望的人羣。第二階段使用固定隨機化來確認第一階段的結果。GBM AGILE試驗的意義在於識別生物標誌物，預測在這種難治療患者羣體中使用的創新藥物的益處。重要的是，本試驗採用無縫設計，以便及時確認所選治療的臨牀益處，併爲預後不良的患者提供額外的治療選擇。該研究結果正在等待中。

下一代精準臨牀試驗

N-of-1試驗

在精準醫學的背景下，N-of-1試驗是以患者爲中心的試驗，評估定製/個體化治療組合。結果通常與歷史或現實世界的結果數據進行比較。當評估匹配程度時，評估的是用於將患者與藥物匹配的算法策略，而不是藥物方案本身，因爲後者因患者而異。N-of-1研究側重於通過個性化組合解決分子複雜和異質性癌症，優化治療選擇。

I-PREDICT是第一個前瞻性試驗，該試驗評估了不同難治性腫瘤類型患者的個體化治療，最近評估了轉移性致命癌症患者的治療。多學科分子腫瘤委員會定製多種藥物組合，通過腫瘤基因組分析、ctDNA分析、PD-L1表達、激素狀態以及TMB和MSI狀態評估，每個患者使用評分系統計算“匹配分數”。較高的“匹配分數”與較高的疾病控制、PFS和OS率相關。正在進行的N-of-1試驗正在評估不同腫瘤類型患者的新組合。此外，另一項WINTHER試驗是另一項N-of-1試驗，是第一項將患者引導到基於基因組學或轉錄組學的個性化治療組合的精準醫學研究。

家庭試驗

爲了擴展遠程醫療技術，現在出現了一種創新的無站點臨牀試驗設計。一些公司正在對癌症患者和其他疾病患者進行家庭臨牀試驗。這些試驗使無法出行和參加傳統的現場臨牀試驗的患者能夠獲得藥物。此外，以家庭爲基礎的試驗有助於患者招募，使更具代表性的患者羣體能夠被納入，並通過讓患者在舒適的家中參與，潛在地提高註冊率。患者由廣泛的調查人員和家庭保健護士網絡護理，他們使用數字技術確保患者的健康，缺點可能包括不良事件監測和治療反應不及時。

第一個基於家庭的腫瘤學試驗之一是評估alectinib在極罕見、局部晚期或轉移性ALK陽性實體瘤（Alpha-T，NCT04644315）中的療效和安全性。這是一項II期、單臂、組織不可知的試驗設計。研究人員可通過研究平臺請求訪問個別患者，患者必須願意遵守研究程序，包括居家護理和流動護士探視。

小結

分子技術的顯著進步在十年前幾乎是不可想象的，現在已經可以對腫瘤生物學進行深入的研究和患者治療的定製，這使得臨牀試驗設計發生了一場革命。

最新的試驗設計創新與傳統試驗設計的根本區別在於，它們以患者爲中心，藥物適應患者，而不是以藥物爲中心，患者適應藥物試驗。新一代精準藥物試驗設計已經產生了很好的應答率，最高的應答率，達到75%。N-of-1試驗也在難治性癌症中產生了45%的應答率，這些試驗強調需要解決轉移性癌症往往具有複雜的生物學基礎，並且每種癌症可能是獨特的這一事實。

然而，新的試驗設計也仍然存在許多挑戰，包括確定哪些分子改變是驅動因素還是次要因素，以及如何協調以精準醫學患者爲中心的模型與新藥監管授權需求，以及如何以可驗證的方式有效而準確地利用多種新類型的試驗設計。這些問題的解決，將爲癌症患者以快速和高效的方式推動該領域向前發展。

參考文獻：

1.Clinical trial design in the era of precision medicine. Genome Med.2022; 14: 101.

公衆號內回覆“腫瘤免疫”或掃描下方圖片中的二維碼免費下載《小藥說藥腫瘤免疫全集》的PDF格式電子書！

公衆號已建立“小藥說藥專業交流羣”微信行業交流羣以及讀者交流羣，掃描下方小編二維碼加入，入行業羣請主動告知姓名、工作單位和職務。

精準治療時代的臨牀試驗設計

相關資訊