복제 위기에도 살아남은 효과 — 작업동맹과 치료 성과의 7년 재현
복제 위기 속에서도 r=.275에서 r=.278로 그대로 재현된 작업동맹–치료 성과 상관. 두 메타분석이 보여 준 임상적 의미와 실천 전략을 정리합니다.

핵심 답변
Horvath 등(2011)의 메타분석은 200편 이상의 연구, 14,000건 이상의 치료 사례를 통합하여 작업동맹과 치료 성과의 상관을 r=.275(95% CI [.25, .30])로 산출하였습니다. 7년 뒤 Flückiger 등(2018)이 표본을 31,000명 이상으로 확장해 재분석한 결과, 이 값은 r=.278로 거의 동일하게 유지되어 복제 안정성을 확인하였습니다. Bordin(1979)이 정의한 작업동맹의 세 요소—유대, 목표 합의, 과제 합의—를 이해하고 이를 임상 루틴에 통합하는 것이, 복제 위기 시대에도 근거 기반 실천의 핵심임을 이 연구들은 일관되게 보여 줍니다.
내 임상은 단단한 근거 위에 있는가 — 복제 위기에도 살아남은 작업동맹 연구
상담 선생님들, "심리학 복제 위기(replication crisis)"라는 말을 처음 접했을 때 잠시 흔들린 경험이 있으신가요? 내가 매일 임상 현장에서 하는 이 일이 정말 단단한 근거 위에 있는가라는 의심은, 경력과 무관하게 임상가라면 한 번쯤 안고 가는 질문입니다. 많은 심리학 연구 결과가 재현에 실패하는 시대에, 임상 실천의 토대 자체가 흔들리는 느낌은 결코 사소한 불안이 아닙니다.
Horvath, Del Re, Flückiger, Symonds(2011)의 메타분석은 바로 그 의심에 답을 건네는 연구입니다. 200편 이상의 보고서와 14,000건 이상의 치료 사례를 통합하여 작업동맹(working alliance)과 치료 성과의 상관을 r=.275로 산출하였습니다. 7년 뒤, 더 큰 메타분석에서 이 값은 r=.278로 거의 그대로 재현되었습니다. 복제 위기 한복판에서 이만큼 안정적으로 살아남은 심리치료 효과는 흔치 않습니다. 이 글에서는 Horvath 등(2011)의 메타분석 결과, 재현 안정성의 임상적 의미, 작업동맹이 단순한 만족도를 넘어서는 이유, 그리고 동맹을 임상 루틴으로 통합하는 방법을 정리합니다.
Horvath 등(2011): 메타분석의 규모와 핵심 결과
Horvath, Del Re, Flückiger, Symonds(2011)의 메타분석은 작업동맹 연구의 이정표입니다.
| 항목 | 내용 |
|---|---|
| 분석 대상 | 200편 이상의 보고서, 190개 독립 데이터셋 |
| 표본 크기 | 14,000건 이상의 치료 사례 |
| 주요 결과 | 작업동맹–성과 상관 r=.275 (95% CI [.25, .30]) |
| 효과 크기 해석 | 성과 분산의 약 7.5%를 단일 변수가 설명 |
이 r=.275라는 값이 어느 정도의 효과인지 맥락이 필요합니다.
대부분의 심리치료 기법 개입 효과보다 크거나 비슷한 수준입니다. 특정 진단에 특화된 기법들이 추가로 설명하는 성과 분산 크기와 비교했을 때, 작업동맹은 그에 못지않게 강력한 성과 예측 변수입니다.
7년 후 재현: Flückiger 등(2018)이 확인한 안정성
2018년 Flückiger, Del Re, Wampold, Horvath는 295개 연구, 31,000명 이상의 데이터로 훨씬 더 큰 메타분석을 수행하였습니다.
| 항목 | Horvath 등(2011) | Flückiger 등(2018) |
|---|---|---|
| 분석 연구 수 | 200+ | 295 |
| 표본 크기 | 14,000+ | 31,000+ |
| 작업동맹–성과 상관 | r=.275 | r=.278 |
| 95% 신뢰 구간 | [.25, .30] | 유사 |
r=.275에서 r=.278. 표본이 두 배 이상 늘었는데도 값이 거의 그대로입니다. 이것이 복제 안정성(replication stability)입니다. 많은 심리학 연구가 더 큰 표본에서 원래 효과의 절반 이하로 줄어드는 것과 뚜렷이 대비됩니다.
왜 이 효과는 복제 위기에서 살아남았는가
작업동맹–성과 효과가 복제 위기에서 살아남은 이유는 여러 각도에서 분석됩니다.
첫째, 이 효과는 단일 연구팀의 결과가 아닙니다. 전 세계 수백 명의 연구자가 서로 다른 맥락, 다른 진단, 다른 측정 도구, 다른 치료 방식에서 유사한 값을 산출하였습니다. 특정 연구실 편향이나 출판 편향이 이 패턴을 만들기는 어렵습니다.
둘째, 측정자와 무관하게 일관됩니다.
| 평정자 | 작업동맹–성과 상관 |
|---|---|
| 내담자 자기보고 | 유의한 상관 |
| 치료자 평정 | 유의한 상관 |
| 외부 관찰자 평정 | 유의한 상관 |
내담자가 경험하는 동맹이든, 치료자가 인식하는 동맹이든, 제3자가 관찰하는 동맹이든 — 모두 성과와 유의하게 연관됩니다.
셋째, 치료 단계와 무관하게 안정적입니다. 초기 동맹 측정이든, 중기든, 후기든 유사한 상관이 유지됩니다.
작업동맹은 단순한 만족도를 넘어섭니다
작업동맹을 "내담자가 치료에 만족하는지"로만 이해한다면 임상적 함의가 절반에 그칩니다.
Bordin(1979)이 정의한 작업동맹의 세 요소는 더 정교합니다.
유대(Bond)는 치료자-내담자 사이의 신뢰와 정서적 연결입니다.
목표 합의(Goals)는 치료가 향해가는 목표를 두 사람이 함께 이해하고 동의하는 것입니다.
과제 합의(Tasks)는 그 목표에 도달하기 위해 회기에서 하는 작업의 방식과 의미를 내담자가 받아들이는 것입니다.
내담자가 "치료자가 좋다"고 느끼는 것만으로는 부족합니다. "우리가 같은 방향을 보고 있고, 지금 하는 작업이 그 방향으로 가는 의미 있는 일이다"라는 공유된 이해가 작업동맹의 핵심입니다.
동맹을 임상 루틴으로 만드는 5단계
1. 첫 회기에서 목표와 과제를 명시적으로 합의하기
목표 합의와 과제 합의가 작업동맹의 두 요소입니다. 첫 회기에서 "우리가 이 치료에서 어떤 방향을 향해 갈 건지, 그러기 위해 회기에서 어떤 작업을 할 건지"를 명시적으로 나누는 것이 동맹 형성의 구조적 기초입니다.
2. 동맹의 변화를 매 회기 모니터링하기
ORS(Outcome Rating Scale)와 SRS(Session Rating Scale) 같은 단문 척도로 매 회기 동맹 수준을 추적하는 것이 효과적입니다. 동맹이 갑자기 낮아진 회기를 파악하는 것이 파열 조기 감지의 첫 번째 방법입니다.
3. 동맹 상태를 사례개념화에 통합하기
사례개념화를 내담자의 증상과 역사에만 국한하지 않는 것이 중요합니다. "이 내담자와의 동맹 수준이 지금 어디에 있는가"를 사례개념화의 한 축으로 포함하면 개입 방향이 구체화됩니다.
4. 내담자의 동맹 경험을 직접 물어보기
"오늘 회기가 도움이 됐나요?", "혹시 오늘 제가 놓친 부분이 있었나요?"처럼 내담자에게 직접 동맹 경험을 묻는 것이 가장 단순하고 효과적인 동맹 모니터링입니다.
5. 동맹 저하를 사례 실패의 신호가 아닌 작업 자료로 보기
동맹이 낮아진 것이 파열의 신호이고, 파열 수복이 치료 성과를 높이는 기회라는 관점이 작업동맹 연구의 임상적 결론입니다. 동맹 저하를 두려워하기보다 탐색하는 태도가 필요합니다.
결론: 관계에 투자하는 임상 실천은 근거가 있습니다
복제 위기 한복판에서도, 7년의 시간이 흘러도, 31,000명 이상의 데이터 앞에서도 작업동맹과 치료 성과의 연관은 흔들리지 않았습니다. 이것은 임상가에게 명확한 메시지입니다. 관계에 투자하는 것, 동맹을 모니터링하는 것, 파열을 알아차리고 수복하는 것 — 이것이 근거 기반 임상(evidence-based practice)의 핵심입니다. 선생님들이 매 회기 내담자와 쌓아가는 동맹은, 수십 년의 연구가 반복적으로 확인해 온 단단한 토대 위에 놓여 있습니다. 마음토스의 사례 기록 기능을 활용하면 회기별 동맹 수준 추적, 파열 관찰, 동맹 변화 패턴을 체계적으로 기록하고 사례개념화를 심화하는 데 도움이 됩니다.
상담사를 위한 가장 안전한 AI 에이전트, 마음토스
무료로 시작하기참고 자료
- 1.
작업동맹–치료 성과 메타분석. 190개 독립 데이터셋, 14,000건 이상 치료 사례, r=.275 산출.
- 2.
295개 연구, 31,000명 이상 대상 확장 메타분석. r=.278로 복제 안정성 확인.
자주 묻는 질문
작업동맹이 치료 성과에 미치는 효과 크기가 어느 정도인가요?
Horvath 등(2011)의 메타분석에서 작업동맹과 치료 성과의 상관은 r=.275(95% CI [.25, .30])로, 성과 분산의 약 7.5%를 단일 변수가 설명하는 수준입니다. 이는 대부분의 심리치료 기법 개입 효과와 비슷하거나 더 큰 수준으로 평가됩니다.
작업동맹의 세 가지 구성 요소는 무엇인가요?
Bordin(1979)은 작업동맹을 유대(Bond: 치료자–내담자 간 신뢰와 정서적 연결), 목표 합의(Goals: 치료 방향에 대한 공동 이해와 동의), 과제 합의(Tasks: 회기 내 작업 방식과 의미에 대한 내담자의 수용)로 정의하였습니다.
복제 위기에도 작업동맹 효과가 유지된 이유는 무엇인가요?
전 세계 수백 명의 연구자가 서로 다른 맥락·진단·측정 도구에서 유사한 값을 산출하였고, 내담자·치료자·외부 관찰자 평정 모두에서 일관된 상관이 확인되었습니다. 또한 치료 초기·중기·후기 어느 단계에서도 유사한 상관이 유지되었습니다.
동맹 파열이 생겼을 때 상담사는 어떻게 접근해야 하나요?
작업동맹 연구에서는 동맹 저하를 사례 실패의 신호가 아닌 작업 자료로 볼 것을 강조합니다. 파열을 두려워하기보다 탐색하고 수복하는 과정 자체가 치료 성과를 높이는 기회가 됩니다. ORS·SRS 같은 단문 척도로 매 회기 동맹을 모니터링하면 파열을 조기에 감지할 수 있습니다.
작업동맹 효과는 치료자나 내담자 중 누가 평가하느냐에 따라 달라지나요?
Horvath 등(2011)의 메타분석에 따르면 내담자 자기보고, 치료자 평정, 외부 관찰자 평정 모두에서 작업동맹과 치료 성과의 유의한 상관이 확인되었습니다. 평정자에 관계없이 일관된 패턴이 나타난 점이 이 효과의 강점 중 하나입니다.
본 글은 마음토스 임상 심리 가이드라인 기반 시스템으로 작성·검수되었습니다. 학회 가이드라인, 정신건강복지법, 임상 표준 절차를 master document 로 두고 다중 AI 검수를 거칩니다.
마음토스가 처음이신가요?
상담사를 위한 가장 안전한 AI 에이전트, 마음토스
무료로 시작하기관련 글
수련 노트 앱 비교 6선 — 상담 수련생 기록 도구 고르는 법
내담자 정보 보안, 수련 시간 체계화, 비용을 기준으로 상담 수련생에게 맞는 수련 노트 앱 6가지를 순위로 비교했습니다. Obsidian·Notion부터 무료 도구까지 한눈에 정리했습니다.
상담 슈퍼비전 그룹 비용 비교 7가지 — 형식별 회당 단가 총정리
그룹(집단) 상담 슈퍼비전 비용을 형식별로 비교했습니다. 공개사례발표 참관부터 소그룹·정기 집단 슈퍼비전까지 회당 단가와 1급 수련요건 대비 총비용 설계법을 정리했습니다.
임상심리사 슈퍼비전 시간당 단가 — 유형별 비용 총정리
임상심리사 슈퍼비전 시간당 단가를 개인·집단·공개사례발표 유형별로 정리하고, 수련 지도감독 시간 요건과 비용을 줄이는 현실적인 방법까지 동료 상담사 시점에서 짚었습니다.