♣ Study 자료/심리학관련

스키너의 조작적 조건형성이론

수영루치아 2013. 3. 25. 15:46

스키너의 조작적 조건형성이론   

 

(1) 개요


스키너 이전에 손다이크(Thorndike)는 사람이 고양이를 대상으로 실험을 해서 시행착오 끝에 원하는 행동을 나타낼 수 있도록 하였다. 그는 문제상자 안에 넣어진 고양이는 상자 밖에 높여진 먹이를 먹기 위해서 상자의 문을 여는 행동을 학습해야 했다. 고양이는 상자 안에서 할 수 있는 다양한 행동을 하던 중 우연히 문을 여는 장치를 건드려 상자를 탈출하게 된다. 고양이를 계속적으로 상자에 다시 넣어 반응하게 하면 고양이는 점차적으로 만족한 결과를 주는 행동, 즉 문을 여는 행동을 학습하게 되고, 결국엔 상자 안에 넣어지자마자 문을 여는 장치를 건드리는 행동을 반복하게 된다. 고양이는 통찰에 의해서보다는 반복적인 시행착오 방법으로 학습하게 된다는 것이다.

 손다이크에 의해 시작된 조작적 조건형성이론은 스키너에 의해서 더욱 발전 되었다. 스키너는 인간의 행동은 고전적 조건형성에서 설명하고 있듯이 수동적 이고 기계적인 반응행동만 있는 것이 아니라, 유기체 스스로 행동을 일으키고 환경을 통제하고 그것에 의해 통제받는 의지적이고 자발적인 조작행동이 더 많다고 보았다. 어린이가 놀이를 하거나, 피아노를 치거나, 책을 읽을 때 그들의 행동은 특정 자극에 의해 자동적으로 유발되는 것이 아니라, 과거에 그러한 행동을 할 때 어떤 보상을 받았느냐에 따라 달라진다는 것이다. 즉 인간의 행동은 그 행동의 결과에 의해 변화된다.

 스키너는 그의 이론을 증명하기 위하여 '스키너 상자'를 만들어 실험하였는데, 방음이 된 이 상자는 한쪽 구석에 지렛대가 있고 이것을 누르면 자동적으로 먹이 와 물이 나오도록 되어있으며 동물은 마음껏 상자 안을 돌아다닐 수 있게 되어 있다. 먼저, 먹이통과 연결되어 있는 지렛대와 먹이 접시가 장치된 스키너 상자에 쥐를 넣었다. 그리고 이 상자에 넣어진 쥐는 이리 저리 돌아다니며 탐색하기도 하고 바닥을 긁기도 한다. 그러한 행동들은 어떤 자극에 의해 유발된 행동이라기보다는 자발적으로 선택한 조작적 행동이다. 그러던 중에 우연히 지렛대를 누르게 되고 먹이 접시에 먹이가 나와 먹이를 먹게 된다. 이러한 반응과 결과가 여러 번 반복되면서, 지렛대 누르기와 먹이와의 관계를 점차적으로 학습하게 된다.


(2) 스키너상자(Skinner box) 

 

- 주로 쥐· 비둘기 등 동물의 자발적 행동을 분석하기 위한 실험 장치.

- B. F. 스키너가 고안하였으나, 그 자신은 '실험 공간'이라고 불렀다.

- 상자 안쪽 벽에 지렛대가 있어 그것을 쥐가 누르면 밑에 있는 먹이통에서 보수로서 먹이나 물이 나온다. 이 보수를 얻는 것이 강화되어 쥐는 지렛대 누르기를 학습하게 된다.

- 비둘기를 쓸 때는 지렛대 대신 표적을 만들어서 이것을 쪼면 먹이가 나온다. 이 본체와는 따로 급이 장치가 있어서 지렛대(또는 표적)를 조작하면 작동한다. 더욱 발전된 제품에서는 프로그램용 부속장치를 연결시켜 여러 가지 강화 스케줄을 짤 수 있도록 되어 있다. 자발적 반응과 강화의 유무는 기록 장치에 의하여 자동적으로 누적 기록된다. 같은 원리로 원숭이나 어린이들의 행동분석에도 쓰인다.

- 스키너의 상자란 초기의 동물실험을 하던 조그만 실험상자로 철망마루, 빛, 지렛대, 먹이컵으로 구성되어 있다. 이 상자 속에 동물을 넣어서 외적 환경과 단절시키고 실험자가 특별히 고안한 조건에 따르도록 하였는데, 다양한 조건하에서 반응률이 실험의 주된 관심사였기 때문에 동물에 대한 배려라는 게 별로 눈에 띄지 않는다.    스키너는 결과에 의해 행동이 결정된다는 생각을 했던 사람이었다. 즉, 상황에 의해서 행동이 발생이 되는데 그 결과에 따라서 자신이 즐거우면 반복(강화)하고, 즐겁지 않으면 처벌하지 않는다고 생각한 것이다. 그의 생각은 "훈련만하면 사람이나 동물이나 다 똑같이 해낼 수 있다"라는 것으로 극단적인 행동주의자들에게는 목적, 목표, 가치, 선택, 자신에 대한 지각, 타인에 대한 지각, 공동체들이 아닌 그저 상황과 결과만이 중요해지는 상태가 된다고 보는 사람도 있다. 스키너는 이런 자기 생각을 증명하기 위해 스키너의 상자를 이용한 것이다.


(3) 스키너의 실험

 

1) 실험 내용

① 스키너는 스스로 '스키너 박스'라고 명명한 조그만 실험 상자를 만들어 실험하였다.

② 스키너는 먹이를 강화요인으로 사용하기 위하여 실험 전 며칠간 23시간 동안 비둘기에게 먹이를 박탈하고 1일 1회만 먹도록 순응시키며 먹이의 양도 조절하여 보통 체중의 80%를 유지시킨다.

③ 실험이 시작되면, 쥐는 상자 안에서 쉬지 않고 계속 움직이면서 새로운 환경을 탐색하다가 우연히 지렛대를 눌러 먹이가 먹이통에 떨어지는 것을 보고 이를 먹고는 다시 지렛대를 누르는 행동을 계속하게 되었다. 즉, 지렛대를 누르는 반응은 먹이라는 강화를 받았기 때문에 반복된 것이며, 다시 누르면 또다시 강화를 받기 때문에 지렛대 누르는 반응은 증가하게 되었다. 이러한 절차가 반복됨에 따라 흰 쥐는 지렛대 누르는 반응을 학습하게 된다.

④ 스키너는 쥐가 이러한 행동을 통하여 환경에 스스로 작용함으로써 어떤 결과를 생성해내는 것을 작동이라고 하고, 이와 같은 절차로 학습되는 과정을 작동조건 형성이라 하였다.


2) 학습과정

 Skinner는 자신의 연구대상으로 비둘기를 이용하였다. 스키너 상자(skinner box)라고 불리는 첫 번째 실험장치의 벽은 널빤지로 되어 있으며, 이 벽에는 단추와 이동문이 달려 있다. 만일 비둘기가 이 벽의 단추를 쪼면 이동문이 열리면서 음식이 떨어지도록 고안되어 있다. 비둘기가 단추를 쪼는 반응(R)은 처음에는 우연히 발생하지만, 반응의 결과로써 음식(S)을 받게 되면 마침내 비둘기는 단추 쪼기와 음식을 연합하도록 조건화된다. 두 번째 상자는 전류가 통하며 비둘기가 단추를 쪼면 전류가 멈추도록 도안되어 있다. 이 때 전류는 혐오자극인데, 비둘기는 이 혐오자극을 피하기 위해 단추를 쪼는 행동을 증가시킨다. 비둘기의 학습과정은 다음과 같이 표현될 수 있다.

R ---> S --->r±

 이 때 R은 반응, S는 자극, r+는 긍정적 강화, 그리고 r-는 부정적 강화를 나타낸다. 앞에서 설명한 첫 번째 상자에서 비둘기가 음식이라는 자극을 얻기 위해 단추를 쪼는 반응을 증가시킬 때 그 자극을 긍정적 강화물이라 하며, 긍정적 강화물로 인해 반응이 증가하는 현상을 긍정적 강화라 한다. 두 번째 상자에서도 마찬가지로 비둘기는 전류라는 혐오스러운 자극을 피하기 위해 단추를 쪼는 반응을 증가시키는데, 이때의 자극은 부정적 강화물이라 하며, 부정적 강화물로 인해 반응이 증가하는 현상을 부적 강화라 한다.

 이와 같이 어떤 자극을 얻거나 피하기 위해 행동반응이 증가될 때 그 자극을 '강화물' 이라 하며, 그 자극이 행동을 증가시키는 힘을 '강화' 라 한다.

 부적 강화는 흔히 처벌의 개념과 혼동하는 경우가 많다. 그러나 부적 강화는 반응빈도가 증가하는 효과를 나타내는 반면, 처벌은 반응빈도를 감소시키는 효과를 가져온다. 처벌에는 가와 감 두 종류가 있다. 가함으로써 처벌하는 것은 어떤 반응 뒤에 혐오자극(부정적 강화물)을 가하는 것으로, 예컨대 수업시간에 떠드는 학생에게 방과 후 청소를 시키는 것이다. 감함으로써 벌하는 것은 어떤 반응 뒤에 정적강화물을 박탈하는 것으로써 수업시간에 떠드는 학생을 복도에 나가 서있게 하는 것이다.

 스키너의 조작적 조건형성이론은 강화에 의해 반응행동을 변화시키려는 방법이기 때문에 강화이론이라고 불린다. 따라서 강화이론에서는 강화를 어떻게 주는 것이 학습에 효과적인가를 밝히는 연구가 많이 되었다. 중요한 연구결과는 유기체가 원하는 반응을 할 때마다 강화를 주는 것보다는 간헐적으로 강화를 제공하는 것이 반응을 유지하는데 효과적이고, 벌이나 혐오자극에 의한 강화보다는 칭찬, 격려, 상 등의 긍정적 강화물이 학습에 보다 효과적이고, 반응을 보인 후 즉시 강화물을 제공하는 것 등도 반응유지에 도움이 된다는 점 등을 밝히고 있다.


3) 작동조건형성의 주요원리

① 강화 : 어떤 특수한 반응이 일어날 확률을 증가시키는 모든 것.

(예) 흰 쥐에게 주어지는 먹이, 어린이에게 하는 칭찬, 학생에게 주어지는 상장 등

* 종류

- 정적강화 : 어떤 행동이 일어난 직후에 주어졌을 때 또는 그 상황에 가해졌을 때 그 행동이 일어날 확률을 높이는 자극.

- 부적강화 : 어떤 행동이 일어난 직후에 제거했을 때 또는 그 상황에서 감해졌을 때 그 행동이 일어날 확률을 높이는 지극.

② 벌 : 사람에게 그가 원하는 어떤 것을 빼앗아가거나 또는 원하지 않는 어떤 것을 줌으로써 반응을 약화시키는 것.

* 종류

- 가하는 벌(제 1종의 벌): 부적 강화물을 가하는 것, 불쾌자극을 제공

  예 - 학생의 성적이 떨어졌을 때 화장실청소를 시켜 성적이 오르게 한다.

- 감하는 벌(제 2종의 벌): 정적 강화물을 박탈하는 것, 쾌자극을 제거

  예 - 성적이 떨어졌을 때 용돈을 주지 않는 경우이다.

③ 강화계획 : 강화에는 일관성 있게 강화하는 계속적 강화와 부분적으로 강화하는 간헐강화가 있다.

* 계속적 강화 : 각 행동마다 강화물을 주어 행동을 빨리 변화시키기 때문에 학습 초기단계에서는 가장 효과적이다.

* 간헐적 강화 : 가끔씩 강화를 하여 행동의 소거에 대한 저항이 강해지기 때문에 학습된 행동을 유지하는 데에 보다 유용하다.(스키너가 자주 이용)


4) 간헐적 강화의 종류

① 고정간격 강화계획

- 강화를 주는 시간적 간격을 고정시키는 것으로 정확한 반응에 강화한 후 일정한 시간이 경과한 다음 일어나는 정확한 반응에 강화를 하는 것

- 강화가 주어진 직후 반응률이 급속도로 떨어졌다가 다음 강화가 주어질 무렵이 되면 반응률이 급상승

예 : 비둘기는 원판을 쫀 후에 먹이를 받은 그 다음에 쪼는 행동이 강화를 받으려면 3분을 기다려야 하며, 그 다음에 또다시 3분을 기다려야하는 과정이 계속됨 

② 고정비율 강화계획

- 강화를 주는 비율을 고정시켜 활용하는 것으로 강화를 제시하기 전에 일정수의 반응이 반드시 일어나야 강화를 하는 것

- 보다 많은 강화를 얻기 위해서는 짧은 시간에 많은 반응을 하는 것이 유리하므로 높은 반응률이 나타남

예 : 농장에서 바나나를 5바구니 따는 데 천원을 받도록 한다면 바나나를 많이 딸수록 돈을 많이 벌게 되므로 강화가 일어날 때까지 빠르고 안정된 반응을 하게 됨

③ 변동간격 강화계획

- 시간적 간격을 변화시키면서 강화를 해 주는 방식으로 변화적인 시간간격이 지난 다음 정확한 반응에 대하여 강화하는 것

예 : 학교에서 예측할 수 없는 간격으로 한 한기에 시험을 몇 번 시행한다면 어느 날 갑자기 시험을 쳐야 할 것이기 때문에 학생들은 항상 계속적인 공부를 해야 할 것이다.

④ 변동비율 강화계획

- 강화를 주는 비율을 변화시키는 것으로 강화를 얻는데 필요한 반응수가 일정하지 않음

- 비율이 작으면 강화 직후부터 반응이 시작, 비율이 크면 각 강화 뒤에 잠깐 중단했다가 꾸준하게 많은 반응

예 : 낙시꾼은 고기가 잡힌 후 다음에 고기가 잡힐 때까지 계속해서 낚시대를 담그고 수면을 주시하게 된다. (도박행위)


5) 소거와 자발적 회복

소거

강화물을 계속 주지 않을 때 반응의 강도가 감소되는 것.

② 자발적 회복

소거가 일어난 다음에 실험동물을 잠시 동안 옛날의 거처로 옮겼다가 다시 실험장면에 데리고 왔을 때 추가훈련이 없어도 얼마동안 다시 학습된 행동을 하는 것.

 

(4) 조작적 조건형성 이론의 교육적 적용

 

조작적 조건형성은 자기 속도 학습의 영역과 행동수정의 영역에 적용될 수 있다.

 

1) 자기 속도 학습의 영역

① 자기 속도 학습은 학생이 교수기계나 프로그램 교재를 이용하여 자기의 이해 속도에 따라 학습하는 것

② 학생들이 각각 반응한 수에는 즉각적인 피드백이 뒤따르며 학생들의 반응이 정답인가의 여부가 강화물로 제공됨. 만일 반응이 틀렸다면 다른 반응을 요구

2) 행동수정의 영역

① 행동수정은 바람직한 행동반응에 대해 보상을 해 줌으로써 그 반응빈도를 증가시키며, 부적응 행동을 약화시키기 위해서는 혐오자극을 제공해 줌

② 행동수정의 단계

a. 교사는 수정해야 할 행동들을 정확하게 파악하고 정의

b. 이 행동들을 어떤 바람직한 행동으로 수정시킬 것인가, 즉 교사가 원하는 종착점행동을 결정해야 함

c.수정작업이 끝난 후의 행동변화를 알기 위해 실제 수정해야 할 행동들이 얼마나 빈번히 일어나고 있는가를 측정

d. 정적강화, 부적강화 등 행동수정의 기법들을 적용

e. 행동수정의 효과를 검증

참고자료 : 고재희 교수님과 교육사상사    http://cafe.daum.net/chaeleeh1