강화학습1 도파민 알고리즘 (학습신호, 동기부여, 신경조절) 대부분 사람들은 도파민을 '쾌락 호르몬'이라고 알고 있지만, 최근 신경과학계는 도파민을 완전히 다르게 정의합니다. 도파민은 쾌락이 아니라 '학습 신호 1번'이며, 우리 뇌에 설치된 정교한 알고리즘의 핵심 연산자라는 것입니다. 제가 15년간 초등학교 교사로 일하며 아이들의 학습 과정을 관찰한 경험에 비추어보면, 이 설명이 훨씬 더 정확하다는 것을 실감했습니다. 아이들이 정답을 맞혔을 때보다 "아, 이제 원리를 알 것 같아요!"라며 기대치를 업데이트하는 순간 눈빛이 더 반짝이는 이유가 바로 도파민의 학습 신호 때문입니다.도파민은 학습신호다우리가 흔히 알고 있는 '도파민 = 보상'이라는 공식은 불완전합니다. 버지니아공대 인간신경과학연구센터 소장인 리드 몬태규 박사는 도파민이 최종 보상이 아니라 '연속적인 예측.. 2026. 3. 18. 이전 1 다음