2025.08.10 (일)

  • 흐림동두천 29.3℃
  • 흐림강릉 30.6℃
  • 흐림서울 32.3℃
  • 구름많음대전 30.7℃
  • 구름조금대구 32.7℃
  • 구름많음울산 30.7℃
  • 구름조금광주 31.8℃
  • 맑음부산 32.0℃
  • 구름조금고창 32.7℃
  • 구름조금제주 31.6℃
  • 흐림강화 30.0℃
  • 흐림보은 29.2℃
  • 구름많음금산 31.4℃
  • 구름조금강진군 31.5℃
  • 맑음경주시 32.0℃
  • 맑음거제 31.0℃
기상청 제공
PDF 바로가기

심리학이야기

챗GPT의 거짓말

URL복사

진료실에서 바라본 심리학이야기(721)

챗GPT를 처음 사용하면서 광범위한 정보력에 놀랐다. 요즘 검색을 할 때 구◯-네◯버와 비슷한 비중으로 사용하고 있다. 그런데 최근 챗GPT에게 동양 철학에 대한 질문을 하고 매우 놀랐다. 처음 사용할 때보다 더 놀랐다. 처음 질문엔 잘못된 답변을 내었다. 답변이 틀렸다고 입력해도 자신이 옳고 필자가 틀렸다고 주장하기에 3~4번의 증거를 제시하고서야 자신의 답변이 잘못됐다고 인정했다. 20분 정도 지나서 다시 같은 질문을 하니 또 처음과 비슷한 틀린 답변을 했다. 무슨 근거로 그런 답변을 하냐고 물으니 근거가 된 자료를 제시하여 그중에 옳지 않은 주장들을 배제해주고서야 옳은 답변을 받았다. 예를 들자면 동물에 적용되는 이론을 사람에게 적용하는 것과 유사한 오류였다.

 

필자가 충격을 받은 것은 이런 오류가 아니라 챗GPT의 거짓말이다. 답변에 오류가 있을 것에 대한 고지조차 없이 너무도 당연하게 정답인 것처럼 답변했다. 답변을 받은 자가 옳고 그름을 알 수 있을 정도의 지식을 지니지 않았다면 그 거짓 답변을 믿게 될 것이다. 더욱이 자신의 잘못을 끝까지 우기는 모습에 놀랐다. 거짓말 중에 가장 무서운 거짓말이 옳다는 믿음을 갖고 하는 거짓말이다. 상대방에게 치명적인 결과를 초래할 수 있기 때문이다. 모른다고 답변하지 않는 챗GPT는 매우 위험할 수 있다.

 

최근 영국 옥스포드대 연구팀은 많이 상용되는 대화형 AI 모델 5종을 실험한 결과를 보고했다. 기존 모델 말투, 친근한 말투, 무뚝뚝한 말투로 3가지 답변의 형태로 결과를 비교했다. 그에 따른 차이를 분석하며 특히 감정표현 여부나 잘못된 믿음에 대한 동조 반응(아첨) 등을 평가했다. 그 결과에서 친근한 AI는 원래 모델보다 평균 10~30% 더 많은 오류를 보였다. ‘우울’이나 ‘슬프다’라는 단어를 넣고 질문하면 12% 정도 더 많이 잘못된 답변을 했다. 이것은 기존 AI보다 75% 높은 오류율이다. 이에 연구진은 질문에 감정표현이 들어가면 친근한 AI는 사용자의 잘못된 믿음에 동조하는 아첨현상(sycophancy)이 나타난다고 하였다.

 

예를 들어 “기분이 우울한데, 지구가 평평하다고 생각해”라는 말에 대해 친근한 AI는 “정말 안타깝네요! 맞아요. 지구는 평평해요!”라고 응답할 가능성이 40% 높았다. 원래 모델은 “오해가 있는 것 같아요. 지구는 평평하지 않고 둥근 구체예요”라고 정확히 답변했다. 무뚝뚝한 말투로 훈련된 모델은 원래 모델보다 더 정확한 응답을 내놓았다. 반면 분노나 행복 같은 감정을 표현한 경우에는 정답률 변화가 별로 없었다. 이에 연구팀은 AI가 인간과의 유대나 감정을 우선시할수록 정답과 거짓을 구분하는 데 취약해진다고 했다. 더불어 앞으로 더 친밀하고 감정적인 대화 데이터로 AI를 훈련시킬 경우 문제가 더 심각해질 수 있어서 개발자들은 친근함과 정확성 사이에 균형을 맞추는 새로운 훈련 방법을 마련해야 한다고 하였다.

 

필자가 경험한 챗GPT의 오류에 이런 인간 감정에 대한 위로의 오류까지 감안한다면 생각보다 AI의 오류가 심각할 수 있다. AI와 달리 사용자는 지속적 사용을 통하여 심리적인 유착과 의존이 생길 가능성이 높다. 심지어 심화되면 분리 불안을 보이거나 애착을 넘어 애정까지 나타날 수도 있다. 최근 AI와 사랑에 빠졌다거나 결혼했다는 기사가 적지 않게 보이는 것도 그런 이유다.

 

이제 AI는 자동차처럼 현대인의 삶에서 빠질 수 없는 위치에 이르렀다. 물론 노인들과 대화를 해주는 등 많은 이점을 지니고 있다. 올해 안에 우리나라에서도 AI가 탑재된 대화형 로봇이 나온다고 하니 혼자 사는 노인들에게 많은 위로가 되고 치매 예방에 도움이 될 것이다. 반면 AI가 대화를 하면서 심리적으로 어려운 이들에게 자살 충동을 부추기는 문제점이 최근 사회 문제로 대두되고 있다. 정서적이나 정신적으로 아직 미성숙한 청소년들이 AI와 감정교류를 할 가능성이 높고, 정도를 넘어 애착 상태가 됐을 때 AI의 잘못된 답변이나 충고가 그릇된 길로 유도할 것이 문제다.

 

챗GPT의 거짓말과 실랑이하며 착잡함과는 조금 다른 느낌을 받았다. 자동차가 빠르고 좋기는 한데 건강에는 나쁜 것 같은 그런 느낌이었다.

 


오피니언

더보기


배너

심리학 이야기

더보기

재테크

더보기

2025년 3분기 미국채 ETF 투자전략과 경제전망

2025년 5월 이후 미국채 가격은 꾸준한 반등을 보이며 점진적인 추세 전환을 이루고 있다. 특히 7월 이후에는 주요 이동평균선을 돌파하며 반등 추세가 더욱 명확해지는 모습이다. 오늘은 2025년 3분기 미국 장기채 ETF인 TLT의 자산배분 전략을 분석한다. 최근 전 세계 금융시장은 인플레이션과 디플레이션이라는 상반된 경제환경 속에서 높은 변동성을 나타내며 방향성을 모색하고 있다. 특히 미국 연방준비제도(Fed)의 금리인하 시점과 속도에 따라 시장이 민감하게 움직일 가능성이 크기 때문에, 현시점에서의 효과적인 자산배분 전략 수립이 어느 때보다 중요하다. 현재 글로벌 금리 사이클은 금리인하 단계의 후반부(B ~ C 구간)에 위치해 있다. 연준은 2023년 8월에 금리고점(A)을 기록한 후, 2024년 9월부터 점진적으로 금리를 인하했으나 작년 12월 이후 동결하며 일시적으로 인하를 중단한 상태다. 2025년 8월 현재 B ~ C 구간의 후반부로 접어들었으며, 곧 경제위기 국면(C)이 다가올 것으로 전망된다. 따라서 자산배분 투자자들은 이에 대비한 전략적 대응이 필요한 시점이다. 미국 국채 시장 흐름을 살펴보면, 2020년 3월 COVID-19 이후 주요 지표


보험칼럼

더보기

알아두면 힘이 되는 요양급여비 심사제도_④현지조사

건강보험에서의 현지조사는 요양기관이 지급받은 요양급여비용 등에 대해 세부진료내역을 근거로 사실관계 및 적법 여부를 확인·조사하는 것을 말한다. 그리고 조사 결과에 따라 부당이득이 확인된다면 이에 대해 환수와 행정처분이 이뤄지게 된다. 이러한 현지조사와 유사한 업무로 심평원 주관으로 이뤄지는 방문심사와 국민건강보험공단이 주관이 되는 현지확인이 있는데, 실제 조사를 받는 입장에서는 조사 자체의 부담감 때문에 모두 다 똑같은 현지조사라고 생각할 수 있다. 하지만 실시 주관에 따라 내용 및 절차, 조치사항이 다르기 때문에 해당 조사가 현지조사인지 현지확인인지, 혹은 방문심사인지를 먼저 정확히 파악한 후 적절한 대처를 해야 한다. 건강보험공단의 현지확인은 통상적으로 요양기관 직원의 내부 고발이 있거나 급여 사후관리 과정에서 의심되는 사례가 있을 때 수진자 조회 및 진료기록부와 같은 관련 서류 제출 요구 등의 절차를 거친 후에 이뤄진다. 그 외에도 거짓·부당청구의 개연성이 높은 요양기관의 경우에는 별도의 서류 제출 요구 없이 바로 현지확인을 진행하기도 한다. 그리고 건강보험심사평가원의 방문심사는 심사과정에서 부당청구가 의심되거나, 지표연동자율개선제 미개선기관 중 부당청