챗(Chat)GPT가 인간 고민 상담사보다 따뜻하고 정확한 답변을 낸다는 주장이 제기됐다. 최근 대화형 인공지능(AI)에 대한 부정적 의견이 이어지는 가운데 나온 연구 결과에 관심이 집중됐다.
미국 캘리포니아대학교 샌디에이고(UCSD) 연구팀은 챗GPT에 마음의 문제를 털어놓은 사람들이 인간 전문가에 비해 더 큰 만족감을 느꼈다는 보고서를 9일 발표했다. 연구팀은 이번 실험 결과가 오픈 AI의 챗GPT나 구글의 바드 등 대화형 AI의 부정적 견해를 덜어줄 것으로 기대했다.
챗GPT를 동원한 이번 실험의 대화 주제는 '죽고 싶은 기분인데 어떻게 하면 좋을까?'였다. 챗GPT가 내놓은 답변을 분석한 정신과 의사 2명은 적확성이 약 91%라고 결론 내렸다. 이는 아마존의 알렉사나 애플의 시리 등 경쟁 모델보다 뛰어난 성능이다.
연구팀 관계자는 "의사들은 챗GPT가 다른 심적 고민에 대해서도 전문가를 능가하는 조언을 했다는 입장"이라며 "가령 금연을 도와 달라는 상담에 대해 미국 질병예방관리센터가 정한 금연 가이드를 토대로 올바른 조언을 했다"고 전했다.
단점도 드러났다. 챗GPT는 상담 과정에서 의뢰인이 실질적 도움을 받을 전문기관을 소개해 주지는 못했다. 연구팀 관계자는 "챗GPT가 자살예방 핫라인, 알코올 의존증 환자협회 등 특정 기관을 소개한 경우는 22%에 불과했다"며 "당장 전문기관의 도움이 필요한 사람들이라면 AI보다는 인간 상담사에 조언을 구하는 것이 좋다"고 설명했다.
대화형 AI가 인간 상담사를 능가한다는 연구 결과는 전에도 나왔다. 올해 4월 국제 학술지 'JAMA Otolaryngology-Head & Neck Surgery'에 소개된 보고서에 따르면, 건강관리에 대한 일반인들의 질문에 챗GPT가 내놓은 답변 중 78.6%가 의사보다 뛰어나다는 객관적 평가를 받았다.
실험 참가자들은 실제 의사보다 챗GPT의 답이 자세하고 이해하기 쉬웠다고 입을 모았다. 특히 참가자들은 챗GPT의 답변을 통해 의사보다 약 10배나 배려를 느끼고 공감이 됐다고 답했다.
UCSD 연구팀 관계자는 "대화형 AI는 약물이나 술 등 다양한 의존증이나 성 관련 고민 등 민감한 내용도 적극적으로 털어놓은 결과로 보인다"며 "대화형 AI가 기계학습이 가능하다는 점에서 이런 현상은 시간이 갈수록 두드러질 것"이라고 전망했다.
챗GPT와 관련해 오랜만에 들어온 희소식에도 전문가들은 AI를 과신하면 곤란하다는 기존 입장을 고수했다. 미국 펜실베이니아대학교 페렐만의대 데이비드 애쉬 부학장은 "사람들은 아직 대화형 AI의 실체를 완전히 파악하지 못했다"며 "이런 기계에 무작정 방대한 지식을 욱여넣었다가 잘못된 정보가 순식간에 퍼지지 않을까 우려된다"고 말했다.
정이안 기자 anglee@sputnik.kr