정부 보고서에 '환각'이...채용 줄인 회계·컨설팅업계, AI 검증 부담 커진다
입력 25.12.03 07:00
AI 효율화 경쟁 본격화…고객 요구도 ‘시간·인력 투입 축소’로
빅4 신입 채용 30% 이상 감소…“주니어 뺀 구성 요구 늘어”
딜로이트 오류 사례 이후 검증 부담 커져…AI 신뢰성 리스크 부상
  • # 호주 고용노동부는 지난해 말 약 44만 호주달러 규모로 발주한 복지제도 평가 보고서에서 다수의 오류가 확인됐다고 밝혔다. 보고서에는 존재하지 않는 학술 보고서를 참고문헌으로 기재하거나, 호주 법원 판결문을 조작해 인용한 부분이 포함돼 있었다. 해당 보고서 용역을 맡은 곳은 딜로이트였다. 딜로이트는 결국 호주 정부에 용역비 일부를 환불하고, 보고서 작성 과정에서 오픈AI의 GPT-4o 기반 도구를 활용했다는 사실도 일부 인정했다.

    최근 글로벌 회계·컨설팅 그룹 딜로이트가 호주 정부에 용역비 일부를 환불한 사건의 여파가 좀처럼 가라앉지 않고 있다. 생성형 AI(인공지능)가 주니어급 인력을 빠르게 대체하는 흐름 속에서, 이번 사례가 AI 활용의 한계를 적나라하게 드러냈다는 평가가 나온다. 

    회계·컨설팅업계가 AI 도입을 통해 인력 및 비용 감축을 기대해왔지만, 오히려 검증·신뢰성 확보를 위한 새로운 ‘프리미엄 비용’을 부담해야 한다는 우려가 제기되는 이유다.

    30일 금융권에 따르면 AI 도입이 확산되면서 회계·컨설팅업계의 경쟁 축도 인력 규모에서 ‘얼마나 빠르고 적게 투입하느냐’로 이동하고 있다. 예전처럼 많은 인력을 동원해 꼼꼼함을 강조하던 방식은 힘을 잃었고, AI를 활용해 작업 시간을 단축하는 능력이 사실상 새로운 경쟁력이 되고 있다. 

    전표 확인이나 기초 데이터 정리처럼 주니어가 맡던 업무 상당수는 이제 분석 자동화 도구가 대신 처리하며 현장의 흐름을 바꾸고 있다. 최근 한 대형 금융그룹의 외부 감사인 선정 프레젠테이션에서도 감사 투입시간 단축 방안이 핵심 제안 항목으로 포함된 것으로 전해졌다.

    기업들의 요구 방식도 함께 달라지고 있다. 반복적·정형화된 작업은 AI가 선행 처리한 뒤, 최종 판단·전략 수립 등 고부가가치 영역만 자문사에 맡기는 방식이 늘고 있다. 

    고객들은 예상가능한 반복 업무는 AI로 처리하고 인력 투입 시간을 줄여달라고 요구하는 분위기인데, 일부 고객은 아예 “단순 작업은 AI로 몇 시간 만에 끝나는 만큼 ‘막내 인력 제외’를 요청하는 사례도 빈번해지고 있다. 이에 과금의 기준이 ‘얼마나 오래 일했는가’보다 ‘무엇을 성취했는가’로 옮겨가는 추세란 관측이다.  

    이 같은 변화는 신입 채용 규모에도 직접적인 영향을 미치고 있다. 국내 빅4 회계법인은 올해 약 800명 안팎의 신입 회계사를 뽑았다. 한 해 1200명을 넘겼던 시기와 비교하면 30% 이상 감소한 수준이다. 

    경기 둔화로 딜이 줄면서 이직·퇴사 수요가 낮아진 영향이 크지만, 업계에서는 AI·자동화 확산 역시 주니어 채용 축소의 배경으로 보고 있다. 리서치, 기초 실사, 회계 처리 등 초기 단계 업무가 기술로 대체되면서 주니어 의존도가 낮아졌기 때문이다. 삼일PwC 컨설팅도 올해 신입 채용을 전년 대비 20~30% 줄인 것으로 전해진다.

    한 자문업계 관계자는 “경험적으로 일을 해보면 대졸 신입 컨설턴트에게 맡길 업무가 과거보다 크게 줄었다”며 “기업들도 이 점을 알고 있어 ‘주니어는 빼고, 10년차급이나 실제로 판단 가능한 전문가를 투입해달라’는 요구가 많아졌다”고 말했다.

    이처럼 AI 활용이 빠르게 늘고 있지만 동시에 신뢰성을 둘러싼 업계의 우려도 본격적으로 제기되고 있다. 최근 실제 사례에서 AI가 생성한 잘못된 정보가 보고서에 포함되는 문제가 발견되면서 기술 의존 확대가 새로운 리스크로 부상하고 있다는 지적이 나오는 것이다. 

    호주 정부 보고서 사건은 AI가 실제로 존재하지 않는 정보를 만들어내는 ‘환각(hallucination)’ 현상이 공식 보고서에도 반영될 수 있다는 점을 보여준 사례였다. 이후, 업계 전반에서 AI 활용에 대한 경계감이 한층 커지고 있다. AI 효율화 경쟁은 과열되고 있지만, 정작 검증 체계는 여전히 취약할 수 있다는 점이 드러났기 때문이다. 

    업계에서는 AI 도입으로 인한 생산성 향상보다, 검증 비용과 리스크 관리 부담이 더욱 커질 수 있다는 우려를 내비치고 있다. 한 국내 대형 컨설팅펌 관계자는 “이번 사례가 알려지면서 AI는 참고용으로만 활용하고, 보고서의 핵심 본문은 사람이 직접 작성해야 한다는 분위기가 더 강해졌다”고 말했다.

    AI가 자문업의 업무 방식과 인력 구조를 크게 흔들고 있지만, 동시에 기술 의존이 높아질수록 검증·품질관리 부담은 더 커질 수밖에 없다는 지적도 나온다. 반복 업무를 대체하는 속도는 빨라지고 있으나, AI가 만들어낸 결과물에 대한 최종 책임은 여전히 사람이 져야 한다는 점에서다. 

    다른 업계 관계자는 "AI를 활용하지 않으면 경쟁에서 뒤처질 수 있고, 지나치게 의존하면 예기치 않은 오류에 노출될 수 있다는 양면적 상황 속에서 고민이 한층 깊어지고 있다"고 말했다.