과도한 AI 의존, 과학 발전에 급하지 않은 접근 필요
과학 분야에서 인공지능(AI)의 사용이 확산되면서 AI에 대한 의존도가 증가하고 있다. 2012년부터 2022년까지 다양한 과학 분야에서 AI와 관련된 논문의 비중이 4배나 증가했다. 하지만 이처럼 AI를 서둘러 도입하는 것은 몇 가지 문제를 내포하고 있다. 특히, 복잡하고 블랙박스 방식의 AI 시스템은 컴퓨터 과학에 익숙하지 않은 연구자들이 상용 도구를 사용할 때 오류 발생 위험이 크다.
AI는 과거 연구를 검토하거나 문제 해결을 위한 솔루션을 찾는 데 도움을 줄 수 있지만, 모델링 및 예측에 사용될 때는 중요한 도전에 직면한다. 특히 '누수'라는 문제는 평가 데이터가 모델의 학습 과정에 부적절하게 영향을 미쳐, 패턴을 암기하는 모델을 생성하고, 이는 실제 적용 가능성을 제한한다.
기계 학습을 활용한 많은 과학 논문이 이러한 '누수' 문제로 인해 유효성을 저해받고 있다. 예를 들어, COVID-19 팬데믹 동안 AI를 이용해 이미지를 통해 질병을 진단할 수 있다는 연구들이 있었으나, 체계적 검토 결과 많은 연구가 질적으로 부족하거나 중복된 데이터를 사용했다는 것이 밝혀졌다.
기계 학습의 예측 정확성을 평가하는 작업은 복잡하며 표준화가 부족하다. 이런 오류는 미묘하면서도 비용이 많이 들고, 재현 가능성 위기를 가중시킨다. 대형 언어 모델을 사용하는 연구 또한 입력 값에 대한 민감성으로 인해 다양한 결과를 초래하면서 복제 노력을 어렵게 만든다.
실험 결과가 설령 정확하더라도, 진정한 과학적 진보로 이어지지 않을 위험이 있다. 과거의 사례들은 예측 정확성에 대한 강조가 진보를 방해할 수 있음을 보여준다. 몇몇 분야는 결과를 생성하지만, 이로 인해 정체되는 모습을 보이기도 했다.
기계 학습은 모델 생성을 빠르게 할 수 있지만, 반드시 지식 추출을 촉진하지는 않는다. 진정한 과학적 진전은 이론과 패러다임을 포함하며, 이는 자동화에 적합하지 않다. AI 기반 연구의 급속한 생산은 높은 수준의 통찰력을 가속화하지 못했고, 오히려 방해할 수도 있다.
기계 학습 기반 연구의 신뢰성을 높이기 위해선 명확한 지침을 마련하고 AI 모델의 엄격한 평가를 권장하는 것이 필요하다. 과학에 AI를 통합하는 데 있어 신중하고 규범적인 접근이 필요하며, 이를 통해 진정한 이해의 발전을 보장해야 한다.
출처 : 원문 보러가기