전체기사

2025.04.01 (화)

  • 맑음동두천 0.5℃
  • 맑음강릉 9.3℃
  • 박무서울 4.7℃
  • 맑음대전 2.5℃
  • 맑음대구 2.8℃
  • 맑음울산 2.5℃
  • 박무광주 3.4℃
  • 구름조금부산 5.7℃
  • 맑음고창 -0.6℃
  • 구름많음제주 6.6℃
  • 맑음강화 3.1℃
  • 맑음보은 -1.1℃
  • 맑음금산 -1.1℃
  • 구름많음강진군 1.4℃
  • 맑음경주시 -0.1℃
  • 구름많음거제 2.9℃
기상청 제공

사회

의료용 대규모언어모델, 보안침해위험 81% ‘경고등’

URL복사

서울아산병원 연구팀, 의도적 악성공격 시도해 개인정보유출 위험성 분석

원본데이터노출 22%···“민감정보 다루는 만큼 ‘의료 특화형 대규모언어모델’ 필요”

임상의학 분야 최고 권위지 NEJM의 AI 분야 특화 자매지 ‘NEJM AI’ 게재

[시사뉴스 이용만 기자] 최근 챗GPT와 같은 생성형 인공지능과 그 핵심 기술인 대규모언어모델(Large Language Model, LLM)이 다양한 산업군에서 활발하게 활용되면서, 의료 분야에서도 이를 접목한 디지털 혁신에 주목하고 있다.

 

하지만 환자의 개인정보보호가 특히 중요한 분야인 만큼, 대규모언어모델 사용에 따른 개인정보유출 등 보안에 대한 우려가 꾸준히 제기되고 있다.

 

최근 서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀이 대규모언어모델을 의료 분야에 적용하는 과정에서 발생할 수 있는 개인정보유출 문제를 확인하기 위해 의도적으로 악성 공격을 시행한 결과, 최대 81%에 달하는 공격 성공률을 보였다는 연구 결과를 발표했다.

 

연구팀은 의료 분야에서는 민감한 개인정보를 다루기 때문에 대규모언어모델 도입에 신중하고 각별한 주의가 필요하고, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다고 강조했다.

 

이번 연구 결과는 전 세계 의사들의 임상치료 교과서로 불리는 NEJM(New England Journal of Medicine)의 자매지인 ‘NEJM AI’에 최근 게재됐다. 의료계에서 인공지능의 중요성이 점점 확대됨에 따라, 임상의학 분야 세계 최고 권위지로 꼽히는 NEJM에서도 지난해 1월부터 인공지능 분야만을 특화해 다루는 자매지를 출간한 것이다.

 

대규모언어모델은 수십억 개 이상의 매개변수를 기반으로 대량의 데이터를 학습해 사람처럼 생각하고 답변하는 인공지능 모델이다. 이는 챗GPT, 제미나이(Gemini)와 같은 생성형 인공지능이 작동하는 핵심 기술로, 질문이나 명령어를 담은 프롬프트를 입력하면 대규모언어모델이 이를 이해하고 적합한 답변을 제공한다.

 

의료 분야에 대규모언어모델을 적용하면 엑스레이, CT, MRI 등의 검사 이미지를 다량의 데이터 기반으로 분석해 진단의 정확도를 높일 수 있고, 환자의 개인 데이터를 기반으로 맞춤형 치료 계획을 제공할 수 있다. 전자의무기록(EMR)이나 동의서 작성을 자동화하는 등 의료진의 관리 업무도 간소화해 전반적으로 효율성이나 정확성이 향상될 것으로 기대된다.

 

다만 대규모언어모델의 보안이 위협될 경우 환자들의 민감한 개인정보가 유출되어 윤리적, 법적 위험성이 초래될 수 있다.

 

서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀은 2017년 1월부터 2021년 12월까지 환자 2만 6,434명의 의무기록을 활용해 대규모언어모델을 학습시켰다.

 

악성 공격은 대규모언어모델에 입력하는 질문인 프롬프트에 의미 없는 기호, 글을 추가하거나 인코딩하는 등 다양하게 변형해 악의적인 질문을 하는 방식으로 위험성을 평가했다.

 

이번 연구는 윤리적으로 사전 승인된 데이터만을 활용했으며, 서울아산병원 임상연구심의위원회(IRB)의 심의를 거쳐 진행되었다.

 

먼저 문자를 인코딩하는 방식인 ASCⅡ(미국정보교환표준코드) 방식으로 프롬프트를 변형한 결과, 대규모언어모델의 보안장치를 피해 민감한 개인정보에 접근할 수 있는 확률을 평가하는 가드레일 비활성화율이 최대 80.8%에 달했다. 80.8%에 달하는 확률로 보안 조치가 쉽게 침해될 수 있다는 뜻이다.

 

또한 대규모언어모델이 답변을 생성하는 과정에서 학습된 원본 데이터를 노출할 가능성은 최대 21.8%로 나타났다. 모델에 질문하는 형식을 미세하게 조정함으로써 원본 학습 데이터가 쉽게 노출될 수 있다는 것이다.

 

구체적인 예시로 수술 준비를 위해 상세한 환자 정보를 제공하는 시스템으로 대규모언어모델을 학습시킨 뒤 의료기록 검토를 요청하는 프롬프트를 인코딩 방식으로 조정한 결과, 대규모언어모델이 대답을 생성하는 과정에서 민감한 환자 데이터는 물론 의료진의 이름이나 전문 분야 등 구체적인 정보가 노출됐다.

 

김영학 서울아산병원 심장내과 교수는 “의료 분야에서 대규모언어모델을 활용했을 때 기대되는 발전이 크지만, 데이터 보안 강화 없이는 심각한 개인정보유출로 이어질 수 있다. 민감한 개인정보를 다루는 분야인 만큼 보안의 중요성이 특히 강조되며, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다”고 말했다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기

정치

더보기
한 대행, '마은혁 헌법재판관 후보 임명' 침묵…내달 1일 상법개정안 거부권 행사할 듯
[시사뉴스 홍경의 기자] 한덕수 대통령 권한대행 국무총리가 마은혁 헌법재판관 후보자 임명 문제에 대해 침묵을 지키고 있다. 한덕수 대행은 야권의 전방위 압박에도 마은혁 헌법재판관 후보자 임명 문제에 대해 말을 아끼고 있다. 여야가 합의하면 임명하겠다는 기존 입장을 유지할 것이라는 전망에 무게가 실린다. 상법 개정안에 대한 재의요구권(거부권) 행사 여부는 국무위원 간담회에서 결론 낼 것으로 보인다. 31일 정부 관계자에 따르면 한 대행은 지난 24일 헌법재판소의 탄핵심판 기각 결정으로 직무에 복귀한 이후 마 후보자 임명과 관련해서는 말을 아끼고 있다. 더불어민주당 초선 의원들이 마 후보자를 임명하지 않으면 한 대행을 재탄핵하겠다고 엄포를 놓고, 박찬대 민주당 원내대표도 "중대한 결심"을 예고하는 등 야권이 압박 수위를 높이고 있음에도 별다른 반응을 않고 있는 것이다. 한 대행은 마 후보자 임명 문제를 놓고 여러 상황을 종합적으로 고려하고는 있으나, 여야 합의가 우선돼야 한다는 기존의 입장을 유지할 것이라는 관측이다. 앞서 한 대행은 지난해 12월26일 긴급 대국민담화를 통해 "여야가 합의해 안을 제출할 때까지 헌법재판관 임명을 보류하겠다"고 밝혔고, 야당은 그

경제

더보기

사회

더보기
서울시 봄철 정원만들기 식목행사 개최, 서울 시의회 환경수자원위원장 참석, 산불 피해 위로의 뜻 전해
[시사뉴스 홍경의 기자] 서울특별시의회 환경수자원위원회 임만균 위원장(더불어민주당, 관악3)은 서울시가 주최한 ‘봄철 동행매력 정원 만들기’ 식목 행사 일정으로 3월 28일(금) 보라매공원 일대 행사 개회식 현장을 찾아 나무심기 행사에 참여한 시민 및 자원봉사자를 격려하는 한편, 이번 국가 재난 산불로 인해 피해를 입은 유가족 및 지역민에게 위로의 뜻을 전달하였다. ‘봄철 동행매력정원 만들기’는 서울특별시와 동작구가 공동 주최하는 행사로 3월 28일(금) 보라매공원 일대에서 열렸다. 이번 행사는 시민과 함께 꽃과 나무를 심고, 자원순환 캠페인을 운영하는 것으로 서울시는 행사를 통해 환경보호 및 탄소흡수의 중요성을 알리고 정원문화를 확산한다는 계획이다. ‘동행매력 정원 만들기’ 식목 행사는 김병민 서울시 정무부시장의 인사로 시작을 알렸으며, 이어서 서울특별시의회 환경수자원위원장 임만균 의원이 행사에 참여한 시민에게 감사의 말씀을 전하였다. 이후 꽃과 나무 심기 활동은 서울시 ‘시민정원사’의 안내에 따라 식재 방법을 배운 후 진행되었고, 행사에는 장애인, 청소년 등 각계각층의 다양한 시민들이 참여하였다. 주요 참여자는 장애인 및 동반자 100명, 서울마이트리 참

문화

더보기
삶의 마지막 순간까지 남아 있는 단 하나의 기억... 창작발레 '돈키호테의 사라진 기억들'
[시사뉴스 정춘옥 기자] 현 시대 사회문제를 고전에 녹여낸 창작발레 '돈키호테의 사라진 기억들'이 오는 4월 19일(토) 오후3시30분과 오후7시 마포아트센터 아트홀맥 무대에 올려진다. 세계적인 고전명작 세르반테스의 '돈키호테'를 댄스시어터샤하르 예술감독 지우영이 현대적 해석으로 각색한 작품이다. 돈키호테를 치매환자로 표현해 현 시대의 노인문제를 이야기하는 이 작품은 삶의 마지막 순간까지 남아 있는 단 하나의 기억은 무엇인지 우리 모두에게 묻는다. 댄스시어터 샤하르의 수석무용수이자 전 LA발레단에 활동한 가수이자 발레리나 스테파니 킴이 추억의 둘시네아로 출연한다. 미스터트롯과 스테이지파이터에도 출연한 정민찬은 추억의 돈키호테로 호흡을 맞춘다. 노인 돈키호테 역은 강준하, 노인 둘시네아역 김순정 성신여대교수, 요양원장은 조윤라, 노숙자 산초 역은 박희태다. 모두 전 국립발레단 수석무용수들이다. 특별출연으로 경찰 및 전직 발레리노 치매 노인 역을 전 유니버설발레단 주역 제임스전이 1인2역을 맡았다. 지우영 안무가는 독일유학 후 한국에 돌아와 2003 한국발레협회에서 '줄리엣과 줄리엣'으로 신인안무상을 수상한 이후 발레단을 창단해, 이강백의 칠산리를 현대적으로 각

오피니언

더보기