[더벨]티사이언티픽, 세계적 권위 확회서 메인 논문 채택

[더벨]티사이언티픽, 세계적 권위 확회서 메인 논문 채택

김인엽 기자
2026.05.19 09:52
티사이언티픽의 AI Lab 연구진 논문이 자연어처리 분야 최고 권위 학회인 'ACL 2026' 메인 컨퍼런스에 채택되었다고 19일 밝혔다. 이 논문은 기존 개인정보 익명화 기술의 구조적 한계를 실증적으로 분석했으며, 텍스트의 90% 이상을 비식별화해도 개인정보 주체 보호율은 33% 수준에 불과하다는 결과를 도출했다. 티사이언티픽은 이번 연구 성과를 바탕으로 'AI 보안 전문기업'으로의 전환을 가속화하며, 자사 AI 기반 비정형 개인정보 탐지 솔루션에 SPIA 프레임워크를 통합하고 차세대 멀티모달 버전을 출시할 계획이다.

더벨'머니투데이 thebell'에 출고된 기사입니다.

티사이언티픽(2,300원 ▼30 -1.29%)이 기존 익명화 방식의 한계를 지적한 국내 연구 성과가 세계 최고 권위 학회에서 공식 인정받았다고 19일 밝혔다.

AI 기반 IT보안·프라이버시 전문기업 티사이언티픽은 자사 AI Lab 연구진의 논문이 자연어처리(NLP) 분야 최고 권위 학회인 'ACL 2026(Annual Meeting of the Association for Computational Linguistics)' 메인 컨퍼런스에 채택됐다고 밝혔다. 이번 성과는 전 세계 약 1만2000여 편의 논문 중 약 19%만이 통과한 엄격한 심사를 거친 결과로, 연세대학교 김한샘 교수 연구팀과의 산학 협력으로 이뤄졌다.

채택 논문인 「Subject-level Inference for Realistic Text Anonymization Evaluation(현실적 텍스트 익명화 평가를 위한 주체 수준 추론)」은 기존 개인정보 익명화 기술의 구조적 한계를 실증적으로 분석한 연구다. 연구진은 텍스트의 90% 이상을 비식별화(masking)하더라도 개인정보 주체 보호율은 33% 수준에 불과하다는 결과를 도출했다.

이는 공격자 관점에서 개인정보의 약 65% 이상이 여전히 추론 가능하다는 의미다. GDPR 및 국내 개인정보보호법 강화 흐름과 생성형 AI·LLM 학습 데이터 안전성 논의에 중요한 시사점을 제공한다.

연구진은 이러한 한계를 해결하기 위해 'SPIA(Subject-level PII Inference Assessment)' 벤치마크를 새롭게 제안했다. SPIA는 기존 단어·문구 중심의 익명화 평가 방식에서 벗어나 문서에 등장하는 개인정보 '주체(subject)' 단위로 재식별 위험을 평가하는 것이 특징이다.

단순히 개인정보 표현이 가려졌는지를 확인하는 데 그치지 않고, 익명화 이후에도 문맥을 통해 특정 인물의 개인정보를 얼마나 추론할 수 있는지를 평가한다. 이를 위해 연구진은 법률·온라인 등 2개 도메인의 675개 문서와 1,712명의 개인정보 주체 정보를 포함한 데이터셋을 구축했다.

티사이언티픽은 이번 연구 성과를 바탕으로 기존 보안 사업을 넘어 'AI 보안 전문기업'으로의 전환을 가속화한다는 방침이다. 회사는 자사 AI 기반 비정형 개인정보 탐지 솔루션 ‘P3R-Privacy Finder AI(GS 인증 1등급)’에 SPIA 프레임워크와 CPR·IPR 지표를 단계적으로 통합한다.

나아가 연내 하반기에는 한국어 특화 LLM 기반의 탐지 역량을 이미지·음성·영상까지 넓힌 차세대 멀티모달 버전을 신규 출시한다. 기존 P3R 라인업을 멀티모달 영역으로 전면 확장해 시장 경쟁력을 강화한다는 전략이다.

이러한 로드맵은 티사이언티픽이 주관기관으로 참여 중인 개인정보보호위원회·한국인터넷진흥원(KISA) 주관 '2025년 신뢰기반의 AI 개인정보 보호 활용 R&D 사업'과도 연계된다. 티사이언티픽은 월드버텍·연세대학교 산학협력단과 컨소시엄을 구성해 ‘멀티모달형 AI 기반 개인정보 탐지·추적 및 비식별화 기술 개발’ 과제를 수행 중이다. 생성형 AI 서비스 환경에서 발생하는 멀티모달 데이터의 개인정보 유출 및 재식별 위험 대응 기술을 개발하고 있다.

티사이언티픽 AI Lab 오명석 전임연구원(논문 주저자)은 “이번 연구는 '데이터'가 아닌 '사람'을 중심에 두고 개인정보 보호를 재정의한 결과물"이라며 "마스킹만으로는 개인정보 보호가 충분하지 않다는 점을 정량적으로 입증한 만큼, 생성형 AI 및 LLM 학습 데이터를 다루는 기업들의 재식별 위험 관리 중요성이 더욱 커질 것”이라고 말했다.

이어 "티사이언티픽은 SPIA 프레임워크를 기존 제품에 통합하는 동시에, 이미지·음성·영상까지 대응 가능한 멀티모달 개인정보 보호 기술 상용화를 통해 AI 보안 전문기업으로 도약해 나갈 것"이라고 덧붙였다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

공유