축적된 R&D 논문·보고서로 AI 기계학습 데이터 구축한다

축적된 R&D 논문·보고서로 AI 기계학습 데이터 구축한다

류준영 기자
2020.07.24 07:45
국가 과학기술분야 기계학습 데이터 인프라 구축/자료=과기정통부
국가 과학기술분야 기계학습 데이터 인프라 구축/자료=과기정통부

정부가 그간 축적된 국내 R&D(연구·개발) 논문·보고서를 이용해 과학기술 분야 AI(인공지능) 개발에 활용할 수 있는 기계학습데이터를 구축한다.

과학기술정보통신부는 디지털 뉴딜 사업의 일환으로 한국과학기술정보연구원(KISTI)이 저장해둔 논문 등을 대상으로 대규모 과학기술 기계학습 데이터 구축사업을 시작한다고 24일 밝혔다.

KISTI는 논문 본문, 보고서 표·그림 설명 등 데이터 5종, 최대 425만 여건을 레이블링 등 작업을 통해 기계학습에 활용할 수 있는 형태의 데이터로 가공할 계획이다. 이렇게 구축된 데이터는 과학기술 분야 언어이해 모델 개발, 자연어 처리 문제 해결 등에 쓰여 질 예정이다.

이 작업은 KISTI가 만 19세에서 34세 이하 2000명을 채용해 12월까지 시행할 예정이다. KISTI는 이번 사업 참여자들이 기계학습 데이터 구축 역량을 계발해 향후 과학기술분야 기계학습 데이터 레이블링 전문인력으로 계속 활동할 수 있도록 지원할 방침이다.

권석민 과기정통부 과학기술일자리혁신관은 “과학기술 분야 기계학습 데이터가 구축·개방되면, 과학기술 분야 지식자원의 지능적 연계 및 융합연구 지원, 중소기업 기술혁신을 위한 의사결정 및 비즈니스 활용이 가능해질 것”이라고 말했다.

<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>

관련 기사

류준영 기자

·머니투데이 유니콘팩토리(미래사업부) 차장 ·한국과학기자협회 이사 ·카이스트 과학저널리즘 석사 졸업 ·한양대 과학기술정책대학원 박사과정 ·2020년 대한민국과학기자상 ·(저서)4차 산업혁명과 빅뱅 파괴의 시대(공저, 한스미디어) ■전문분야 -벤처·스타트업 사업모델 및 경영·홍보 컨설팅 -기술 창업(후속 R&D 분야) 자문 -과학기술 R&D 정책 분야 컨설팅 -과학 크리에이터를 위한 글쓰기 강연 -에너지 전환, 모빌리티 등 4차 산업혁명 관련 기술 자문 -AI시대 기술경영 및 혁신 자문

공유