KASPR

KOREAN ACADEMIC SOCIETY FOR PUBLIC RELATIONS

학술대회 자료집 KOREAN ACADEMIC SOCIETY FOR PUBLIC RELATIONS

한국PR학회 학술대회 , (2021)
pp.4~5

- 방송 동영상 기반 인공지능 학습데이터 구축과 PR 분야에서 인공지능의 활용 가능성 -

박대민

(선문대)

합성곱 신경망(CNN)의 등장 이후 컴퓨터 비전에서 딥러닝의 활용도가 비약적으로 커지고 있 다. 동영상 분야의 인공지능(AI) 학습데이터를 대규모로 구축하고, 이를 활용해 다양한 AI 모델을 개선함으로써, 수준 높은 AI 기반 서비스를 제공할 수 있을 것으로 기대된다. 특히 방송 분야는 제작, 유통, 소비 등 전 과정에서 AI 기반 서비스의 활용 가능성이 매우 크다. 더 나아가 방송 동영상은 오랜 기간 다양한 분야에서 방대한 양의 실연 상황을 담고 있다. 이에 따라 방송 동영 상을 이용해 AI 학습데이터를 구축하면 강건한 모델을 만들 수 있을 것으로 기대된다. 이 연구는 한국지능정보사회진흥원의 AI 허브 사업을 중심으로 방송 동영상을 활용한 AI 학습 데이터 구축 현황을 분석하고 PR 분야에서의 활용 가능성을 살펴보고자 한다. 2021년 11월 현재 AI 허브에는 MBN, KBS, EBS, SBS, YTN, OBS, tvN 등 6개 방송사에서 드라마, 보도, 교양, 예 능, 유튜브 동영상을 활용한 AI 학습데이터가 구축되어 있다. 구축량은 3700시간 1542만 건이 넘 는 동영상 클립으로 대부분 바운딩박스 형태의 학습데이터를 제공한다. AI학습데이터를 활용한 시범 모델로는 CNN, RNN, GAN, 전이학습 등 동영상 분야 AI 모델 대부분을 제시하고 있다. 관 련 과업으로는 객체 탐지, 행동 인식, 영상 요약, 영상 이해, 멀티 모달 등이 있다. 또한 방송 동 영상을 직접 활용하지는 않았지만 KPOP 안무나 골프, 농구, 축구 등 스포츠 관련 동영상 등 방 송 분야와 관련성이 높은 AI 학습데이터 또한 구축됐다. 구축된 AI학습데이터는 원천동영상과 함께 AI 모델 개발 목적으로는 무상으로 사용할 수 있다 는 장점을 갖는다. 개선점으로는 현재 구축 주체별로 다른 동영상 클립 파일명, 객체와 행동 등 의 클래스, 어노테이션 데이터셋 등에 대한 통합적인 데이터 표준화와 데이터 모델링 및 데이터 베이스 구축, 이를 바탕으로 압축 파일 형태로 제공되는 AI 학습데이터를 클립 단위로 전처리된 원천데이터와 함께 제공하는 인터페이스의 제공 등을 들 수 있다. 과업별로 표준적인 AI 학습데 이터 품질 평가 기준을 마련할 필요도 있다. 또한 기 구축된 학습데이터의 품질을 재작업을 통해 보다 높은 기준에 부합하도록 높이거나, 전처리된 원천데이터를 다른 과업에 활용하는 방식 등을 고려할 수 있다. 추가적으로 이러한 작업을 뒷받침하는 크라우드 소싱 기반 레이블러와 GPU 등 의 인프라를 제공하는 방법을 모색할 필요도 있다. PR 분야 역시 AI 학습데이터 구축과 AI 모델 및 관련 서비스 개발에 참여할 필요가 있다. 1 차적으로 AI 학습데이터에 구축되는 크라우드 소싱 기반 레이블러는 보다 체계적인 수작업 기반 의 영상 분석 도구로 활용할 수 있다. 구축된 AI 학습데이터를 활용하면 PR 관점에서 고성능을 발휘하는 AI 모델을 개발할 수 있다. 고도화된 AI 기반 비디오 애널리틱스(Video analytics)를 활 용하면 텍스트에서 널리 활용되는 빅데이터 분석을 영상 분야로 확대 적용할 수 있다. 더 나아가 영상 검색, 영상 추천, 영상 분류, 영상 요약, 영상 이해, 영상 생성 등을 활용해 AI 기반으로 동 영상 콘텐츠를 효율적으로 제작하는 한편, 준 실시간으로 성과를 분석하여 효율적으로 캠페인을 집행함으로써 PR 분야에 AI 기반 디지털 트랜스포메이션을 가속화시킬 수 있을 것으로 기대한다.

다운로드 목록