AI로 가짜뉴스, 딥페이크, 이를 전파하는 소셜 미디어 봇 판별하는 방식
(blog.naver.com)1.영국 기업 로지컬리
- 머신러닝과 자연어 처리 기술, 사람 지능을 결합해 언론 보도 신뢰성을 평가함
- 로지컬리 웹 브라우저 확장 프로그램은 10만여 발행처에서 나온 믿을만한 기사와 함께 내용 맥락을 살펴봄
- 이어 정보 출처와 기사 신뢰성 등을 평가함
- 연구 파트너의 전문가 평가와 AI 예측에 기반해 믿을 수 있거나, 믿어선 안될 정보 출처를 사용자에게 알려줌.
- AI는 기사 내용, 저자 평판과 전문지식, 기사가 소셜 미디어에 유통된 방식을 토대로 기사 신뢰성 여부도 예측함
- 사용자가 사실 확인을 요청하면 팩트체크 팀이 조사해서 결과를 알려줌
2.영국 기업 팩트마타
- 머신러닝, 자연어 처리 기술로 온라인 콘텐츠를 분석해서 가짜 뉴스를 발견함
- 팩트마타는 인터넷에서 만들어진 핵심 주장을 모두 추출하고 이를 한데 모으는 엔진을 구축함
- 12가지 측면에 걸쳐 콘텐츠를 채점하고 분류하는 알고리즘도 설계함
- 논란·비객관성·혐오 발언·인종차별·성 차별·독성·외설·언어 위협·지나친 당파성·낚시성 링크 등이 12가지 측면
- 이는 선전, 허위정보 또는 가짜 뉴스가 될 수 있는 콘텐츠의 언어 특징임
- 팩트마타는 해당 엔진과 알고리즘으로 브랜드, 상품, 온라인 현안에 대한 가짜 뉴스와 혐오 발언을 찾아냄
3.미국 온라인 플랫폼 봇 센티넬
- 머신러닝으로 누군가를 괴롭히는 계정, 허위정보를 퍼뜨리는 계정 등을 탐지함
- 운영진은 계정 수천개와 트윗 수백만개를 이용해 트위터 계정을 분류하도록 머신러닝 모델을 학습시킴
- 먼저 트위터 규정을 반복해서 어기는 계정을 찾음
- 운영진이 ‘문제있다’고 확인한 계정과 비슷한 계정을 분류하도록 모델을 학습시킴
- 계정은 ‘정상(normal)’, ‘충분한(satisfactory)’, ‘지장을 주는(disruptive)’, ‘문제있는(problematic)’으로 분류하고, 각 계정에 점수(%)를 매김
- 점수가 높을수록 이 계정은 문제있을 가능성이 높음
4.미국 기업 메타(페이스북)
- AI로 딥페이크 비디오를 탐지하는 시스템을 개발함
- ‘딥페이크 디텍션 챌린지’를 위해 의뢰한 데이터셋에 있는 비디오로 모델을 학습시킴
- 다중 생성적 적대 신경망도 학습에 활용함
- 메타는 자사 시스템이 이전에 못 본 새로운 딥페이크 비디오를 확인하도록 새 데이터 합성 기술을 사용해 모델을 거의 실시간 업데이트함
- 새로운 딥페이크 비디오를 탐지하면 비슷한 딥페이크 사례를 새로 만듦
- 이를 딥페이크 비디오 탐지 모델의 대규모 학습 데이터로 활용함