알고리즘은 가짜 뉴스를 탐지하고, 확산을 막고, 잘못된 정보에 대응하는 데 유용할 수 있습니다.
브리티시 컬럼비아 대학교 컴퓨터 과학 교수
Laks VS Lakshmanan은 캐나다 자연과학 및 공학연구위원회로부터 자금 지원을 받습니다.
브리티시 컬럼비아 대학교는 The Conversation CA의 창립 파트너로서 자금을 제공합니다.
브리티시 컬럼비아 대학교는 The Conversation CA-FR의 회원으로서 자금을 제공합니다.
모든 파트너 보기
가짜 뉴스는 복잡한 문제이며 텍스트, 이미지, 비디오에 걸쳐 있을 수 있습니다.
특히 서면 기사의 경우 가짜 뉴스를 생성하는 방법에는 여러 가지가 있습니다. 가짜 뉴스 기사는 사람의 이름, 날짜, 통계 등 사실을 선택적으로 편집하여 제작될 수 있습니다. 기사는 사건이나 사람을 꾸며낸 것으로 완전히 조작될 수도 있습니다.
가짜 뉴스 기사는 인공 지능의 발전으로 인해 잘못된 정보를 생성하기가 특히 쉬워짐에 따라 기계로 생성될 수도 있습니다.
다음과 같은 질문이 있습니다. "2020년 미국 선거에서 유권자 사기가 있었나요?" 또는 "기후변화는 사기인가?" 이용 가능한 데이터를 분석하여 사실 확인이 가능합니다. 이러한 질문은 참 또는 거짓으로 답할 수 있지만, 이와 같은 질문에 대한 잘못된 정보가 있을 가능성이 있습니다.
잘못된 정보와 허위 정보, 즉 가짜 뉴스는 짧은 시간 내에 많은 사람에게 해로운 영향을 미칠 수 있습니다. 가짜 뉴스라는 개념은 기술이 발전하기 훨씬 전부터 존재했지만, 소셜 미디어는 문제를 더욱 악화시켰습니다.
2018년 트위터 연구에 따르면 거짓 뉴스는 봇보다 사람이 더 자주 리트윗했으며, 실제 이야기보다 리트윗될 가능성이 70% 더 높았습니다. 같은 연구에서는 실화를 1,500명에게 전달하는 데 약 6배의 시간이 더 걸렸으며, 실화는 1,000명 이상에게 전달되는 경우가 거의 없었지만 인기 있는 거짓 뉴스는 최대 100,000명까지 퍼질 수 있다는 사실을 발견했습니다.
2020년 미국 대통령 선거, 코로나19 백신, 기후 변화 등은 모두 잘못된 정보 캠페인의 대상이 되어 심각한 결과를 초래했습니다. 코로나19를 둘러싼 잘못된 정보로 인해 발생하는 비용은 하루 5천만~3억 달러에 달하는 것으로 추산됩니다. 정치적인 잘못된 정보로 인한 대가는 시민 혼란, 폭력, 심지어 민주 제도에 대한 대중의 신뢰 침식일 수 있습니다.
잘못된 정보를 탐지하는 것은 알고리즘, 기계 학습 모델 및 인간의 조합을 통해 수행될 수 있습니다. 중요한 질문은 잘못된 정보가 감지되면 확산을 막지는 못하더라도 통제할 책임이 누구에게 있느냐는 것입니다. 오직 소셜 미디어 회사만이 네트워크를 통한 정보 확산을 실제로 통제할 수 있는 위치에 있습니다.
잘못된 정보를 생성하는 특히 간단하면서도 효과적인 방법은 뉴스 기사를 선택적으로 편집하는 것입니다. 예를 들어, "'테러를 정당화'한 혐의로 체포되어 기소된 우크라이나 감독이자 극작가"를 생각해 보십시오. 이는 실제 뉴스 기사의 원래 문장에서 "러시아인"을 "우크라이나인"으로 대체함으로써 달성되었습니다.
온라인에서 잘못된 정보의 증가와 확산을 통제하기 위해 잘못된 정보를 탐지하려면 다각적인 접근 방식이 필요합니다.
소셜 미디어의 커뮤니케이션은 네트워크로 모델링될 수 있으며, 사용자는 네트워크 모델의 지점을 형성하고 커뮤니케이션은 이들 사이의 링크를 형성합니다. 게시물의 리트윗이나 좋아요는 두 지점 사이의 연결을 반영합니다. 이 네트워크 모델에서 잘못된 정보를 퍼뜨리는 사람은 진실을 퍼뜨리는 사용자보다 훨씬 더 조밀하게 연결된 핵심-주변 구조를 형성하는 경향이 있습니다.
우리 연구 그룹은 통신 네트워크에서 밀집된 구조를 탐지하기 위한 효율적인 알고리즘을 개발했습니다. 이 정보는 잘못된 정보 캠페인 사례를 탐지하기 위해 추가로 분석될 수 있습니다.
이러한 알고리즘은 의사소통 구조에만 의존하기 때문에 잘못된 정보를 확인하기 위해서는 알고리즘과 인간이 수행하는 내용 분석이 필요합니다.
조작된 기사를 탐지하려면 신중한 분석이 필요합니다. 우리 연구에서는 이러한 변조를 탐지하기 위해 텍스트 정보와 외부 지식 기반을 결합하는 신경망 기반 접근 방식을 사용했습니다.