뉴스트러스트 운영

추진배경

  • 정보 생산ㆍ유통ㆍ소비의 경계 모호, 정보 흐름의 다변화
  • 어뷰징 뉴스 심화, 언론신뢰 하락. "작성 언론사가 문제" vs "어뷰징 판단 기준 문제"
  • 클러스터링 뉴스 논란. "왜 우리 뉴스가 상위가 아닌가" vs "기계가 했을 뿐"

목적

  • 저널리즘 가치에 기반한 공익적 뉴스 검색‧배열 알고리즘 개발
  • 신뢰도 높은 기사를 뉴스 소비자에게 제공될 수 있는 환경 조성
 

"페이지뷰나 트래픽을 위한 알고리즘이 아니라 식견 있는 공중을 위해 최적화된 알고리즘을 설계하고 구현할 수 있을까?" (Lotan, 2014, p. 118)

지향점

  • 알고리즘 개발과정, 투입요인, 설계도 등 알고리즘 코드와 규범적 가치 등 공개 → 폐쇄적인 뉴스서비스 알고리즘 논의를 공개 논의로 확장


 

위원회 구성

  • 위원회 구성 : 언론 현업(신문, 방송, 인터넷, 통신) + 저널리즘 학자 + 컴퓨터 공학자
    • 신문협회, 방송협회, 인터넷신문협회, 국회 추천을 거쳐 구성
  • 1기 위원회(위원장 윤영철) 출범(2016.05.4.)
  • 2기위원회(위원장 윤영철) 출범(2017.
  • 3기위원회(위원장 김춘식) 출범(2018.03.16.)

【3기 위원회 명단】

3기 위원회 명단
성명 소속 비고
김춘식 외대 미디어커뮤니케이션학부 교수 위원장
구본권 한겨레 사람과디지털연구소장 1~2기 위원
우병현 조선일보 미래전략실장 1~2기 위원
양승찬 숙명여대 미디어학부 교수 2기 위원
오세욱 한국언론진흥재단 연구위원 내부위원
송해엽 군산대 미디어문화학과 교수 신규 위원
정한진 KBS 보도본부 데이터저널리즘 담당 신규 위원
강승식 국민대 컴퓨터공학과 교수 신규 위원

위원회 주요 추진경과

3기 위원회 명단
구분 일시 주요내용
1차회의 '16.5.4
  • 뉴스트러스트 요인 개발 사업 전반 PT. 향후 위원회 운영방안 등 논의
2차회의 '16.5.18
  • 저널리즘 품질 관련 기존 연구/포털 뉴스서비스 기준 등 설명
  • 위원회가 개발하고자 하는 알고리즘 목표/방향 등 논의
3차회의 '16.6.1
  • 뉴스트러스트 관련 저널리즘 가치(정확성, 다양성, 심층성(보편적 가치), 독창성, 투명성, 책무성 등 논의
4차회의 '16.6.14
  • 뉴스 이용자 관점에서의 저널리즘 가치 논의
  • 뉴스 유용성 가치의 분석 방법에 대한 발제 및 토론
5차회의 '16.6.29
  • 디지털뉴스 시장에서의 뉴스 가치 평가 발제 및 토론
  • 뉴스평가 사례 : 구글, 해커뉴스, 국내 포털 뉴스 제목과 기사간 일관성 사례, 콘텐츠 소비율 등 검토
6차회의 '16.7.13
  • 기사 유형별 갖춰야 할 품질 요건 검토
  • 전통적 기사유형과 온라인 기사 유형간 형식 차이 등 논의
7차회의 '16.7.26
  • 논의된 저널리즘 품질 개념과 측정방안 논의
  • 1차 측정 가능한 요인 : 기사의 길이, 인용 수, 정보원 수, 기명기사 여부, 제목과 본문 일치도 등 논의
워크숍 '16.8.19~20
  • 개념지수분과, 분류체계분과, 기술알고리즘분과 회의. 쟁점사항 도출
  • 분과회의 및 전체회의 개최, 쟁점사항 집중 논의
  • 저널리즘 계량요인 개념 보완, 실측정방안 정리, 사전 구축 방안 협의
8차회의 '16.9.8
  • 11개 저널리즘 가치 개념, 조작적 정의, 세부 측정방안 등 논의
  • 뉴스 알고리즘 개발 소위원회 운영 등 결정
9차회의 '16.9.29
  • 저널리즘 가치 - 측정변인간 매트릭스 논의
  • 알고리즘 개발 현황 점검 및 뉴스분류체계 방안 등 논의
10차회의 '16.10.27
  • 테스트기사 군/알고리즘 개발에 필요한 사전 등 구축방안 논의
  • 뉴스트러스트 공개 세미나 개최(12월 초) 방안 등 논의
11차회의 '16.11.24
  • 저널리즘 개념 – 측정변인간 매트릭스 정리
  • 뉴스트러스트 공개 세미나 발제내용 등 논의
  • 재단홈페이지 뉴스트러스트 사업 게재방안 등 논의
공개세미나 '16.12.13
  • 발제 1 : 뉴스알고리즘 기계의 영역에서 공공의 영역으로(최수진 위원)
  • 발제 2 : 신뢰도 높은 뉴스와 알고리즘(구본권 부위원장)
  • 토론 : 황용석 건국대 교수 등 7명
12차회의 '16.12.22
  • 공개 세미나 결과 보고
  • 빅카인즈 기사데이터 기초통계 분석 결과
  • 저널리즘 개념 – 측정변인간 최종안 설명
13차회의 '17.2.24
  • 2기 뉴스트러스트위원회 구성 및 출범
  • 2016년 뉴스트러스트위원회 1기 활동내역 및 성과 설명
  • 뉴스트러스트 알고리즘 개발 현황 등 최종 점검
14차회의 '17.3.3
  • 뉴스트러스트 알고리즘 베타사이트 시연 및 논의
  • 2017년 뉴스트러스트 알고리즘 개발 방향 등 협의
15차회의 '17.10.30
  • 소위원회 논의 결과 보고 및 계량점수 방안 논의
  • 계량점수별 위원회(안), 적용방안, 적용기준 등 논의
  • 계량점수 기준근거 마련 필요, 계량점수별 테스트 후 수정 지속
16차회의 '17.12.18
  • 지표별 점수간 상관관계, 위원회 점수간 상관관계 등 논의
  • 저너리즘 가치별 가중치 부여 방안 논의. 가중치 설정기준은 휴먼코드 평가 결과 및 소위원회 위원들 가중치 부여를 기준으로 설정
  • 가중치 구간 내에서 알고리즘 기계학습 실시, 수정 및 보정
17차회의 '18.3.23
  • 뉴스트러스트 알고리즘 공개 일시, 범위, 방법 등 논의
  • 빅카인즈 회원 43개 언론사에 선 공개 여부, 매뉴얼 작성 등 논의
18차회의 '18.3.28
  • 뉴스트러스트 알고리즘 공개 관련 사항 및 공개 후 필요 사안 논의
  • 3차년도 알고리즘 고도화 계획 논의

뉴스 신뢰도 구성

  • 사실성 : 사실에 기초한 것인지를 "확인"하거나 "검증"할 수 있는 장치를 갖춘 정도
  • 투명성 : 누가 기사를 작성했는지, 어떤 과정을 통해 기사 작성에 필요한 자료를 습득했는지를 명확하게 밝힌 정도
  • 다양성 : 해당 사안을 이해하고 평가하는데 도움이 되는 다양한 관점이 제시된 정도
  • 균형성 : 이해가 상충되는 쟁점 사안에 대해 기사내용이 여러 시각, 의견, 이해관계를 "치우침 없이 고르게" 반영하는 정도
  • 독창성 : 기존 뉴스에서 잘 다루지 않은 차별적인 정보를 제공한 정도
  • 중요성 : 기사에 담긴 뉴스소재가 "공동체의 안녕"과 "공익"에 영향을 미치는 정도
  • 심층성 : 기사내용이 해당 사안을 "깊이" 이해하는 데 필요한 정보를 "충분히" 제공하는 정도
  • 독이성 : 이용자가 기사 내용을 "읽기 쉽고" 그리고 "명확하게 이해하도록" 구성된 정도
  • 유용성 : 이용자의 관심과 주목을 끌만한 내용을 포함한 정도
  • 선정성 : 기사 내용이 "사회적 윤리적 가치"에 반하거나 실제 사실을 지나치게 "과장 왜곡" 혹은 과도한 감정을 드러내는 "선정적" 표현을 사용하는 정도
  • 반복성 : 새로운 팩트없이 기존 기사와 거의 같은 내용을 반복 생산하는 정도

※ 선정성 및 반복성은 부정적 요인

계량 측정요인 간 네트워크 시각화

  • 저널리즘 가치를 계량적으로 측정하기 위한 뉴스 계량 요인 추출, 이론적 관계도 작성

계랑 측정요인간 가중치 평가

계랑 측정요인간 가중치 평가
개념 측정요인 평균
균형성 등장한 모든 정보원의 수가 많을수록 1.00
균형성 무주체 술어(알려졌다, 전해졌다) 사용이 많을수록 -1.08
균형성 상반된 의견의 정보원 인용 비율이 비슷할수록 1.83
균형성 실명 인용 수가 많을수록 1.00
균형성 실명정보원의 수가 많을수록 1.08
균형성 쟁점 사안에 대한 긍정, 부정 발언 비율이 비슷할수록 1.75
균형성 주관적 술어 사용이 많을수록 -1.50
균형성 혐오적 표현 사용이 많을수록 -1.17
다양성 일반 시민 발언 인용이 많을수록 0.83
다양성 쟁점 사안에 대한 긍정, 부정 발언 비율이 비슷할수록 0.58
다양성 기사에 등장한 개체명(인물, 기관, 장소)이 많을수록 1.00
다양성 기사의 길이가 길수록 1.17
다양성 다른 기사와는 구분되는 고유정보가 기사 내에 많이 포함될수록 1.33
다양성 등장한 모든 정보원의 수가 많을수록 1.58
다양성 사용한 정보원의 차별성이 뛰어날수록 1.50
다양성 실명 인용 수가 많을수록 1.50
다양성 실명정보원의 수가 많을수록 1.58
다양성 인용문의 수가 많을수록 1.42
다양성 정보원 전문성이 높을수록 1.00
다양성 하이퍼링크 수가 많을수록 1.17
다양성 활용한 멀티미디어 수가 많을수록 1.00
독이성 문장당 평균 단어수가 많을수록 -1.25
독이성 문장당 평균 부사수가 많을수록 -0.25
독이성 문장당 평균 접속사 수가 많을수록 -1.20
독이성 제목과 본문 내용이 일치할수록 0.67
독이성 맞춤법이 철저히 준수될수록 1.50
독이성 사진 등 이미지 자료 수가 많을수록 1.17
독이성 카드뉴스 형식의 기사인 경우 1.42
독이성 활용한 멀티미디어 수가 많을수록 1.00
독창성 검색 키워드를 많이 사용할수록 -0.92
독창성 일정 중복도 이상 기사들 중 가장 빠른 기사일 경우 1.17
독창성 타사의 추종(뒤늦게 따라가는)보도를 많이 초래한 기사일수록 1.17
독창성 [기획]이라는 컷 사용이 있는 경우 1.08
독창성 [단독]이라는 컷 사용이 있는 경우 1.17
독창성 기존의 다른 기사와 중복이 심할수록 -1.75
독창성 다른 기사와는 구분되는 고유정보가 기사 내에 많이 포함될수록 1.83

위원회 평가 신뢰도 확인을 위한 저널리즘가치 개념 – 계량요인간 상관관계 분석

계랑 측정요인간 가중치 평가
  2 3 4 5 6 7 8 9 10 11 12 13 14 15
title_length                            
contents_length 0.1861                          
sanitized_content_length 0.1824 0.9963                        
sentences_num 0.1341 0.8842 0.8826                      
adjectives_per_sentence 0.0845 0.1961 0.1972 0.0767                    
conjunctions_per_sentence -0.02 0.0518 0.0548 -0.024 0.0753                  
adverbs_per_sentence 0.1318 0.2144 0.2155 0.0965 0.4421 0.1058                
adverbs_in_title 0.1599 0.0618 0.06 0.0632 0.0695 -0.0296 0.2134              
words_in_title 0.8024 0.0946 0.0936 0.0404 0.0149 0.0382 0.0595 0.0923            
attachment_images 0.064 0.2041 0.2066 0.2214 0.0468 -0.0376 0.0615 0.0415 -0.0215          
pair_quotes_in_title 0.2692 0.0454 0.0416 0.0002 0.1438 -0.0249 0.2128 0.1413 0.1047 0.0272        
quotes_in_title 0.266 0.0292 0.0247 0.0244 0.047 -0.0593 0.054 0.0787 0.1022 0.0813 -0.0942      
question_in_title 0.0951 0.0373 0.035 0.0503 0.0494 -0.0111 0.0563 0.1037 -0.0088 0.0579 0.0397 0.0682    
exclamation_in_title 0.021 -0.0026 -0.0036 0.0125 -0.0001 -0.0191 0.0018 0.0432 -0.0239 0.042 -0.0038 0.0108 0.0105  
shock_in_title 0.0067 -0.0017 -0.0021 -0.0012 -0.0012 -0.0023 0.0003 0.0006 0.0021 -0.0015 -0.0014 0.0181 -0.003 0.0032

알고리즘 모델

  • 추출된 계량 요인에 따라 기사를 배열하는 과정에 대한 모델링을 실시함
  • 모델링 과정에서 전체 기사가 아닌 클러스터링된 기사들을 대상으로만 배열을 하기로 결정
  • 기사 배열 과정에서 이용자들이 저널리즘 가치별로 가중치를 조정할 수 있도록 결정

데이터 분석 흐름도


이 페이지에서 제공하는 정보에 대하여 어느정도 만족하셨습니까?

참여

관리자의 답변이 필요한 의견은 고객의 소리 게시판을 이용해 주시기 바랍니다.

통합검색
상세검색 상세검색
공지사항 목록
검색대상         
검색기간 시작날짜 선택버튼"  ~   끝날짜 선택버튼
검색방법 포함된 결과(AND)는 검색어 사이에 공백(" ")을 입력   하나라도 포함된 결과(OR)는 검색어 사이에 바("|")를 입력
통합검색 닫기
맨위로