• 제목/요약/키워드: 낚시성 기사

검색결과 5건 처리시간 0.01초

딥러닝 기법을 이용한 낚시성 기사 제목 분류에 대한 연구 (A study on classification of hooking headlines using deep learning techniques)

  • 최용석;최한나;신지혜;정창민;안정연;유채영;임채은;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-17
    • /
    • 2015
  • 본 논문은 낚시성 기사 제목과 비낚시성 기사 제목을 판별하기 위한 시스템을 제시한다. 서포트 벡터 머신(SVM)을 이용하여 기사 제목을 분류하며, 분류하는 기준은 딥러닝 기법중의 하나인 워드임베딩(Word Embedding), 군집화 알고리즘 중 하나인 K 평균 알고리즘(K-means)을 이용한다. 자질로서 기사 제목의 단어를 사용하였으며, 정확도가 83.78%이다. 결론적으로 낚시성 기사 제목에는 낚시를 유도하는 특별한 단어들이 존재함을 알 수 있다.

  • PDF

낚시성 인터넷 신문기사 검출을 위한 특징 추출 (Feature Extraction to Detect Hoax Articles)

  • 허성완;손경아
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1210-1215
    • /
    • 2016
  • 스마트 기기의 발달로 많은 사람들이 인터넷 신문기사를 이용하고 있다. 하지만 인터넷 언론사간의 치열한 경쟁으로 조회수를 올리기 위한 낚시성 기사가 범람하고 있다. 낚시성 신문기사는 제목을 통해 올바른 기사의 줄거리가 제공되지 않았을 뿐만 아니라, 독자로 하여금 잘못된 내용을 떠올리게 한다. 낚시성 신문기사는 핵심에서 벗어난 유명인사 인용, 애매한 문장의 마무리, 제목과 내용의 불일치 등의 특징을 갖는다. 본 논문에서는 이러한 낚시성 기사를 분류하기 위한 특징을 추출하고 성능을 검증해 본다. 기사에 달린 댓글의 키워드를 활용하여 대용량 학습데이터를 생성하고 이를 기반으로 다섯 가지 분류 특징을 추출하였다. 추출된 특징들은 서포트 벡터 머신 분류기를 이용한 실험에서 92%의 정확도를 보여 낚시성 인터넷 신문기사를 분류하는데 적합하다고 판단된다. 뿐만 아니라 제목과 본문의 일관성을 측정하기 위한 전처리 방법으로 고안한 선택적 바이그램 모델은 낚시성 인터넷 신문기사 분류 외에도 일반적인 단문 분석을 위한 전처리 방법으로 유용할 것으로 기대된다.

텍스트 마이닝을 이용한 기사 내 부적합 문단 검출 시스템 (Detecting Improper Sentences in a News Article Using Text Mining)

  • 김규완;신현주;김선진;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-297
    • /
    • 2017
  • SNS와 스마트기기의 발전으로 온라인을 통한 뉴스 배포가 용이해지면서 악의적으로 조작된 뉴스가 급속도로 생성되어 확산되고 있다. 뉴스 조작은 다양한 형태로 이루어지는데, 이 중에서 정상적인 기사 내에 광고나 낚시성 내용을 포함시켜 독자가 의도하지 않은 정보에 노출되게 하는 형태는 독자가 해당 내용을 진짜 뉴스로 받아들이기 쉽다. 본 논문에서는 뉴스 기사 내에 포함된 문단 중에서 부적합한 문단이 포함되었는지를 판정하기 위한 방법을 제안한다. 제안하는 방식에서는 자연어 처리에 유용한 Convolutional Neural Network(CNN)모델 중 Word2Vec과 tf-idf 알고리즘, 로지스틱 회귀를 함께 이용하여 뉴스 부적합 문단을 검출한다. 본 시스템에서는 로지스틱 회귀를 이용하여 문단의 카테고리를 분류하여 본문의 카테고리 분포도를 계산하고 Word2Vec을 이용하여 문단간의 유사도를 계산한 결과에 가중치를 부여하여 부적합 문단을 검출한다.

  • PDF

텍스트 마이닝을 이용한 기사 내 부적합 문단 검출 시스템 (Detecting Improper Sentences in a News Article Using Text Mining)

  • 김규완;신현주;김선진;이현아
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.294-297
    • /
    • 2017
  • SNS와 스마트기기의 발전으로 온라인을 통한 뉴스 배포가 용이해지면서 악의적으로 조작된 뉴스가 급속도로 생성되어 확산되고 있다. 뉴스 조작은 다양한 형태로 이루어지는데, 이 중에서 정상적인 기사 내에 광고나 낚시성 내용을 포함시켜 독자가 의도하지 않은 정보에 노출되게 하는 형태는 독자가 해당 내용을 진짜 뉴스로 받아들이기 쉽다. 본 논문에서는 뉴스 기사 내에 포함된 문단 중에서 부적합한 문단이 포함 되었는지를 판정하기 위한 방법을 제안한다. 제안하는 방식에서는 자연어 처리에 유용한 Convolutional Neural Network(CNN)모델 중 Word2Vec과 tf-idf 알고리즘, 로지스틱 회귀를 함께 이용하여 뉴스 부적합 문단을 검출한다. 본 시스템에서는 로지스틱 회귀를 이용하여 문단의 카테고리를 분류하여 본문의 카테고리 분포도를 계산하고 Word2Vec을 이용하여 문단간의 유사도를 계산한 결과에 가중치를 부여하여 부적합 문단을 검출한다.

  • PDF

『조선왕조실록(朝鮮王朝實錄)』을 통해 본 왕의 위락활동 유형과 변천 (A Study on the Types and Changes of the King's Amusement Activities through 『Annals of The Joseon Dynasty(朝鮮王朝實錄)』)

  • 강현민;신상섭;김현욱;마일초;한서정
    • 한국전통조경학회지
    • /
    • 제36권4호
    • /
    • pp.39-49
    • /
    • 2018
  • "조선왕조실록"을 중심으로 분석한 조선시대 제왕들의 위락활동과 변천에 관한 연구 결과는 다음과 같다. 궁중 안팎 외부공간에서 행해진 왕의 위락활동은 연회형, 강무형, 유희형으로 분류할 수 있는데, 연회형은 회례연, 진연(進宴), 풍정(豊呈), 진찬(進饌), 양로연, 사신연, 수연(壽宴), 곡연(曲宴) 등이었고, 강무형은 활쏘기, 격구, 사냥 등이며, 유희형은 나례(가면놀이), 처용무, 풍두희(?頭戱), 그리고 화산붕(불꽃놀이), 꽃놀이(賞花), 투호, 수박희(手搏戱), 낚시, 뱃놀이, 각투(角鬪), 상희(象戱), 잡희 등이었다. 위락 활동은 고려시대 답습기[1기, 태조~세조(예종)], 확립기[2기, 군사문화가 성리학 문화로 전환되었고 연회의 규례가 제도화, 성종~중종]. 단절기[3기, 임진왜란 등 불안한 정세 속에서 침체, 단절 초래, 성종~현종]. 중흥기[4기, 위락 문화 재정비, 수준 높은 왕실 문화의 자긍심 표출, 숙종~정조]. 그리고 쇠퇴기[5기, 세도정치로 왕권이 추락하면서 위락 활동이 급격히 퇴조, 순조~순종] 등 5단계시기로 구분할 수 있다. 왕들의 사냥 관련 기사는 600건 이상 추적 되는데, 태종, 세종, 세조 등은 각 100여회 이상이었다. 사냥 대상은 호랑이, 곰, 사슴과 노루, 표범, 멧돼지, 매 등 이었고, 한양의 동북쪽 산림지역에서 주로 행해졌는데, 산수풍광이 수려하고 지리에 익숙한 풍양, 철원지역 등 북방의 정세와 안전을 살피기 위한 방안, 그리고 풍양이궁(경기도 남양주시 진접읍 내각리) 장소성 등과 밀접하게 연계된다. 단오절 세시풍속으로 대중에 확산된 격구놀이는 조선 초 왕과 신하들의 최상류층 마상격구로부터, 중기이후 무과시험의 마상격구와 상류층의 보상격구로 전환되는 과정을 거쳐, 조선 후기에는 민간에 확산되어 겨울철 남성들의 집단유락문화로 전승되는 과정이 추적된다. 특히, 강무형 위락문화는 봄(활쏘기), 여름(투호), 가을(활쏘기), 겨울(격구) 등 심신수양을 겸한 4계절 행위요소로 작용되었다. 한편, 조선시대 왕과 왕비들의 연향과 같은 위락 활동은 공식적 의례의 경우 내정(內庭)에서, 비공식적 관유(觀遊)의 경우 궁궐 후원이나 별궁에서, 특수 연회의 경우 모화관과 태평관, 기로소 등 별원(別園)에서, 활쏘기의 경우 성균관 사단에서, 사냥의 경우 금표가 설치된 강무장(금원과 원유)에서, 매사냥의 경우 한강변 광나루에서, 격구의 경우 보격구 중심으로 내정이나 별궁에서 다양하게 행해졌다. 즉, 외조, 치조, 연조, 후원의 범위를 넘어서 별원과 금원, 원유 등 한양에서 최대 100리 범위 까지를 활동영역으로 설정하는 위락문화 확장성(정(庭)${\rightarrow}$원(園)${\rightarrow}$원(苑)${\rightarrow}$원유(苑?))을 추적할 수 있었다. 결과적으로 본 연구를 통해 수준 높은 기록문화의 추적을 통해, 역대 왕들의 위락문화를 연회형, 강무형, 유희형으로 유형화 할 수 있었고, 위락 활동(진찬, 회례연, 양로연, 대사례, 사신연 등은 물론 사냥, 활쏘기, 격구, 투호, 처용무, 낚시, 뱃놀이, 불꽃놀이 등) 전모와 장소성, 그리고 상징적 의미, 역사적인 전승과정과 위락문화 등을 복합적으로 탐색할 수 있었다.