• 제목/요약/키워드: 인용구

검색결과 57건 처리시간 0.023초

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

유사인용문의 화법 구조 (The Attitudinal Force of Psuedo-Quotation Sentences in Korean)

  • 김종현
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.178-185
    • /
    • 2000
  • 청자를 직접 대면한 상황에서 1인칭 화자는 {X, Y, 말했다}의 인용구조를 갖추지 않은'[...]고'의 '유사인용문'을 사용하여 주관적 관점을 표현한다. '-다고'로 종결되는 유사인용문 형식이 인용문의 화법과 유사한 기저구조를 지니는 것으로 보고, 화법구조상에서 관점문과 보고문의 의미적 속성을 밝혀나가는 과정에서 유상인용문의 발화 효과와 화자의 발언의도를 설명한다. 화자가 취하는 관점의 선택에 따라 1인칭 화자인 [나] 이외에 다른 제 3 의 주체, 사회적 구속력 등이 화자의 배경지식에 자리잡는 것을 가능세계의 논리적 분할의 측면에서 구분하고 이것이 유사인용문 화자의 발언 동기에 반영되는 정도의 차이에 따라서 화자의 단언적 태도와 완곡의 태도가 각각 실현되는 것임을 보인다.

  • PDF

복수저자기반 동시인용분석을 활용한 지적구조 분석: 경제학 분야를 중심으로 (Domain Analysis on Economics by Utilizing Cocitation Analysis of Multiple Authorship)

  • 곽선영;정은경
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.115-134
    • /
    • 2012
  • 전통적인 저자동시인용분석은 인용색인 데이터베이스가 색인하는 제 1저자만을 대상으로 하기 때문에 제1저자 이외의 저자의 기여도가 제외된다는 한계를 지니고 있다. 본 연구의 목적은 경제학 분야를 대상으로하여 복수저자기반의 저자동시인용분석을 활용하여 해당 학문분야의 지적구조를 제시하고자 한다. 이를 위하여 네 가지 실험집단을 구성하였다. (1) 인용된 문헌의 제 1저자만을 고려한 저자동시인용분석, (2) 문헌당 총합 제한 없이 복수저자에게 동일한 인용빈도 부여한 저자동시인용분석, (3) 문헌당 총 합을 제한하여 인용빈도를 부여한 저자동시인용분석, (4) 저자기입 순서를 고려하여 인용빈도를 부여한 저자동시인용분석. 본 연구의 결과는 크게 제 1저자만 고려한 방식과 복수저자를 모두 고려한 방식에 따라 군집형성에 있어서 차이를 보였다. 또한 복수저자의 인용빈도를 구하는 방식에 따라서 군집의 소속이 달라지는 변화를 찾아볼 수 있다. 이러한 결과는 공동저작이 증가하는 학문적 추세에 비추어서 학문의 지적구조를 밝히기 위해서는 복수저자가 고려된 저자동시인용분석이 중요하다는 점을 시사한다.

자동 구축된 구문패턴사전과 규칙을 이용한 구묶음 (Chunking Using Automatic Constructed Syntactic Pattern Dictionary and Rule)

  • 임지희;최호섭;이정철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.35-39
    • /
    • 2004
  • 본 논문은 실용적인 구문분석기의 전단계로서, 자동 구축된 구문패턴사전과 규칙을 이용하여 구묶음하는 방법을 제안한다. 우선 규칙은 구문분석 말뭉치(30,875어절)를 대상으로 자동 추출된 고빈도의 규칙(Rewriting Rule)을 본 논문에 맞게 수동으로 구축하였다. 규칙은 조건부, 행위부로 이루어진 이진 규칙(binary rule)의 형태를 이루며, 명사구(NP), 수식어구(AP, DP), 인용구(X), 용언구(VP, VC)을 대상으로 15개를 구축하였다. 그리고 구문패턴은 중심어와 중심어 선행 요소의 특성뿐만 아니라 중심어 후행 요소도 고려하여 형식화시킨 것으로, 중심어의 복합용언 여부에 따라 일반용언패턴과 본+보조용언패턴으로 구분한다. 부분적인 언어 현상의 처리보다는 실세계에서 사용되는 수많은 문장들에 내재되어 있는 매우 광범위한 언어 현상의 처리를 하기 위해, 구문패턴은 형태소주석 말뭉치(460만 어절)을 대상으로 자동 구축하였다. 구축된 구문패턴사전과 규칙을 이용하여 구묶음을 수행한 결과 정확율 83.09%가 나타났다.

  • PDF

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

네트웍 링크 가중치 계산 방법인 중첩 함수를 이용한 과학-기술-산업의 지식흐름에 관한 연구 (A Study On the Knowledge Flow of Science, Technology and Industry using Overlap Function of Network Link Weights Calculation Method)

  • 권오진;노경란;서진이;김완종;정의섭;박현우
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2006년도 추계학술대회
    • /
    • pp.323-337
    • /
    • 2006
  • 최근 과학 기술 정책 및 산업 정책을 수립하기 위해 과학, 기술, 산업의 지식 흐름에 대한 연구가 최근 활발히 진행되고 있다. 과학, 기술, 산업 간의 관계를 r명하기 위한 연구는 과학과 기술 측면, 기술과 산업 측면에서 주로 연구되었고, 과학-산업측면에 대한 연구는 미진한 상황이다. 본 연구는 특허인용정보를 사용하여 과학-기술-산업에 대한 지식흐름을 측정하는 방법을 제시하고자 한다. 한국의 지식흐름을 정량적으로 측정할 수 있는 방법은 미국특허의 인용정보와 유럽특허의 인용정보를 이용하는 방법이 있으나 본 연구는 한국인이 미국에 출원한 인용정보를 이용하여 한국의 과학-기술-산업에 대한 흐름을 분석하고자 한다. 이를 위해 미국특허에 인용된 학술문헌정보를 추출하여 특허의 기술 분야와의 매핑을 통해 구해진 과학-기술간 지식흐름 데이터와, OECD가 발표한 특허와 산업간 매핑 소프트웨어인 OTC 프로그램을 수정하여 기술-산업간 지식흐름 데이터를 산출하여 이를 토대로 네트웍 링크 가중치 계산 방법인 overlap function을 적용하여 과학-산업간 지식흐름을 살펴보고자 한다.

  • PDF

신.구 규격 PE배관 안정성 확보를 위한 식별표시

  • 대한설비건설협회
    • 월간 기계설비
    • /
    • 8호통권205호
    • /
    • pp.53-53
    • /
    • 2007
  • 한국가스안전공사는 하반기부터 신 규격 PE배관은 4열 보조선(검정색) 표시 배관 사용을 원칙으로 하되, 4열 보조선이 없는 신 규격 PE배관을 사용할 경우 로케팅와이어를 따라 길이방향으로 100% 검정색 PE Tape를 1열로 부착할 것을 권고했다. 한국가스안전공사의 이같은 조치는 지난 2006년 12월 1일부터 PE배관 KS규격(KSM 3514)이 ISO규격을 인용한 신 KS규격으로 변경됨에 따라 신·구 규격 PE배관 상호 접합시 안전성 확보방안이 요구됨에 따른 것이다.

  • PDF

신 KS M 3514 PE배관 식별 표시 검사 기준

  • 대한설비건설협회
    • 월간 기계설비
    • /
    • 12호통권209호
    • /
    • pp.66-68
    • /
    • 2007
  • 한국가스안전공사는 2006. 12. 01부터 PE배관 KS 규격(KS M 3514)이 ISO 규격을 인용한 신 KS규격으로 변경됨에 따라 신.구 KS규격 PE배관을 서로 연결할 경우 안전성을 확보할 필요가 있어 이를 식별할 기준을 마련했다. 따라서 2007. 11. 01 이후 제조된 배관은 신 KS M 3514 PE배관 검사기준을 적용해 검사 및 판정 받아야 한다.

  • PDF

특허 인용 정보를 이용한 과학-기술-산업 지식흐름에 관한 연구 (A Study on the Knowledge Flow of Science, Technology and Industry using Patent Citation Information)

  • 권오진;노경란;서진이;김완종;정의섭;박현우
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.706-710
    • /
    • 2006
  • 과학 기술 정책 및 산업 정책을 수립하기 위해 과학, 기술, 산업의 지식 흐름에 대한 연구가 최근 활발히 진행되고 있다. 지금까지 과학, 기술, 산업간의 관계를 규명하기 위한 연구는 과학과 기술 측면, 기술과 산업 측면에서 주로 연구되었고, 과학-산업측면에 대한 연구는 미진한 상황이다. 본 연구는 특허인용정보를 사용하여 과학-기술-산업에 대한 지식흐름을 측정하는 방법을 제시하고 자 한다. 특허와 이 특허에 인용된 학술문헌정보간 매핑을 통해 구해진 과학-기술간 지식흐름 데이터와, OECD가 발표한 특허와 산업간 매핑 소프트웨어인 OTC 프로그램을 이용하여 구해진 기술-산업간 지식흐름 데이터를 토대로 네트웍 링크 가중치 계산 방법인 오버랩 함수를 적용하여 과학-산업간 지식흐름을 규명하는 방법을 제시하고자 한다.

  • PDF