• 제목/요약/키워드: 기사 조합

검색결과 23건 처리시간 0.027초

NOD(News On Demand) 데이터의 인기도와 생명주기를 이용하는 시간 윈도우에 기반한 캐시 재배치 기법 (Time Window based Cache Replacement Strategy using Popularity and Life of News-Demand Data)

  • 최태욱;박성호;김영주;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.101-103
    • /
    • 1998
  • 뉴스기사를 구성하는 NOD데이터는 VOD(Video on Demand) 데이터와는 달리 미디어의 종류 및 크기, 시간적인 접근 지역성, 사용자와 상호 작용성 등의 차이점을 가질 뿐만 아니라 새로운 뉴스기사가 수시로 생성되고 사용자가 인기도가 높은 기사와 최신의 뉴스기사에 더 많이 접근하는 특성을 가진다. 본 논문에서는 현재 서비스중인 전자신문의 로그파일을 분석하여 NOD 뉴스기사의 인기도가 Zipf분포와 다름을 보이고, 뉴스기사의 생명주기Lifr Cycle)에 따른 접근 확률분포 제시한다. NOD 데이터의 접근 편기성으로 인하여 데이터 캐싱을 통한 NOD 서버의 성능 향상을 기대할 수 있으나 뉴스기사의 생명주기가 짧고 접근시간대별로 사용자 접근형태가 변하는 등의 이유로 단순히 인기도만 고려한 캐싱은 빈번한 데이터 재배치 문제로 인해 높은 캐시 관리비용을 야기한다. 따라서 본 논문에서는 뉴스 기사의 접근 편기성에 나타나는 인기도(popularity)와 생명주기를 조합한 척도를 제안하고 이를 이용한 재배치를 제안한다.

  • PDF

모바일 시대의 기사 길이에 관한 탐색적 연구 (An Exploratory Study on the Proper Length of Article in Mobile Era)

  • 정연구;정예현;곽아기;이푸름
    • 한국언론정보학보
    • /
    • 제79권
    • /
    • pp.140-164
    • /
    • 2016
  • 컴퓨팅과 이동통신이 결합되면서 완전히 새로운 취향의 콘텐츠가 만들어지고 있는 모바일 시대에 맞는 기사 길이는 어느 정도일까? 지금까지 고급 저널리즘의 기준으로 인식되기도 한 긴 기사가 여전히 모바일 시대에도 적절할까? 인터랙티브와 검색 기능을 이용한 짧은 기사의 조합이 가독성과 정보량이라는 가치를 만족시켜줄 수 있지 않을까? 이런 문제에 대한 해답을 찾고자 하는 것이 이 연구의 목표다. 연구 방법으로는 현장 실험(field experiment)을 채택했다. 사전 조사를 통해 모바일 기기에서 '손을 쓰지 않고 한 눈에 볼 수 있는' 346자의 기사부터 신문과 방송 뉴스에서 자주 쓰이는 633자, 1033자, 1368자의 기사를 만들었다. 자극물은 길이만 다를 뿐 주요취지는 똑같아지도록 처치했다. 이를 성별, 계열, 학년을 동수로 할당한 대학생 샘플 384명을 대상으로 조사했다. 신문대판 혹은 모바일 페이지를 통해 자신에게 주어진 네 종류 중 하나의 기사를 접촉하고 선호도, 기사질 평가, 기억회상에 관련한 답을 하도록 했다. 분석결과 신문에서는 1033자와 346자의 기사가 고르게 좋은 평가를 받았다. 모바일에서는 손을 거의 움직이지 않고 볼 수 있는 346자와 633자가 고르게 좋은 평가를 받았다. 앞으로 점차 모바일 기계에 의존해 뉴스를 읽는 수용자가 늘어날 경우를 대비한다면 신문 지면의 기사도 346~633자를 기본으로 하는 다양한 전략을 고려해볼 필요가 있을 것으로 보인다.

  • PDF

개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출 (COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information)

  • 박채원;강지원;이다은;이문영;한진영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

상수도시스템 수질사고의 전개양상을 고려한 비정형정보 의미분석 (Semantic analysis of unstructured information considering the step in progress of water quality accidents in the water supply systems)

  • 홍성진;문기훈;양성훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.378-378
    • /
    • 2022
  • 상수도시스템의 과정 중 최종 단계인 급수단계에서 지역전반에 수질문제가 발생할 경우, 직간접적인 피해의 해결은 장기간 지속될 수 있다. 본 연구에서는 실시간 비정형정보의 빅데이터 분석을 통해 상수도시스템에서 수질사고 문제의 파급력과 2차 피해 등의 연결 관계 변화 추적을 위한 기초적 분석을 수행하였다. 과거 대규모 수질사고가 발생된 바 있는 인천광역시 유충발생 사고를 대상으로 뉴스 기사 웹크롤링 절차를 정립하고, 그 결과를 분석하였다. '인천 유충'이 최초 보도되었던 2020년 7월 13일 부터 이후 1년을 대상으로 네이버 통합검색에 의해 표출되는 뉴스기사를 웹크롤링하였으며, 프로그래밍을 통한 불용어 제거 및 관련성 검토를 통해 총 920건의 기사를 분석하였다. 수질사고의 전개양상에 따라 사고발생, 확산, 수습, 그리고 보상의 4단계로 임의 구분하여 분석하였다. 의미분석을 위한 토픽모델링 기법은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방법을 적용하였으며, 긍부정 감정분석은 KNU 한국어 감성사전(KNU sentiment lexicon)을 활용하여 수행하였다. 토픽 모델링 결과, 사고 발생에서부터 확산, 수습, 보상의 단계에 맞춰 적절한 주제어의 조합에 따른 기사들이 도출되었으며, 단계별 긍부정 기사 비율역시 사고의 전개단계에 따라 적절히 나타남을 확인하였다. 제시된 수질사고 관련 비정형정보 분석 방법론과 결과는 과거 사고 사례 분석을 통한 검색 및 긍부정 키워드 확정, 키워드 발생 비율 변동(사고전과 후)에 따른 상황판단 기준설정 등에 활용이 가능하다.

  • PDF

단어 관련성 추정과 바이트 페어 인코딩(Byte Pair Encoding)을 이용한 요약 기반 다중 뉴스 기사 제목 추출 (Summarization Based Multi-news Title Extraction Using Term Relevance Estimation and Byte Pair Encoding)

  • 유홍연;이승우;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.115-119
    • /
    • 2018
  • 다중 문서 제목 추출은 하나의 주제를 가지는 다중 문서에 대한 제목을 추출하는 것을 말한다. 일반적으로 다중 문서 제목 추출에서는 다중 문서 집합을 단일 문서로 본 다음 키워드를 제목 후보군으로 추출하고, 추출된 후보를 나열하는 형식의 연구가 많이 진행되어져 왔다. 하지만 이러한 방법은 크게 두 가지의 한계점을 가지고 있다. 먼저, 다중 문서를 단순히 하나의 문서로 보는 방법은 전체적인 주제를 반영한 제목을 추출하기 어렵다는 문제점이 있다. 다음으로, 키워드를 조합하는 형식의 방법은 키워드의 단위를 찾는 방법에 따라 추출된 제목이 자연스럽지 못하다는 한계점이 있다. 따라서 본 논문에서는 이 한계점들을 보완하기 위하여 단어 관련성 추정과 Byte Pair Encoding을 이용한 요약 기반의 다중 뉴스 기사 제목 추출 방법을 제안한다. 평가를 위해서는 자동으로 군집된 총 12개의 주제에 대한 다중 뉴스 기사 집합을 사용하였으며 전문 교육을 받은 연구원들이 정성평가를 진행하여 5점 만점 기준 평균 3.68점을 얻었다.

  • PDF

트위트 이형 정보 망을 이용한 뉴스 기사의 사용자 지향적 클러스터링 (User Oriented clustering of news articles using Tweets Heterogeneous Information Network)

  • 무하마드 쇼아입;송왕철
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.85-94
    • /
    • 2013
  • 월드와이드 웹, 특히 web 2.0의 출현과 함께 뉴스 기사들의 양이 엄청나게 증가하면서 독자들이 그들의 요건에 맞춰 뉴스기사를 선택하는데 어려움이 있다. 이러한 문제를 해결하기 위해서 여러 클러스터링 메커니즘이 뉴스기사들을 분별하도록 제안되었다. 하지만, 이러한 기법들은 완전히 기계 지향적 기법들이고, 클러스터링의 멤버쉽을 결정하는 과정에 사용자의 참여가 제외되어 있다. 본 논문에서는 뉴스 기사 클러스터링 처리과정에서 참여문제를 해결하기 위해서, 객체들을 클러스터링하는 뉴스 기사와 트위터에 포스트하려는 사용자의 결정을 조합하므로써 뉴스 기사를 클러스터링하는 프레임워크를 제안한다. 우리는 이를 위해 트위터 해쉬-태그를 이용할 수 있도록 했다. 더욱이, 트윗된 글에 대한 리트윗 빈번도에 기반하여 사용자의 신용도를 계산하므로써, 클러스터링 멤버쉽 함수의 정확도를 개선시키려 한다. 제안된 방법에 대한 성능을 보이기 위해, 2013년도에 파키스탄에서 있었던 선거동안에 발생한 메시지를 이용했다. 우리의 결과를 통해 사용자의 결과를 이용하므로써, 일반 클러스터링보다 더 나은 결과물이 달성될 수 있음을 보였다.

중형항공기사업의 새로운 장 마련할 AI(R) 프로젝트

  • 한국항공우주산업진흥협회
    • 항공우주
    • /
    • 제50권
    • /
    • pp.18-21
    • /
    • 1997
  • 표류하던 중형항공기사업에 새바람이 불었다. 중국과의 협상결렬과 포커사의 인수불발로 답보상태에 빠져있던 중형기사업조합은 그동안 대안사업을 추진한 결과 지난 97년 4월 11일 유럽의 지역간 항공기 제작업체인AI(R)사와 항공기국제공동개발에 대한 양해각서(MOU)를 체결하고 올 하반기부터 본격적으로 사업을 추진키로 했다. 본 고에는 그동안 AI(R)사의 선정과정과 배경 그리고 협상내용을 살펴보기로 한다.

  • PDF

한글 상호(商號)를 로마자로 변환하기 위한 고속 부분문자열 분석 알고리즘 (High Speed Substring Analysis Algorithm for Converting from the Korean Company Name to Roman Characters)

  • 황명진;조선호;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.168-170
    • /
    • 2008
  • 한글 상호(商號) 로마자 변환기는 한글로 만들어진 상호를 로마자로 자동 변환하는 시스템이다. 이 변환기는 기사용 로마자 상호명과 업종명, 그리고 표준 한글 로마자 변환 규칙에 의해 생성한 로마자를 조합하여 로마자 상호를 생성한다. 이때, 조합을 위한 알고리즘이 필요한데, 기존에 비슷한 용도에 사용되었던 stack 알고리즘을 적용할 경우 비효율적이다. 본 논문은 이를 대체할 새 알고리즘을 제안한다. 새 알고리즘은 기존 stack 알고리즘을 사용할 때에 비해 복잡도를 O(bd)에서 O(b*d)로 줄여 성능을 높인다.

구조설계에서 수치최적화 기법 및 연구방향

  • 한상훈
    • 전산구조공학
    • /
    • 제5권3호
    • /
    • pp.44-47
    • /
    • 1992
  • 본 학술기사의 목적은 구조설계를 위한 강력하고도 유용한 도구로서의 최적화기법을 소개하는 것이고 현재의 기술현황을 보여주는 것이다. 최적화의 발전은 유한요소법과 컴퓨터기법 그리고 최적화알고리즘 및 소프트웨어의 동시적인 발전으로부터 이루어진다. 이렇게 됨으로써 사용자가 꼭 최적화 이론가가 될 필요성은 없어질 것이고 모든 공학자는 설계의 질과 생산성을 증진시키기 위해 최적화를 훌륭한 설계기술로서 이용할 수가 있게 될 것이다. 최적화를 위한 두가지 접근방안이 제안되었다. 하나는 최적화 과정중 직접적으로 사용되는 민감도 정보를 제공하기 위해 유한요소해석 프로그램을 수정하는 것이고, 다른 하나는 설계변수와 구조응답들로 구성된 목적함수, 제약조건으로된 최적화문제에 최적화기법을 연결하는 것이다. 가장 좋은 방법은 이 두 접근방법의 조합된 방법인 것 같지만 서로 모순된 것 같기 때문에 분명하지가 않다. 따라서 이 부분은 앞으로 주목을 받을 충분한 가치가 있는 내용이 될 것이다. 원료 부족에 대한 인식의 증대와 부존에너지자원의 빠른 고갈은 경량이면서 효율적이고 경제적인 구조물에 대한 욕구를 증폭시켰다. 따라서 오늘날의 유용하고, 거대한 계산능력을 고려한다면, 최적화기법을 사용하고자 하는 동기는 충분한 것이고 숙련된 공학설계자들에 의해 응용됨으로써 최적화는 경쟁적인 우위를 제공하는 강력한 도구가 될 수 있을 것이다.

  • PDF

2마리 정도 보일 때 약제살포 - 사과원의 응애류발생과 관리대책

  • 이순원
    • 농약과 식물보호
    • /
    • 제6권6호
    • /
    • pp.63-73
    • /
    • 1985
  • 최근에 과수농가의 농민과 원예 및 능금조합의 지도기사들을 대상으로 과수해충 방제실태에 대한 설문조사를 한 결과, 사과원에서는 응애류가 심식충류나 진딧물보다 방제가 어려운 해충으로 지적되고 있다. 또한 필자가 전국 6개 지역의 15개 일반 농가의 사과원을 2년간 년 3회 이상 관찰한 결과에서도 심식충류의 피해를 받고 있는 농가는 거의 없었으며, 응애류는 그 발생정도에 차이는 있으나 대부분의 사과원에서 상존하고 있는 현상이었다. 이와 같이 응애류가 사과원에서 주요해충으로 등장하게 된 이유는 첫째, 시비$\cdot$농약살포 등 관리상태의 향상으로 사과나무 잎의 생리적 조건이 변화되어 응애류의 생식력을 자극시켰기 때문이라는 ''생식자극설''(生殖刺戟設)과 둘째, 1940년대 후반 이후 농약 사용의 급증으로 인하여 응애류의 발생을 억제하던 포식성 응애를 비롯한 천적류가 감소 또는 멸종되었기 때문에 응애류가 격발(激發)하게 되었다는 ''포식자억제설''(捕食者抑制設) 등이 있다.

  • PDF