• Title/Summary/Keyword: 기사 길이

Search Result 46, Processing Time 0.023 seconds

Efficient Summarization Using Zero Anaphora Resolution (한국어 영 대용어 처리를 통한 문서요약의 성능 향상)

  • 구상옥;전명희;김미진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.555-557
    • /
    • 2003
  • 본 논문에서는 보다 간결한 요약문을 생성하기 위하여. 문장 전체를 추출하는 것이 아니라 문장의 일부분을 요약으로 추출한다. 그런데 한국어의 경우 문장 구조상 반복되는 문장성분을 생략하는 영 대용 문제가 빈번하게 발생하기 때문에, 문장의 일부분 추출시. 생략된 성분을 복원하지 않으면 요약문의 의미가 불완전하고 모호해 질 수 있다. 본 논문에서는 문서 안에서 중요한 부분을 추출한 뒤, 생략된 성분을 복원하여 요약문의 가독성을 놓이는 방법을 제안한다. Luhn의 방법을 이용하여 문서내의 중요 클러스터를 추출하였고, 기존의 문장분할 및 영 대용어 복원 알고리즘을 사용하여 생략된 성분을 복원하였다. 본 논문에서 제안된 요약 방법은 신문기사와 같이 문장의 수는 많지 않고, 문장의 길이가 비교적 긴 문서를 짧은 문장으로 요약하는 데 효율적이다.

  • PDF

Korean Named Entity Recognition Based on Supervised Learning Using Named Entily Construction Principles (개체명 구성 원리를 이용한 교사학습 기반의 한국어 개체명 인식)

  • Hwang, Yi-Gyu;Lee, Hyun-Sook;Chung, Eui-Sok;Yun, Bo-Hyun;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.111-117
    • /
    • 2002
  • 개체명 인식은 질의응답(QA), 정보 주줄(IE), 텍스트 마이닝 시스템의 성능 향상에 중요한 역할을 담당한다. 이 논문에서는 교사학습 기반의 한국어 개체명 인식에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있으며, 개체명을 구성하는 단어 사이에는 의존 관계가 존재하고, 개체명과 개체명 주위의 단어 사이에도 문맥적 의존관계를 가지고 있다. 본 논문에서는 가변길이의 개체명과 주변 문맥의 학습을 위해 트라이그램을 이용한 HMM을 사용하였으며, 자료 부족 문제를 해소하기 위해 어휘 기반이 아닌 부개체 유형 기반의 학습을 수행하였다. 학습된 개체명 인식 시스템을 이용하여 경제 분야의 신문 기사에 대한 실험 결과, 84.4%의 정확률과 90.9%의 재현률을 보였다.

  • PDF

Nationalism and Globalization Tendency in Sport Emotion of Korean : Focusing on 2016 Brazil Olympic Games (한국인의 스포츠 감정에 내재된 민족주의와 세계화 성향 : 2016년 브라질 하계 올림픽을 중심으로)

  • Lee, Jong-Kil;Lee, Kong-Joo;Yang, Jae-Sik
    • Journal of Digital Convergence
    • /
    • v.16 no.8
    • /
    • pp.341-349
    • /
    • 2018
  • This study aimed to investigate the tendency of nationalism and globalization of Korean by analyzing their emotions in sport phase. The SNS comments of newspaper articles on 2016 Brazil Olympics were selected and used to analyze types of nationalism with its emotional texts. The results were as followings; First, the words which showed nationalistic tendency represented each sport phase. Second, Korean showed strong resistant nationalism when their historical background was stimulated by the situation. Third, the most dominant type of Korean's nationalism in sport emotion was the closed. This study could be valued with the empirical approach on the sport emotion and nationalism tendency of Korean.

A Comparative Study on Story Form of Early Shunjung Manhwa and Shojo Manga (초기 순정만화와 소녀만화의 스토리 형식에 대한 비교연구)

  • Kim, So-Won
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.8
    • /
    • pp.109-118
    • /
    • 2015
  • Korean Shunjung Manhwa and Shojo Manga have a unique characteristics. These genres have a close relationship each other. This study is story form of Shunjung Manhwa and Shojo Manga. In this article, a subject of study for Shunjung Manhwa is the works between 1950s and 1960s. I set limits to the works from "Shojo Club" the case of Shojo Manga. "Shojo Club" is the only girl's magazine without suspend publication. Furthermore, that magazine is the one that Japan's first Shojo Manga, Tezuka Osamu's 'Princess Knight' was published serially. The results of my research work is that Shunjung Manwha has a remarkable difference on a spatio-temporal background, a genre of story, a length of story as compared with Shojo Manga. In addition, this difference is based on the social background, history of comics, authors, media published serially at that time.

News Data Analysis Using Acoustic Model Output of Continuous Speech Recognition (연속음성인식의 음향모델 출력을 이용한 뉴스 데이터 분석)

  • Lee, Kyong-Rok
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.10
    • /
    • pp.9-16
    • /
    • 2006
  • In this paper, the acoustic model output of CSR(Continuous Speech Recognition) was used to analyze news data News database used in this experiment was consisted of 2,093 articles. Due to the low efficiency of language model, conventional Korean CSR is not appropriate to the analysis of news data. This problem could be handled successfully by introducing post-processing work of recognition result of acoustic model. The acoustic model more robust than language model in Korean environment. The result of post-processing work was made into KIF(Keyword information file). When threshold of acoustic model's output level was 100, 86.9% of whole target morpheme was included in post-processing result. At the same condition, applying length information based normalization, 81.25% of whole target morpheme was recognized. The purpose of normalization was to compensate long-length morpheme. According to experiment result, 75.13% of whole target morpheme was recognized KIF(314MB) had been produced from original news data(5,040MB). The decrease rate of absolute information met was approximately 93.8%.

  • PDF

Recommendations of Safety Design in Road Tunnels - Based on up-to dated experiences - (도로터널의 방재설계 -사례중심으로-)

  • Park, Jung-Joo
    • Tunnel and Underground Space
    • /
    • v.17 no.5
    • /
    • pp.337-349
    • /
    • 2007
  • Yearly, it seems the fact that the numbers of tunnels with wide sections are on the rise as the length of tunnel and number of lanes continues increasing. According to these trends, well-schemed plans of design, construction and management related with tunnel safety has become to be crucial. It is a high possibility to be observed by the fact that the direct effects of casualties and property damages are caused by the situations of car collisions, bump to solid structures by careless driving and the outbreak on vehicles by mechanical fault. Therefore, in order to prevent these types of accidents, we would make issues md adopt appropriate mechanical and management plans of emergency exits and disaster prevention equipments inside of tunnel, based on up-to dated experiences and study of foreign cases, to structural design technology. The objectives of this study are to recognize related actual problems and suggest improvement plans.

A Method of Generating Sketch Maps for Mobile Phones (휴대폰을 위한 약도 생성 기법)

  • 진용근;이상한;김지인;박영몽
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.415-417
    • /
    • 2003
  • 본 논문에서는 휴대폰에서 실시간으로 사용할 수 있는 GIS 기반의 약도를 생성하는 기법을 소개한다. 휴대폰의 출력 창은 크기가 제한되어, 자세한 도로 정보들이나 건물 정보 등의 GIS 정보를 모두 출력 창에 표현하면 사용자들이 인식하기가 매우 어렵다. 그러므로, 출력창의 크기에 맞춘 간략한 약도를 제공하여 사용자들이 지리 정보를 손쉽게 활용할 수 있도록 도와주자는 것이다. 기존의 GPS와 지리 정보를 이용한 경로 탐색 및 안내 장비는 차량 운전자를 위한 도로 중심의 지리 정보를 제공한다. 우리나라 도로 환경에서는 휴대폰을 가진 보행자가 장소 찾기에 필요한 지리 정보를 원하는 경우도 않다. 그러므로 본 연구에서는 도보 통행자 및 대중교통 사용자들이 이용하기 편리하도록 지하철역이나 버스 정류장, 대형건물과 같은 이정표를 중심으로 하고. 장소 찾기에 필요한 도로만을 출력 창에 나타내어 단순화된 지리정보를 제공하고자 한다. 또한, 기존에 사용하던 방위 개념 중심의 지도들을 가지고, 지도 읽기에 익숙하지 않은 일반 보행자들이 길 찾기에 바로 사용하는 것은 쉽지 않다. 그러므로 수직 개념을 이용한 단순화된 도로 표현 기법을 사용하여 일반인도 쉴게 지도를 보고 길을 찾을 수 있도록 하였다. GIS 정보 중에서 필요로 하는 도로들을 선택하여 그 경로들을 수직선과 수평선에 가깝게 변형하고, 불필요한 도로를 생략, 지도를 단순화하였다. 또한 포함되어 있던 많은 정보들 중에서 일반적으로 보행자들이 길을 찾아갈 때에 참고하는 정보들을 제외한 나머지 정보들을 생략함으로써, 불필요한 정보로 인한 지도의 복잡도를 줄이고, 지리 정보의 가독성을 향상시켰다. 본 연구의 결과를 활용하면 휴대폰의 출력 창에는 이정표 중심의 약도를 표현할 수 있으므로, 약도 정보를 실시간으로 서비스할 수 있을 것으로 기대된다.성뿐만 아니라 보안성을 중요하게 생각하였으며, 앞으로 보안 관련 소프트웨어 개발에 사용될 수 있는 도구들이 가이드 라인에 대한 정보를 제공한다.용할 수 있는지 세부 설계를 제시한다.다.으로서 hemicellulose구조가 polyuronic acid의 형태인 것으로 사료된다. 추출획분의 구성단당은 여러 곡물연구의 보고와 유사하게 glucose, arabinose, xylose 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으로 사료(思料)되었고 초생아사망(初生兒死

  • PDF

Entity Linking For Tweets Using User Model and Real-time News Stream (유저 모델과 실시간 뉴스 스트림을 사용한 트윗 개체 링킹)

  • Jeong, Soyoon;Park, Youngmin;Kang, Sangwoo;Seo, Jungyun
    • Korean Journal of Cognitive Science
    • /
    • v.26 no.4
    • /
    • pp.435-452
    • /
    • 2015
  • Recent researches on Entity Linking(EL) have attempted to disambiguate entities by using a knowledge base to handle the semantic relatedness and up-to-date information. However, EL for tweets using a knowledge base is still unsatisfactory, mainly because the tweet data are mostly composed of short and noisy contexts and real-time issues. The EL system the present work builds up links ambiguous entities to the corresponding entries in a given knowledge base via exploring the news articles and the user history. Using news articles, the system can overcome the problem of Wikipedia coverage (i.e., not handling real-time issues). In addition, given that users usually post tweets related to their particular interests, the current system referring to the user history robustly and effectively works with a small size of tweet data. In this paper, we propose an approach to building an EL system that links ambiguous entities to the corresponding entries in a given knowledge base through the news articles and the user history. We created a dataset of Korean tweets including ambiguous entities randomly selected from the extracted tweets over a seven-day period and evaluated the system using this dataset. We use accuracy index(number of correct answer given by system/number of data set) The experimental results show that our system achieves a accuracy of 67.7% and outperforms the EL methods that exclusively use a knowledge base.

A Time-Series Analysis for Emotional Dynamics of Sport Issue and Group Emotion : Focusing on Korean Swimming Player Tae-Hwan Park (스포츠 이슈와 집단 감정의 감정 동학에 대한 시계열 분석 : 수영선수 박태환 사례를 중심으로)

  • Lee, Jong-Kil;Lee, Kong-Joo;Yang, Jae-Sik
    • Journal of Digital Convergence
    • /
    • v.16 no.8
    • /
    • pp.393-400
    • /
    • 2018
  • The purpose of this study was to empirically investigate the emotional dynamics among sport issues, social structure changes and collective behaviors with time-series analysis. For the purpose, the doping scandal of Tae-Hwan Park was chosen and simplified into 10 episodes. And replies and articles on them were analysed by time-series analysis. As the conclusions, first, there was a clear causal relationship between sport issue and sport emotion. Second, sport emotion was a social being which interacting with social process. Third, the sport emotional dynamics was confirmed. With this study, the sport emotion dynamics was empirically verified, but more statistical approaches would be needed for stronger evidences.

2009 세계 천문의 해 : 최종보고

  • Mun, Hong-Gyu;Chae, Jong-Cheol;Lee, Myeong-Hyeon;Lee, Hui-Won;Jeong, Hyeon-Su;Kim, Ung-Tae;Lee, Gyeong-Suk;Lee, Seo-Gu;Lee, Dong-Ju;Hong, Dae-Gil;Lee, Gang-Hwan;Kim, Cheon-Hwi;Min, Yeong-Cheol;Lee, Gyeong-Suk;Hyeon, Seong-Gyeong;Kim, Ji-Hye;Yun, Seon-Hye;Gang, Yeong-Un;Yang, Jong-Man;Park, Seok-Jae
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.35 no.1
    • /
    • pp.84.1-84.1
    • /
    • 2010
  • 2009 세계 천문의 해(International Year of Astronomy 2009, IYA2009) 한국조직위원회는 지난 1년간 148개 참가국의 일원으로 다양한 활동을 펼쳤다. IYA2009 활동은 강연, 별 축제와 같은 고전적인 이벤트로부터 시, 수필, 에세이, 음악, 미술, 만화, 영화, 대회, 인터넷 생중계, 플래시 동영상과 같이 새롭게 시도된 프로그램에 이르기까지 다양하게 기획, 운영되었다. 또한 우리는 시민천문대와 과학관, 미술관은 물론, 지하철, 기차역, 시청, 놀이공원, 쇼핑몰, 백화점, 병원, 그리고 경찰서에 이르기까지, 기존의 전통적인 전시공간을 벗어나 다양한 장소에서 전시회와 동영상 상영을 시도했다. 우리는 지난 1년간 90여 종의 행사를 410여 회에 걸쳐 진행했으며, 총 11,700,000여 명의 일반 시민과 학생들이 2009 세계 천문의 해에 참여한 것으로 추산하고 있다. IYA2009는 강연 200여 회, 전시 80여 회, 공연 15회, 학회 7회 등으로 요약할 수 있으며, 공식책자 4종, 도록 3종이 발간되었다. 관련 보도자료는 40 차례 배포했으며, 그 결과 2,500여 건이 언론을 통해 보도되었고, 총 248편의 연재기사가 실렸다. 2009 세계 천문의 해 한국조직위원회 공식 웹진 '이야진' 접속자는 999,890명, 총 페이지 뷰 건수는 131,963,473을 기록했다.

  • PDF