• Title/Summary/Keyword: NewsML

Search Result 12, Processing Time 0.03 seconds

Study on Automatic Classification System of News based on NewsML (NewsML 기반의 뉴스 자동 분류 시스템에 관한 연구)

  • Tak-Hee Lee;Gumwon Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.619-622
    • /
    • 2008
  • 뉴스 분류 체계는 각각의 기사에 정치, 경제, 사회 등 가장 적합한 주제별로 분류하는 것으로 언론사별 분류 체계는 통일성이 없이 전혀 다르게 구성되어 사용하고 있다. 이로 인해 방대한 콘텐트를 통합하는데 많은 어려움이 있으며, 그만큼 시스템과 인력에 대해 중복 투자가 되고 있다. 이런 문제점을 개선하기 위해 국제 표준인 NewsML에 기반한 뉴스 분류에 대해 제안한다. NewsML은 XML 기반의 유연성과 확장성이 있는 구조적인 표준 형식으로 다양한 데이터 표현이 가능하여 자동 문서 범주화에 필요한 중요한 자질 선택이 가능하다. 본 논문에서는 NewsML 형식으로 되어 있는 뉴스와 그렇지 않은 뉴스를 구분하여 자동 분류에 대한 비교 실험을 한다. NewsML의 구조화된 정보를 활용한 실험이 뉴스의 제목과 본문만으로 실험한 결과보다 좋은 성능을 보여 주었으며, 그 중에서 자질 공간이 아주 큰 경우에 유용하고 문서 분류에 효과가 뛰어난 지지 벡터 기계 모델이 가장 좋은 성능을 보였다.

A New Online News Service Model, based on NewsML and UCI Systems (NewsML과 UCI를 적용한 뉴스 콘텐츠의 온라인 유통모델)

  • Park, Chang-Shin;Kil, Duke
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.641-645
    • /
    • 2007
  • News contents, produced for paper readers, are more and more being used online instead of offline. Internet sites, expecially portals(naver, daum, nate etc.) are dominant marketplaces, where news are exchanged and values are added. So, establishing a new online news service system, which can satisfy news provider(copyright owner) and internet service provider together, is a necessary task under current online-dominant news service environment. UCI(Universal & Ubiquitous Content Identifier) and IPTC NewsML(News Mark-up Language) are considered as useful standards to compromise protection of news-copyright and enhancement of online use of news contents. This study is based on a real case of 'NewsBank' in korea, We expect that this study can show an inspiration to obtain two contradictory goals of copyright protection and free online use of copyright.

  • PDF

A Study on Matadata of Technology Trends Informations Based on NewsML (NewsML을 고려한 기술동향정보 메타데이터에 관한 연구)

  • Lee Sung-Sook;Song In-Seok
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.39 no.3
    • /
    • pp.183-205
    • /
    • 2005
  • The Information of Technology Trend is one of the critical factors for research activities. In addition, this information tremendously affects the decision-making process of Science and Technology Policy. However, metadata of this information has not gain much attention so far. This research suggests metadata element and encoding scheme that is based on NewsML and using metadata of domestic Information of Technology Trend service system. The result of this research provides the basic resources for developing standard metadata of Information of Technology Trend which is suitable for domestic information technology situation.

tpegML Implementation for News / POI Information (News/POI 정보의 tpegML 제작 및 구현)

  • Lim, Jea-Yun;Kang, Yong-Jin;Lee, Eun-Jin;Lee, Kwoun-Ig;Hong, Soung-Uk;Ahn, Choong-Hyung;Kim, Sun-Choul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2006.11a
    • /
    • pp.235-238
    • /
    • 2006
  • 최근 ATSC, DVB, DMB 및 인터넷 등에서 경제적으로 고속 정보전송이 가능해 짐에 따라 교통정보 서비스 프로토콜인 TPEG이 XML형태로 개발되어 시험 서비스 되고 있다. 기존의 RTM, PTI 응용프로토콜에 대한 XML 버전을 참고하여, 현재 시험 서비스 중인 News, POI 응용 프로토콜에 대한 XML 버전을 제안한다. 교통정보제공자로부터 공급된 원 뉴스정보 및 위치기반 정보를 XML 파일로 인코딩하여 송신하고, 수신측에서 xsl 파일을 제작하여 수신된 XML 파일을 디코딩한 후, 교통정보를 출력하여 보임으로서 그 기능을 검증한다. 테이블 및 속성들에 대한 언어독립적인 ENTITY 와 DTD를 설계하여, 원 정보로부터 제작된 XML 파일에 대한 적합성을 검증할 수 있도록 하였고, 수신된 XML파일을 단말형태에 적합하게 표현하기 위해 xsl 파일을 제작하여 수신된 파일의 표현성 및 확장성이 용이하도록 설계하였다.

  • PDF

Design of E-NIE Learning Systems based on NewsML (차세대 E-NIE 이러닝 시스템 설계)

  • Park, Sun-Pyo;Park, Myong-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.268-271
    • /
    • 2010
  • 본 연구의 목적은 E-NIE 수업을 진행하는데 있어 기존 연구의 문제점과 개선점을 조사하고 수업자료선택, 수업진행, 발전방향에 관한 설문조사 결과를 토대로 멀티미디어 자료 검색 방법과 온라인에서 신문활용학습이 효율적으로 이루어질 수 있는 E-NIE 이러닝 시스템 발전 방안을 모색하기 위한 것이다. E-NIE에 뉴스 표준인 NewsML과 교육정보 표준인 KEM 그리고 학사관리운영플랫폼 LMS를 접목해 멀티미디어 자료와 교과 및 단원을 구조화해 표준화된 교육용 멀티미디어 아카이브를 구축하고 온라인으로 진단 형성 수행 평가, 토론학습, 협동학습 등이 가능하고 학생들의 성적과 진도는 물론 교수학습의 전반적인 과정을 통합적으로 운영 관리할 수 있는 E-NIE 이러닝 시스템을 제안한다.

Coreference Resolution for Korean Using Random Forests (랜덤 포레스트를 이용한 한국어 상호참조 해결)

  • Jeong, Seok-Won;Choi, MaengSik;Kim, HarkSoo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.535-540
    • /
    • 2016
  • Coreference resolution is to identify mentions in documents and is to group co-referred mentions in the documents. It is an essential step for natural language processing applications such as information extraction, event tracking, and question-answering. Recently, various coreference resolution models based on ML (machine learning) have been proposed, As well-known, these ML-based models need large training data that are manually annotated with coreferred mention tags. Unfortunately, we cannot find usable open data for learning ML-based models in Korean. Therefore, we propose an efficient coreference resolution model that needs less training data than other ML-based models. The proposed model identifies co-referred mentions using random forests based on sieve-guided features. In the experiments with baseball news articles, the proposed model showed a better CoNLL F1-score of 0.6678 than other ML-based models.

XML Document Transcoding using User Profile and Annotation (사용자 프로파일 및 어노테이션을 이용한 XML 문서 트랜스코딩)

  • 정쌍용;손원성;이진상;임순범;최윤철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.469-471
    • /
    • 2003
  • 트랜스코딩이란 기존 유선 환경에서 제공되는 웹 컨텐츠를 특정 환경에 적합한 형태로 변환 하는 것을 의미한다. 그러나 이와 관련된 기존 연구에서는 사용자가 요구하는 사항만을 변환 하거나 서비스 제공자가 일방적으로 변환하여 웹 컨텐츠를 제공하고 있다. 따라서 이슈변화에 따른 사용자의 대처능력이 떨어지기 때문에 사용자의 사용성이 저하되며, 사용자에게 무의미한 정보 제공의 가능성이 있다. 이러한 문제점들을 해결하기 위해 본 논문에서는 사용자 프로파일에 의한 요구사항과 서비스 제공자의 의견을 함께 제공 할 수 있는 변환 기법을 제안 하고, 특히 멀티미디어 뉴스 제작을 위한 표준인 NewsML을 대상으로 적용하였다. 사용자 프로파일에 의한 요구 사항은 XML 문서의 구조정보를 이용하여 자동으로 추출하고, 서비스 제공자의 의견은 문서의 레이아웃(Layout) 정보를 가지고, 어노테이션(Annotation) 기법을 활용하여 수동으로 추출한다. 그 결과, 사용자 관점에 부합하는 변환이 이루어지고, 다양한 이슈변화에 대한 대처능력이 향상되어 사용자의 사용성이 증대 되었다

  • PDF

XML Document Transcoding using Dynamic Profile and Annotation (동적 프로파일과 어노테이션을 이용한 XML 문서 트랜스코딩)

  • 정쌍용;손원성;이진상;임순범;최윤철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.1023-1026
    • /
    • 2003
  • 현재 유선에서 지원되는 웹 컨텐츠를 개인용 단말기에서 지원하기에는 단말기의 성능상 한계(screen size, memory size, bandwidth 등) 때문에 여러 가지 문제가 있다. 트랜스코딩이란 이러한 기존 유선 환경에서 제공되는 웹 컨텐츠를 특정 환경에 적합한 형태로 변환 하는 것을 의미한다. 그러나 이와 관련된 기존 연구에서는 사용자가 요구하는 사항만을 변환 하거나 서비스 제공자가 일방적으로 변환하여 웹 컨텐츠를 제공하고 있어 이슈변화에 따른 사용자의 대처능력이 떨어지고 사용자의 사용성이 저하되며, 사용자에게 무의미한 정보 제공의 가능성이 있다. 이러한 문제점들을 해결하기 위해 본 논문에서는 멀티미디어 뉴스 제작을 위한 표준인 NewsML을 대상으로 사용자의 동적 프로파일과 서비스제공자의 어노테이션을 이용하여 사용자가 요구하는 기사와 서비스 제공자가 제공하는 기사를 같이 변환하는 기법을 제안한다. 본 논문의 결과 갑자기 발생하는 사회적 이슈변화에 따른 사용자의 대처능력이 향상 되고 사용자가 불필요한 정보에 과다하게 노출되는 것을 막을 수 있다.

  • PDF

XML Documents Transcoding using Semantic Annotation (시맨틱 어노테이션을 이용한 XML 문서 트랜스코딩)

  • 이진상;송특섭;손원성;고승규;임순범;최윤철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.523-525
    • /
    • 2004
  • 기존의 웹 컨텐츠를 휴대폰이나 poA등과 같은 개인용 단말기에 표현하기에는 단말기 성능상의 제약(낮은 CPU 성능, 작은 출력 화면, 입출력 방법의 단순함 등)이 따르게 되므로 컨텐츠 변환의 과정이 필요하게 된다. 트랜스코딩이감 기존의 웹 컨텐츠를 단말기의 환경에 따라 적합한 형태로 변환하는 것을 의미하며, HTML 문서의 레이아웃 정보를 이용하여 변환하는 연구가 다양하게 이루어져 왔다. 본 논문에서는 사용자 의견을 반영한 XML문서의 정확한 트랜스 코딩을 위하여 시맨틱 어노테이션 기법을 제안한다. XML 문서의 트랜스코딩에는 IPTC(International Press Telecommunications Council)에서 정한 NewsML을 기반으로 하였으며, 본 논문에서 제안하는 트랜스코딩 프레임워크는 크게 3단계로 나뉘어 진다. 어노테이션 생성 및 인식, 어노테이션의 구조 정보를 활용한 페이지 생성 및 페이지 앱 구성, 디바이스에 따른 페이지의 변환으로 구성된다. 향후 연구로는 어노테이션과 페이지 생성 기법을 통해 생성된 XML 문서를 CC/PP를 이용하여 poA나 휴대폰 등의 시스템에 적합하게 변환하는 기법 등이 요구된다.

  • PDF