• 제목/요약/키워드: Tagging Engine

검색결과 5건 처리시간 0.022초

기분석사전과 기계학습 방법을 결합한 음절 단위 한국어 품사 태깅 (Syllable-based Korean POS Tagging Based on Combining a Pre-analyzed Dictionary with Machine Learning)

  • 이충희;임준호;임수종;김현기
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.362-369
    • /
    • 2016
  • 본 논문은 음절 단위 한국어 품사 태깅 방법의 성능 개선을 위해 기분석사전과 기계학습 방법을 결합하는 방법을 제안한다. 음절 단위 품사 태깅 방법은 형태소분석을 수행하지 않고 품사 태깅만을 수행하는 방법이며, 순차적 레이블링(Sequence Labeling) 문제로 형태소 태깅 문제를 접근한다. 본 논문에서는 순차적 레이블링 기반 음절 단위 품사 태깅 방법의 전처리 단계로 품사 태깅말뭉치와 국어사전으로부터 구축된 복합명사 기분석사전과 약 1천만 어절의 세종 품사 태깅말뭉치로부터 자동 추출된 어절 사전을 적용함으로써 품사 태깅 성능을 개선시킨다. 성능 평가를 위해서 약 74만 어절의 세종 품사 태깅말 뭉치로부터 67만 어절을 학습 데이터로 사용하고 나머지 7만 4천 어절을 평가셋으로 사용하였다. 기계학습 방법만을 사용한 경우에 96.4%의 어절 정확도를 보였으며, 기분석사전을 결합한 경우에는 99.03%의 어절 정확도를 보여서 2.6%의 성능 개선을 달성하였다. 퀴즈 분야의 평가셋으로 실험한 경우에도 기계학습 엔진은 96.14% 성능을 보인 반면, 하이브리드 엔진은 97.24% 성능을 보여서 제안 방법이 다른 분야에도 효과적임을 확인하였다.

Collaborative Social Tagging for eBook using External DSL Approach

  • 유환수;김성환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1068-1072
    • /
    • 2014
  • We propose a collaborative social tagging for eBook using external DSL approach. The goal of this paper is (1) to provide DSL by which authors can write HTML5 rich contents ebook and tag resources, (2) to make users enhance book by tagging resources easily, (3) to make readers read rich book easily regardless of their devices types, (4) to provide ebook resources of RESTful address style by which other system can identify self-descriptive resources of book. To achieve the goal, we provide Bukle DSL language by which author and users can author and enhance ebook with ease. As a domainspecific language Bukle provides a simple yet expressive language for authoring and tagging books that would otherwise be more difficult to express with a general purpose language. Further work includes visual DSL approach and tools by using that the unskilled users could tag book easily. In order that future work also includes text-to-visual DSL transform engine. UX research is also required to tag and to author book. To tackle the above questions we are looking at using visual notation focusing visual syntax.

웹 2.0 기반 RSS 데이터 수집 엔진의 설계 및 구현 (A Design and Implementation of RSS Data Collecting Engine based on Web 2.0)

  • 강필구;김재환;이상준;채진석
    • 한국멀티미디어학회논문지
    • /
    • 제10권11호
    • /
    • pp.1496-1506
    • /
    • 2007
  • 기존의 웹 서비스가 정적이고 수동적인데 반해 최근의 웹 서비스는 점차 동적이고 능동적으로 변화하고 있는데, 이러한 웹 서비스 변화의 흐름을 잘 반영하는 것이 웹 2.0이다. 웹 2.0의 특징은 사용자가 능동적으로 참여하여 정보를 생산하는 것인데, 이렇게 되면, 생산되는 정보의 양이 지속적으로 증가하게 되므로 더 빠르고 정확한 정보를 공유할 필요가 있다. 이러한 필요성을 충족시키는 기술이 웹 2.0의 웹 신디케이션 기술과 태그 기술이다. 웹 신디케이션은 웹 사이트의 내용을 다른 사이트나 사용자가 받아볼 수 있도록 피드를 만든다. 태그는 정보의 핵심이 되는 단어로, 여러 인터넷 사용자들이 태그를 통한 검색으로 좀 더 빠른 정보의 공유를 가능하게 한다. 이 논문에서는 웹 2.0의 핵심 기술인 웹 신디케이션과 태그의 활용을 높이기 위한 방법으로 데이터 수집 엔진을 만들어 데이터를 효율적으로 관리하는 기법을 제안하였다. 데이터 수집 엔진은 데이터베이스에 저장된 사용자의 웹 사이트 정보를 이용하여 사용자의 웹 사이트에 접속하여 업데이트된 데이터를 수집한다. 이 논문에서 제안한 데이터 수집 엔진을 사용하여 실험한 결과 기존의 기법에 비해 검색 속도가 최대 3.14배 향상되었고, 연관 태그를 구성하는데 사용되는 데이터 건수가 최대 66%까지 감소함을 확인할 수 있었다.

  • PDF

Food Media Content Study for an AI Smart Speaker

  • Kim, Kyoung-Ah
    • Journal of Multimedia Information System
    • /
    • 제6권4호
    • /
    • pp.197-202
    • /
    • 2019
  • Society advances through technology, and technology has changed many lifestyles. The need for food is varying, but the availability of food is constantly changing as trends in production change. Combining the food industry and technology, a robot that delivers food and also cooks it has been developed. The time has come for a combination of food content and technology to advance the restaurant industry. This study discusses the application of a recommended food content media providing system using a curation engine that recommends contents according to individual tastes and preferences for the convenience of those who use food contents, using artificial intelligence speakers. We discuss the technologies required to develop video contents optimized for AI speakers with screens and shapes, combined with inset top boxes.

효율적인 일괄 이미지 관리 방법에 대한 연구 (A study on the effective batch image management method)

  • 최재완;김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권4호
    • /
    • pp.779-784
    • /
    • 2008
  • 인터넷 환경의 비약적인 발전과 디지털 카메라의 보급률의 증가 및 일반화가 됨에 따라 인터넷 상의 블로그, 카페, 홈페이지 등 개인의 정보 공유 환경이 발달하였다. 이에 다양한 콘텐츠의 제작 및 보급의 필요성이 증가하게 되었으며 이러한 필요에 따라 기존의 단순한 이미지 뷰어를 내장한 편집프로그램, 혹은 고도의 전문적 교육이 필요한 프로그램들의 사용이 증가하였다. 하지만 이러한 프로그램들의 문제점은 다량의 이미지를 편집, 보정할 시 시간적인 문제가 발생한다. 따라서, 본 논문에서는 다량의 이미지를 일괄적으로 편집할 수 있는 방법을 제안한다. 또한, 콘텐츠들의 다양한 카테고리를 벗어나 각각의 카테고리에서의 장점들을 묶어 하나의 새로운 콘텐츠로 발전시킬 수 있는 퓨전그래픽 이미지 콘텐츠 개발에 대하여 제안한다. 제안된 방법을 통해 콘텐츠 제작 시간 및 콘텐츠 제작에 소요되는 비용을 절감한다. 또한 검색엔진을 통하여 콘텐츠에 대한 검색 시의 불필요한 시간을 줄였음을 보여준다.

  • PDF