• 제목/요약/키워드: 시맨틱 어노테이션 시스템

검색결과 9건 처리시간 0.02초

시맨틱 어노테이션과 한국어 시맨틱 어노테이션 시스템 사례 (Semantic Annotation and an Example of Korean Semantic Annotation System)

  • 심상아;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-100
    • /
    • 2009
  • 인터넷에는 다양하고 많은 정보들이 담겨져 있다. 이 많은 정보들 중에서 사용자가 정말로 필요로 하는 정보를 기계로 추출해 내기 위해서 시맨틱 웹이라는 기술이 제안 되었다. 시맨틱 웹의 구현을 위해서는 기계가 해석할수 있는 데이터들이 필요한데 이것은 시맨틱 어노테이션을 통해서 얻어낼수 있다. 대부분의 시맨틱 어노테이션 시스템들은 영어로 작성된 문서들에 포커스를 두고 개발되었다. 한국어와 같은 교착어를 처리할수 있는 시스템들은 드물다. 본 논문에서는 시맨틱 어노테이션에 대해서 자세히 설명하고 한국어 시맨틱 어노테이션 시스템을 개발하는데에 어떤 언어적인 특징을 고려해야 하는지 살펴본다. 그리고 국외에서 개발된 한국어 시맨틱 어노테이션 시스템 EXCOM을 예제로 소개하겠다.

  • PDF

시맨틱 어노테이션을 이용한 XML 문서 트랜스코딩 (XML Documents Transcoding using Semantic Annotation)

  • 이진상;송특섭;손원성;고승규;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.523-525
    • /
    • 2004
  • 기존의 웹 컨텐츠를 휴대폰이나 poA등과 같은 개인용 단말기에 표현하기에는 단말기 성능상의 제약(낮은 CPU 성능, 작은 출력 화면, 입출력 방법의 단순함 등)이 따르게 되므로 컨텐츠 변환의 과정이 필요하게 된다. 트랜스코딩이감 기존의 웹 컨텐츠를 단말기의 환경에 따라 적합한 형태로 변환하는 것을 의미하며, HTML 문서의 레이아웃 정보를 이용하여 변환하는 연구가 다양하게 이루어져 왔다. 본 논문에서는 사용자 의견을 반영한 XML문서의 정확한 트랜스 코딩을 위하여 시맨틱 어노테이션 기법을 제안한다. XML 문서의 트랜스코딩에는 IPTC(International Press Telecommunications Council)에서 정한 NewsML을 기반으로 하였으며, 본 논문에서 제안하는 트랜스코딩 프레임워크는 크게 3단계로 나뉘어 진다. 어노테이션 생성 및 인식, 어노테이션의 구조 정보를 활용한 페이지 생성 및 페이지 앱 구성, 디바이스에 따른 페이지의 변환으로 구성된다. 향후 연구로는 어노테이션과 페이지 생성 기법을 통해 생성된 XML 문서를 CC/PP를 이용하여 poA나 휴대폰 등의 시스템에 적합하게 변환하는 기법 등이 요구된다.

  • PDF

키워드를 활용한 온톨로지 인스턴스 생성에 관한 연구 (A Study on Ontology Instance Generation Using Keywords)

  • 한광록;강현민;손석원
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.1-11
    • /
    • 2010
  • 시맨틱 웹의 성공 여부는 온톨로지 구축과 생성을 위해서 지식을 체계화하는 시맨틱 어노테이션에 달려있다. 그러므로 각 분야의 많은 지식 표현을 변환하여 온톨로지 인스턴스로 생성하기 위해서 시맨틱 어노테이션의 효율성이 중요하다. 본 논문에서는 기존 웹에서 시맨틱 어노테이션 작업을 통하여 온톨로지 인스턴스를 정확하고 효율적으로 생성하는 규칙기반 온톨로지 인스턴스 생성 시스템을 제안한다. 기존연구에서는 사용자가 관련 정보를 찾아서 온톨로지와 대조하여 정보를 입력하는 수동적인 과정이 필요하였다. 그러나 제안한 방식에서는 추출할 정보들에 관한 키워드 데이터와 규칙정보를 분할해서 관리한다. 따라서 소수의 키워드와 규칙정보들을 추가함으로써 다양한 웹문서의 효율적 정보 추출이 가능하다. 이것은 여러 사이트에서 규칙과 키워드를 재사용할 수 있는 온톨로지 인스턴스 생성이 가능하다는 것을 보여준다.

링크드 데이터를 이용한 협업적 비디오 어노테이션 및 브라우징 시스템 (A Collaborative Video Annotation and Browsing System using Linked Data)

  • 이연호;오경진;신위살;조근식
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.203-219
    • /
    • 2011
  • 최근 인터넷이 가능한 컴퓨터뿐만 아니라 스마트TV, 스마트폰과 같은 장치를 통한 동영상 형태의 멀티미디어 소비가 증가함에 따라 단순히 시청만 하는 것이 아니라 동영상 콘텐츠 사용자들은 자신이 원하는 동영상 콘텐츠를 찾거나 동영상 콘텐츠에 등장하는 객체의 부가 정보를 브라우징 하고자 하는 요구가 증대되고 있다. 이러한 사용자의 요구를 충족시키기 위해서는 노동집약적인 어노테이션 작업이 불가피하다. 동영상 콘텐츠에 등장하는 객체에 직접 부가정보를 기술하는 키워드 기반 어노테이션 연구에서는 객체에 대한 관련 정보들을 어노테이션 데이터에 모두 포함시켜 대용량 데이터를 개별적으로 직접 관리해야 한다. 이러한 어노테이션 데이터를 이용하여 브라우징을 할 때, 어노테이션 데이터에 이미 포함 되어 있는 정보만 제한적으로 검색이 된다는 단점을 가지고 있다. 또한, 기존의 객체 기반 어노테이션에서는 어노테이션 작업량을 줄이기 위해 객체 검출 및 인식, 트래킹 등의 컴퓨터 비전 기술을 적용한 자동 어노테이션을 시도하고 있다. 그러나 다양한 종류의 객체를 모두 검출해내고 인식하여, 자동으로 어노테이션을 하기에는 현재까지의 기술로는 큰 어려움이 있다. 이러한 문제점들을 극복하고자 본 논문에서는 비디오 어노테이션 모듈과 브라우징 모듈로 구성되는 시스템을 제안한다. 시맨틱 데이터에 접근하기 위해 링크드 데이터를 이용하여 다수의 어노테이션을 수행하는 사용자들이 협업적으로 동영상 콘텐츠에 등장하는 객체에 대한 어노테이션을 수행 할 수 있도록 하는 어노테이션 모듈이다. 첫 번째는 어노테이션 서버에서 관리되는 어노테이션 데이터는 온톨로지 형태로 표현하여 다수의 사용자가 어노테이션 데이터를 쉽게 공유하고 확장 할 수 있도록 하였다. 특히 어노테이션 데이터는 링크드 데이터에 존재하는 객체의 URI와 동영상 콘텐츠에 등장하는 객체를 연결하기만 한다. 즉, 모든 관련 정보를 포함하고 있는 게 아니라 사용자의 요구가 있을 때, 해당 객체의 URI를 이용하여 링크드 데이터로부터 가져온다. 두 번째는 시청자들이 동영상 콘텐츠를 시청하는 중 관심 있는 객체에 대한 정보를 브라우징 하는 모듈이다. 이 모듈은 시청자의 간단한 상호작용을 통해 적절한 질의문을 자동으로 생성하고 관련 정보를 링크드 데이터로 부터 얻어 제공한다. 본 연구를 통해 시맨틱웹 환경에서 사용자의 상호작용을 통해 즉각적으로 관심 있는 객체의 부가적인 정보를 얻을 수 있도록 함으로써 향후 개선된 동영상 콘텐츠 서비스 환경이 구축 될 수 있기를 기대한다.

이동 객체의 효과적 표현을 위한 시맨틱 어노테이션 방법 (A Semantic Annotation Method for Efficient Representation of Moving Objects)

  • 이진활;홍명덕;이기성;정진국;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.67-76
    • /
    • 2011
  • 최근 비디오가 대화형 콘텐츠를 위한 타입으로 많은 각광을 받기 시작하면서 비디오 데이터에 포함된 객체들을 의미적으로 표현하고 검색하기 위한 시맨틱 어노테이션 방법에 대한 연구가 활발히 진행되고 있다. 비디오 데이터에 포함된 객체들은 시간의 변화에 따라 공간적 위치가 변화하기 때문에 매 프레임마다 상이한 위치 데이터가 발생한다. 따라서 모든 프레임의 객체에 대한 위치 데이터들을 저장하는 것은 매우 비효율적이므로 이를 부적절한 오차가 발생하지 않는 범위 내에서, 효과적으로 압축하여 표현할 필요가 있다. 본 논문은 컴퓨터 또는 에이전트가 직관적으로 객체에 대한 정보를 이해할 수 있도록 표현하기 위해 비디오 데이터가 포함하는 객체에 대하여 의미적 정보를 부여하기 위한 온톨로지 모델링 방법과 이동 객체의 위치 데이터를 압축하기 위해 3차 스플라인 보간법을 적용하여 의미적 정보와 함께 어노테이션 하는 방법을 제안한다. 제안한 어노테이션 방법의 효율을 검증하기 위한 대화형 비디오 시스템을 구현하고, 다양한 특징을 가지는 객체가 나타나는 비디오 데이터 셋을 이용하여 샘플링 간격에 따른 오차율과 데이터량을 비교하였다. 그 결과, 샘플링 간격이 15프레임 이하 일 때, 최대 80%의 데이터 저장 공간을 절약할 수 있을 뿐만 아니라 객체의 실제 좌표 대비 최대 31픽셀, 평균 4픽셀 미만의 오차 편차를 얻을 수 있었다.

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

온톨로지 기반 지식 검색 시스템 개발: KT 콜센터 사례 (Development of an ontology-based knowledge search system: The case of KT call center)

  • 안세열;최현식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.576-579
    • /
    • 2010
  • 콜센터의 고객문의는 복잡하여 기존 검색 시스템으로는 고객의 문제점을 신속하게 찾아 상담에 적용하는데 문제가 많았다. 온톨로지를 구축하고 시맨틱 검색을 제공할 경우 보다 보다 좋은 검색 기능을 제공할 것으로 기대되나 콜센터의 상담지식은 내용이 매우 복잡하여 그 텍스트의 내용을 완벽하게 온톨로지로 표현하는 것은 쉽지 않았다. 본 논문에서는 온톨로지 기반으로 구축된 지식베이스의 데이터 검색과 함께 그와 가장 관련성이 높은 문서를 출력하기 위해 문서를 온톨로지와 링크하여 어노테이션하는 방법을 제안한다. 본 시스템을 적용한 상담에서 상담원들의 생산성이 향상되고 고객 만족도를 높이는 결과를 확인했다.

데이터센터 내 효율적인 전력관리를 위한 온톨로지 기반 모니터링 기법 (Ontology-based Monitoring Approach for Efficient Power Management in Datacenters)

  • 이정민;이진;김정선
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.580-590
    • /
    • 2015
  • 최근 그린 컴퓨팅의 일환으로 데이터센터의 효율적인 전력관리가 부각되고 있으며, 이러한 효율적인 데이터센터의 전력관리를 위해서는 서버 모니터링이 필수적이다. 하지만 기존 서버 모니터링 기법은 주로 데이터베이스만을 이용해 관리하였기 때문에, 관리자는 데이터센터 및 데이터베이스의 구조를 명확하게 알고 있어야 하고, 관측한 데이터 간 상관관계를 분석해야 한다. 또한 관리자는 데이터베이스에 명시되지 않은 부분에 대한 모니터링이 불가능하다. 이에 본 논문에서는 효율적인 데이터센터 내 전력관리를 위한 온톨로지 기반의 모니터링 기법을 제안한다. 제안된 기법은 서버관리를 위한 도메인 온톨로지를 구축하고, 구축한 온톨로지를 시맨틱 어노테이션 기술을 통해 데이터베이스와 연동하였으며, 서버의 상태 및 질의문 생성에 대한 규칙을 정의하였다. 그리고 제안하는 기법의 유효성 입증을 위해 온톨로지 기반 모니터링 시스템 아키텍처를 설계하고, 지식 체계를 구축하였으며, 파일럿 시스템을 구현하여 검증을 실시하였다.

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.