• 제목/요약/키워드: 태그 기반 정보검색

검색결과 136건 처리시간 0.023초

메타 태그를 이용한 자동 웹페이지 분류 시스템 (An Automatic Web Page Classification System Using Meta-Tag)

  • 김상일;김화성
    • 한국통신학회논문지
    • /
    • 제38B권4호
    • /
    • pp.291-297
    • /
    • 2013
  • 최근 월드 와이드 웹(World Wide Web)의 사용이 폭발적으로 증가함에 따라 다양한 정보를 포함하고 있는 웹 페이지들의 양도 엄청나게 증가 하였다. 따라서 웹상에 존재 하고 있는 웹페이지들에 대한 접근을 용이하게 하고, 그룹화를 통한 검색을 가능하게 하기 위해 웹 페이지 분류의 필요성이 대두 되고 있다. 웹 페이지 분류는 기존의 웹 상에 산재 되어 있는 웹페이지들을 비슷한 문서 유형 또는 같은 키워드를 사용하는 문서들의 묶음으로 구분하는 작업을 의미하며, 웹 페이지 분류 기술은 웹페이지 검색, 그룹 검색, 메일 필터링 등의 분야에 응용될 수 있는 기술이다. 하지만 웹상에 존재하는 웹페이지들을 사람이 수동적으로 분류하는 방법으로는 현재 월드 와이드 웹에 존재하는 엄청난 양의 웹페이지들을 처리할 수 없으며, 자동적인 분류 방법 역시 서로 다른 형태로 작성된 웹페이지들을 정확하게 분류할 수 없다는 문제로 인해 한계를 보이고 있다. 본 논문에서는 서로 다른 형태로 작성된 웹 문서들에 대한 부정확한 분류 문제를 해결하기위해 웹페이지에 존재하는 메타 정보를 획득하여 자동적으로 분류하는 메타 태그기반의 자동화된 웹페이지 분류 시스템을 제안하였다.

상위온톨로지 모델링을 이용한 폭소노미 기반 마이크로컨텐츠 구축 (Construction of Folksonomy-Based Microcontents Using Upper Ontology Modeling)

  • 이승민
    • 정보관리학회지
    • /
    • 제28권4호
    • /
    • pp.161-182
    • /
    • 2011
  • 현재 메타데이터와 폭소노미는 정보의 표현과 조직, 검색에 널리 사용되고 있다. 그러나 각각이 지닌 고유한 특성과 장점을 모두 활용하기 위해 이 두 가지 방식을 연결시키기 위한 연구가 많이 수행되고 있다. 본 연구에서는 폭소노미와 메타데이터가 지닌 공통점을 활용해 이 두 가지 방식을 마이크로컨텐츠를 이용해 연결시켜 정보자원의 활용을 극대화하는 방안을 제안하고 있다. 마이크로컨텐츠는 폭소노미의 동적인 특성과 메타데이터의 명확한 체계를 모두 반영한 구조로서, 실질적인 태그나 요소의 값을 갖지 않는 개념적인 구조이다. 이 마이크로컨텐츠를 이용한 접근방법은 폭소노미 태그와 메타데이터 구조에서 제공받은 접근점을 통해 이들 두 가지 방식의 단점을 상호보완하고 장점을 극대화하는데 활용될 수 있다.

통계정보에 기반을 둔 한국어 어휘중의성해소 (Korean Lexical Disambiguation Based on Statistical Information)

  • 박하규;김영택
    • 한국통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.265-275
    • /
    • 1994
  • 어휘중의성 해소는 음성 인식/생성, 정보 검색, 발뭉치 태킹 등 자연언어 처리에서 가장 기초가 되는 분야 중의 하나이다. 본 논문은 말뭉치로부터 추출된 통계정보를 이용하는 한국어 어휘중의성해소 기법에 대해 기술한다. 이 기법에서는 좀더 정밀한 중의성해소를 위해 품사태그 대신 형태소분석 결과에 해당하는 토큰태그를 사용하고 있다. 본 논문에서 제안한 어휘선택함수는 어미나 조사의 호응 관계등 한국어의 어휘적 특성을 잘 반영하기 때문에 상당히 높은 정확성을 보여준다. 그리고 활용분야에 적합하게 사용될 수 있도록 유일선택 방식과 다중선택 방식이라는 두가지 중의성해소 방식을 지원하고 있다.

  • PDF

좌우접속정보를 이용한 명사추출기 (A Noun Extractor using Connectivity Information)

  • 안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.173-178
    • /
    • 1999
  • 본 논문의 명사추출기는 정보검색시스템을 위한 색인어 추출기로 좌우접속정보를 이용한 형태소해석을 통하여 얻어진 형태소들 중에서 명사를 추출한다. 본 형태소해석기는 형태소해석을 위한 언어지식과 어절 분리 엔진을 분리하여 수정과 확장이 용이하게 하였다. 사용한 언어지식은 좌우접속정보로서 한 어절을 이루는 형태소들의 품사간의 접속여부를 행렬로 표현한 것이다. 어절 분리 엔진은 사전을 참조하여 한 어절에서 최장일치법에 의해 형태소를 분리하고 좌우접속정보를 참조하여 형태소 분리가 올바른지를 판단한다. 형태소들의 품사분류는 표준 태그셋을 기반으로 음절 정보를 추가하여 확장하였다. 형태소를 해석한 결과 미등록어가 발생하였을 때 미등록어에서 명사를 추정하는 모듈이 없기 때문에 재현율은 좋지 않았다.

  • PDF

소셜네트워크에서 분위기 벡터를 이용한 멀티미디어 콘텐츠 추천 방법 (Multimedia Contents Recommendation Method using Mood Vector in Social Networks)

  • 문창배;이종열;김병만
    • 한국산업정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.11-24
    • /
    • 2019
  • 웹에서 정보 구매자들의 성향은 가성비에서 가심비 형태로 변해가는 추세이다. 멀티미디어 콘텐츠 추천에도 그러한 흐름이 있는데, 바로 폭소노미 (Folksonomy) 기반의 분위기를 이용한 추천 방법이다. 하지만 이런 방법의 경우 동의어를 고려하지 못한다는 문제점이 존재한다. 이 문제를 해결하기 위해 일부 연구에서는 Thayer모델의 12 분위기를 AV(Arousal and Valence)값으로 정의하여 그 문제점을 해결하였지만, 추천 성능이 재현 수준 0.1에서 키워드 기반 검색 방법보다 떨어지는 문제점을 보였다. 본 논문에서는 재현 수준 0.1에서도 키워드 기반 검색 방법과 동일한 추천 성능을 유지하면서 동의어 문제를 해결할 수 있도록 멀티미디어 콘텐츠의 분위기 벡터를 이용하는 방법을 제안하였다. 또한, 추천 성능 분석을 위해 기존 AV값 기반 방법과 키워드 기반 방법과 비교 분석하였다. 추천 성능 분석결과, 본 논문에서 제안한 방법이 전체적으로 기존 방법들 보다 우수한 추천 성능을 보였다.

저전력을 고려한 IEEE 802.11 기반 위치 추적 시스템 (IEEE 802.11-based Power-aware Location Tracking System)

  • 손상현;백종찬;백윤주
    • 한국통신학회논문지
    • /
    • 제37권7B호
    • /
    • pp.578-585
    • /
    • 2012
  • GPS와 Wi-Fi를 이용한 위치 추적 시스템은 IEEE 802.11 기반으로 하는 다수의 AP들로 구성된 무선 네트워크 인프라가 구축되어 있는 환경에서 추가 비용 없이 이용 가능하여 다양한 응용분야에서 유용하게 활용될 수 있다. 기존의 시스템은 위치 추적용 태그의 단가가 비싼 범용 장치를 사용하였으며 전력소모를 위한 고려가 부족하였다. 본 논문에서는 기존의 GPS와 Wi-Fi를 이용한 저전력을 고려한 위치 추적 시스템을 제안한다. 먼저, 저전력 하드웨어 기반으로 위치 추적에 최적화된 태그를 설계하고 구현한다. 또한 구현한 태그가 저전력으로 동작할 수 있는 핸드오프 기법, 동작 모델을 제안한다. 제안하는 핸드오프 기법은 IEEE 802.11 표준 핸드오프 방식이 채널검색 동작 시 많은 송수신이 발생함에 따라 큰 전력소모가 발생하는 문제를 위치 정보를 활용하여 해결한다. 또한 제안하는 동작 모델은 절전모드와 duty cycle 개념을 사용하여 태그의 전력소모를 최소화하였다. 제안하는 시스템의 성능을 평가하기 위해 실제 환경을 모델링한 시뮬레이션을 수행하고 실제 측정한 태그의 각 동작에 따른 전류소비를 기반으로 전력소모량을 계산한다. 시뮬레이션 결과 제안하는 핸드오프 기법은 표준 핸드오프에 비해 약 59%, 제안하는 동작 모델의 경우 기본 동작 모델에 비해 약 98%의 전력소모를 줄일 수 있었다.

RFID와 센서 데이터 처리를 위한 미들웨어와 EPCIS 통합 설계 (An Integrated Design of Middleware and EPCIS for RFID and Sensor Data)

  • 현승렬;이상정
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.193-202
    • /
    • 2012
  • RFID 태그 인식 정보와 센서 데이터는 지속적으로 변화하고, 위치에 따라 구분되며, 시간에 따라 변화하는 대량의 정보라는 면에서 유사한 자료라고 할 수 있으며, 두 자료가 함께 관리된다면 환경 변화에 따른 객체 인식 등의 융합 처리가 가능하다. RFID 미들웨어와 EPCIS 저장소가 통합된 시스템을 구현한다면 미들웨어의 기능과 저장소의 기능을 동시에 사용할 수 있으며, 미들웨어로부터 정보를 받아 가공 처리할 필요 없이 실시간 인식 정보 검색이 가능해진다. 본 논문에서는 일반적인 객체 인식과 환경 정보 변화에 의존하는 객체 검색을 실시간으로 가능하게 하기 위해, 장치로부터 정보를 지속적으로 읽어 데이터베이스에 저장하고, 수집된 자료를 기반으로 EPCglobal에서 표준으로 제안하는 ALE 기반 미들웨어와 EPCIS 저장소를 RFID와 센서 데이터를 함께 처리할 수 있도록 설계하고 구현한다.

메타데이타 인터페이스를 이용한 분산된 반구조적 문서 검색을 위한 질의처리 알고리즘 설계 및 구현 (Design and frnplernentation of a Query Processing Algorithm for Dtstributed Semistructlred Documents Retrieval with Metadata hterface)

  • 최귀자;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권6호
    • /
    • pp.554-569
    • /
    • 2005
  • 반구조적 분산 문서에서는 구조 정보가 제공되지 않고, 자료 구조에 대한 엄격한 형식이 없기 때문에 질의 처리 시스템을 정형화하고 구현하기 어렴다. 이질적이고 이구조적인 반구조적 문서의 요소를 정확하게 검색하기 위해서는 한 요소가 1:1, 1:N, W:1과 같이 서로 다른 매핑 형태를 취하면서 동시에 여러 요소에 매핑되는 다중 매핑을 처리할 수 있어야 하며, 지역문서의 태그를 파싱하여 구조적인 정보를 얻고 경로 트리를 생성해야 한다. 본 논문에서는 분산된 시스템에 존재하는 이질적인 반구조적 자료나 문서에 대한 동시 다중 매핑을 완벽히 지원하고, 문서 자체를 파싱하여 구조적 정보를 얻을 수 있도록 통합 질의와 검색을 수행하기 위한 추상적인 질의 처리 알고리즘을 설계하고 메타데이타 인터페이스를 이용하여 구현하였다. 이 알고리즘은 전역질의를 기반으로 지역질의를 생성하기 위해서 메타데이타 정보를 이용하여 노드들 사이의 매핑, 매핑 종류에 따른 데이타의 변환, 경로교체 및 노드 사이의 이질성을 해결하기 위한 알고리즘으로 제시하였다. 전역스키마와 지역스키마에 대한 매핑과 함수에 의한 데이타의 변환 및 경로교체는 사용자에 의해 구축된 메타데이타 인터페이스인 DDXMI(for Distributed Documents XML Metadata Interface)를 기반으로 하여 구현되었으며, 같은 이름을 갖지만 다른 의미를 갖는 자료나 노드에 대한 검색은 노드를 구분할수 있는 노드가 가지고 있는 자식정보를 이용하여 노드 구분 조건절을 생성하여 구현하였다. XML 질의언어로 Quilt를 사용하였으며, OEM 모델로 제시한 세 개의 서로 다른 반구조적 레스토랑 안내 문서에서구현한 결과를 보였다. 프로토타입 시스템은 윈도우즈 환경에서 Java와 JavaCC 컴파일러를 이용하여 개발하였다.

동영상 컨텐츠의 메타데이타에 기반한 효율적인 브라우징 기법 (Efficient Browsing Method based on Metadata of Video Contents)

  • 천수덕;신정훈;이상준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.513-518
    • /
    • 2010
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전하고 있으며, 이에 따른 디지털 콘텐츠에 대한 수요가 증가하였다. 디지털 콘텐츠 중 비디오 콘텐츠는 VOD, NOD, 디지털 도서관, IPTV, UCC 등 다양한 응용 분야에서 점점 확산되고 있다. 비디오 데이터는 순차적인 특성이 있으며, 시간과 공간정보가 결합한 3차원 데이터로서 계산 비용이 많이 드는 작업이기 때문에 검색이나 브라우징이 어렵다. 본 논문에서는 비디오 데이터를 구조화하는 동영상 내용 편집 도구(ATVC: Authoring Tool for Video Contents)를 제안한다. 동영상 내용 편집 도구는 비주얼 리듬을 이용하여 비디오 데이터에서 대표 프레임을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하는 도구(Tool)이다. 비주얼 리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집 효과를 효과적으로 구분할 수 있다. 그리고 XML 데이터에는 태그 및 키워드 정보와 함께 대표 프레임의 정보까지 저장되므로 효율적인 브라우징을 제공할 수 있다.

XSchema를 이용한 EJB 배치설명파일의 확장 방안 연구 (A Study of Extension of the EJB Deployment Descriptor File with XSchema))

  • 공재원;심우곤;백인섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.400-402
    • /
    • 2001
  • 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있으며, 현재 많은 수의 컴포넌트가 개발되고 사용되고 있다[9]. 많은 수의 컴포넌트들 중에서 특정 도메인에 이미 적절하다고 판단된 컴포넌트를 검색해서 사용하는 과정이 필수적이며[6], 이를 위해서 컴포넌트에 대한 정확한 명세서가 뒷받침 되어야 한다. 본 논문에서 다루고 있는 컴포넌트 모델의 하나인 썬(Sun)社의 EJB ver1.1 은 배치설명파일(Deployment Descriptor)을 XML로 기술하고 있으며, DTD로 Validation 체크를 하고 있다. 그러나 DTD 는 표현할 수 있는 데이터 타입에서 한계를 가지며 하나의 XML은 여러 개의 DTD 파일을 가질수 없기 때문에 확장성에서도 취약함을 나타낸다. 이를 해결하기 위해서 XSchema 로 변환하였다. 또한 현재 EJB 의 배치설명파일에서는 컴포넌트의 결합 및 의존성에 대한 표현이 부족하기 때문에 이를 보완하기 위해서 컴포넌트 Contract 에 대한 속성들을 기반으로 하여 새로운 태그를 지정해보도록한다.

  • PDF