• Title/Summary/Keyword: 태그 기반 정보검색

Search Result 136, Processing Time 0.026 seconds

XML 기반의 대용량 유사 문서 편집기/변환기 구현 (Implementation of an XML-Based Editor/Transformer for Large Volume of Similar Documents)

  • 황인준
    • 한국전자거래학회지
    • /
    • 제9권1호
    • /
    • pp.21-38
    • /
    • 2004
  • 최근 웹이 보편화되면서 웹은 이제 거대한 정보의 보고로서 중요한 의미를 가지게 되었다. 현재 웹 상에 존재하는 많은 문서들은 HTML로 작성되어 있다. HTML은 간단하고 배우기가 쉬운 반면, 고정된 태그 등으로 정보 검색에 있어서 비효율적이다. 이러한 단점을 보완하기 위해 XML이 제안되어 현재 다양한 응용에 활용되고 있다. XML은 HTML에 비해 구조적이고 또한 정보의 의미를 적절하게 표현할 수 있어 정보 검색에 있어서 훨씬 효과적이다. 이러한 추세에 맞추어 본 논문에서는 XML 문서를 다양하고 효과적으로 생성하고 관리하는 XML 문서 관리기를 제안한다. 시스템의 특징으로는 첫째, 문서의 양식을 반영하는 폼을 제공하여 XML을 잘 모르는 일반 사용자도 쉽게 새로운 문서를 작성할 수 있게 하였으며 둘째, 이미 존재하는 비슷한 구조를 가지는 HTML문서에 대해서는 자동적인 XML문서로의 변환을 제공하여 기존의 HTML문서도 XML를 통해 관리와 검색을 가능하게 한다. 마지막으로 GUI상에서 문서의 DTD를 편집할 수 있게 하여 DTD 작성을 용이하게 하였다.

  • PDF

우편주소정보 추출모듈 개발 및 평가 (Development and Evaluation of Information Extraction Module for Postal Address Information)

  • 신현경;김현석
    • 창의정보문화연구
    • /
    • 제5권2호
    • /
    • pp.145-156
    • /
    • 2019
  • 본 연구에서는 명명된 실체 인식 기법에 기초한 정보 추출 모듈을 개발하고 평가하였다. 본 논문의 제시된 목적을 위해, 모듈은 사전 지식 없이 임의의 문서에서 우편 주소 정보를 추출하는 문제에 적용하도록 설계되었다. 정보 기술 실무의 관점에서, 우리의 접근방식은 유니그램 기반 키워드 매칭과 비교하여 일반화된 기법인 확률론적 n-gram(바이오그램 또는 트리그램) 방법이라고 말할 수 있다. 모델을 순차적으로 적용하지 않고 문장검출, 토큰화, POS 태그를 재귀적으로 적용하는 것이 우리의 접근법과 자연어 처리에 채택된 전통적인 방법 사이의 주요한 차이점이다. 이 논문에서는 약 2천 개의 문서를 포함한 시험 결과를 제시한다.

웹 2.0을 기반으로 한 맞춤형 게시판 (The Design of Customized Board using the Web 2.0)

  • 박성신;김창석;김대수
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.773-779
    • /
    • 2007
  • 인터넷 게시판은 수많은 사용자들의 생각과 그들이 가진 정보를 교환하기 위하여 주요한 방법으로 사용되고 있다. 그러나 공동의 게시판은 사용자 개개인의 관심분야를 만족시키지 못한다. 본 연구에서는 웹 2.0을 활용하여 각각의 사용자에게 맞춤형 서비스를 제공하는 인터넷 게시판을 설계한다. 설계될 인터넷 게시판은 사용자에게 제공되는 정보는 동일하지만, 각 사용자마다 설정된 정보에 의하여 정보의 분류가 다르게 이루어지도록 하여 자신이 원하는 정보를 보다 빠르게 검색할 수 있도록 하였다. 또한, 각 사용자는 개인 게시판을 생성하여 모든 사용자가 공유하는 게시판에서 자신에게 필요한 정보만을 자동으로 수집하여 저장할 수 있으며, 외부 RSS 피드들을 필터링하여 개인 게시판에 연결하거나, 자신만의 정보를 개인 게시판에 등록할 수도 있다.

RFID 기반의 유비쿼터스 응용을 위한 RFID 객체정보 관리 시스템 설계 및 개발 (The RFID Object Information Management System Design and Implementation For the RFID-Based Ubiquitous Applications)

  • 박찬희;김학수;최윤호;김종진;신영재;김재형;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1424-1427
    • /
    • 2007
  • 최근, RFID 기술이 발전하면서 RFID의 활용분야는 유통 물류 시스템 중심에서 로봇이나 홈 네트워크 시스템과 같은 다양한 분야로 확대되고 있다. 이는, RFID태그와 RFID리더를 사용하여 객체의 정보를 빠르고 정확하게 검색 할 수 있기 때문이며, 이에 따라 RFID 네트워크를 이용하는 시스템의 효과적인 객체정보 추출을 위한 연구가 활발히 진행되어 왔다. 이와 관련하여, 본 논문에서는 RFID를 이용하는 시스템의 효과적인 객체정보 관리 시스템을 설계하고 개발하였다. 이는 RFID 네트워크 외부에 존재하는 RFID 게이트웨이와 RFID 네트워크를 구성하는 어플리케이션 서버, 변환 서버, 객체정보 서버로 구성된다.

  • PDF

IEEE 802.11 기반 저전력 위치 추적 장치의 설계 및 구현 (Design and implementation of low-power tracking device based on IEEE 802.11)

  • 손상현;김태욱;백윤주
    • 한국정보통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.466-474
    • /
    • 2014
  • 무선 네트워크 기술과 모바일 프로세서의 성능이 향상됨에 따라 스마트 폰과 같은 무선통신이 가능한 소형 단말이 널리 활용되고 있다. 이러한 이동형 장치는 GPS를 이용하여 위치정보의 활용이 가능하여 위치정보를 기반으로 하는 서비스가 증가하고 있다. GPS는 위성신호를 수신할 수 없는 실내와 전파음영지역에서 위치 정보를 제공하지 못하며, 근거리 통신기술을 이용하는 시스템은 인프라의 구축이 필수적이다. IEEE 802.11을 기반으로 하는 추적 시스템은 널리 보급된 AP 인프라를 기반으로 위치 측정이 가능하나 표준 동작을 따를 때 심각한 전력소모의 문제가 있다. 본 논문에서는 IEEE 802.11 기반 저전력 위치 추적 장치를 제안한다. 저전력 동작을 위해 채널 검색 및 연결유지로 인한 전력소모를 최소화하여 동작시간을 극대화 하였다. 성능평가를 위해 저전력 태그 장치를 설계 및 구현하여 전력소모를 측정하였으며, 시뮬레이션 결과 기본 방법에 비해 제안 방법의 전력소모가 46% 감소함을 확인하였다.

효과적인 브라우징을 위한 뉴스 기사 요약에 관한 연구 (A Study on Skimming of News Article for an Efficient Browsing)

  • 이주호;정승도;조정원;최병욱
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.219-222
    • /
    • 2000
  • 수많은 종류의 비디오 데이터를 효율적으로 검색하기 위해서는 데이터를 분석하여 사용자에게 먼저 전체 비디오의 요약을 제시하는 것이 효과적이다. 본 논문에서는 기사 단위로 분할된 뉴스 기사 전체를 보여주지 않으면서도 기사의 내용을 왜곡됨이 없이 요약하여 효과적으로 사용자에게 보여주기 위한 방법을 제안한다. 본 논문에서는 사용자에게 시각적인 요약 정보를 앵커 프레임 추출 및 대표 프레임 추출을 통해 필름 스트림(film trip)의 형태로 제시하고, 기사를 소개하는 앵커의 첫 대사를 폐쇄 자막(closed-caption)을 이용하여 추출하여, 이를 기사의 내용에 대한 요약으로 필름 스트립과 같이 제시하도록 하였다. 앵커 프레임을 추출하기 위해 본 논문에서는 폐쇄 자막에서의 "앵커:" 태그가 존재하는 시간 구간과 동기된 프레임을 선정한다. 또한 대표 프레임은 공개형 자막(open-cpation)이 존재하는 프레임과 빈도에 기반한 가중치가 높은 .폐쇄 자막에서의 키워드와 동기된 프레임을 선정하도록 하였다. 본 논문의 뉴스 기사 요약 시스템은 시각적인 프레임제시와 함께 기사의 내용을 바탕으로 하는 기사 요약문을 같이 사용자에게 제공함으로써 기존의 필름 스트립형태만 제공하던 시스템에 비하여 사용자 중심의 지능형 요약 서비스가 가능함을 실험을 통해 보인다.

  • PDF

FOAF와 SNA를 이용한 개선된 인터넷 자원 추천 방법 (Improved Internet Resource Recommendation Method using FOAF and SNA)

  • ;손종수;정인정
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.165-176
    • /
    • 2012
  • 최근 사용자들이 생성한 콘텐츠들이 크게 늘어나고 커뮤니티 기반 웹 사이트가 발전함으로 인하여 사용자들에게 인터넷 자원을 추천하는 시스템이 큰 각광을 받고 있다. 그러나 대부분의 인터넷 자원 추천 시스템들은 사용자의 특징을 충분하게 반영하지 못하는 한계를 가지고 있다. 이에 따라 본 논문에서는 사용자의 특징이 충분히 반영되는 자원의 추천을 위하여 FOAF와 SNA를 사용한 추천 방법을 제안한다. 제안하는 방법은 1) FOAF를 통해 사용자의 특징 데이터와 태그 데이터를 취득한다. 2) 취득한 데이터를 세 종류의 행렬에 삽입하고 통합한 후 사용자, 사용자의 특징, 태그를 나타내는 그래프를 생성한다. 3) 소셜 네트워크 분석을 통해 추천 항목의 일반 특징과 핫태그(Hot tag)를 선정하여 인터넷 자원을 추천한다. 본 논문의 검증을 위하여 우리는 실험을 통해 본 논문에서 제안한 방법과 아이템 기반 추천 방법을 비교하였다. 이를 통해 보다 많은 사용자가 참여할수록 아이템 기반 추천 방법보다 본 논문에서 제안한 방법에 의한 추천 결과의 품질이 우수함을 확인하였다. 본 논문에서 제안하는 방법을 활용하면 사용자들에게 보다 적합한 자원을 추천하는 것이 가능하다. 그리고 제안하는 방법은 폭발적으로 늘어나는 인터넷 자원을 검색하는데 있어 효율적으로 활용될 수 있다.

유사성 기반 XML 문서 분석 기법 (XML Document Analysis based on Similarity)

  • 이정원;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.367-376
    • /
    • 2002
  • XML 문서가 가지고 있는 태그의 자유로운 정의와 내포된 구조 정보는 정보 검색 및 문서 관리 분야에 많은 이점을 제공할 수 있다. 본 논문은 XML 요소(element)의 의미와 구조 정보를 반영한 문서간의 유사성을 검사할 수 있는 XML 문서 분석 기법을 제시하고자 한다. 도출된 문서간 유사성은 많은 정보 검색 및 마이닝 등의 기초 자료로 사용될 수 있다. 먼저 XML 요소를 시소러스를 이용하여 유사어와 합성어로 구성된 확장-요소 벡터로 확장하고 유사 행렬을 구축하여 요소간 유사성을 판별한다. 또한 오토마타(NFA(Nondeterministic Finite Automata)와 DFA(Deterministic Finite Automata)(를 이용하여 XML 문서의 내포된 구조를 발견하고 최소화 한다. 요소간의 유사 행렬과 최소화된 XML 구조를 이용하여 구조간의 유사성을 판별한다. 본 논문의 XML의 의미를 반영한 유사성 분석 기법은 온라인 서점의 실제 문서의 카테고리를 인식하는 데 있어 100% 정확도를 보였다.

RFID와 센서 데이터 처리를 위한 EPCIS 저장소 설계 및 구현 (A Design and Implementation of EPCIS Repository for RFID and Sensor Data)

  • 현승렬;이상정
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.151-162
    • /
    • 2010
  • 유비쿼터스 컴퓨팅 환경을 구축하기 위하여 자동 식별, 센서 네트워크, 홈 네트워크 등의 다양한 분야에 대한 연구가 진행되고 있다. EPCIS(EPC Information Services)는 RFID 용용 시스템 개발에 필요한 태그 정보를 관리하는 저장소와 관련하여 EPCglobal에서 제안된 표준이다. 본 논문에서는 일반적인 객체 인식과 환경 정보 변화에 의존하는 객체 검색을 가능하게 하기위해 EPCIS 저장소를 설계하고 개발 및 구현한다. 또한 위치를 기반으로 하고 지속적으로 변하는 대용량 자료라는 면에서 RFID 자료와 유사한 센서 데이터를 통합처리 관리하여 USN(Ubiquitous Sensor Network) 환경 변화에 따른 객체 인식 등의 융합 처리가 가능하도록 설계한다.

자율 학습에 의한 실질 형태소와 형식 형태소의 분리 (A Korean Language Stemmer based on Unsupervised Learning)

  • 조세형
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.675-684
    • /
    • 2001
  • 본 논문은 태그가 없는 단순 말뭉치만을 가지고 자율학습을 이용하여 정보 검색을 위한 색인어의 추출 등에 이용될 수 있도록 한국어의 실질 형태소와 형식 형태소를 분리해내는 기법에 대하여 기술한다. 본 기법은 사전 등의 언어 관련 지식을 요구하지 않으며 오직 단순 말뭉치만을 필요로 한다. 또한 자율학습을 이용함으로써 사람의 간섭이 필요하지 않아 학습에 필요한 시간과 노력이 거의 들지 않는다. 본 방식은 잘 확립된 통계적 방법론을 이용하기 때문에 일반적인 휴리스틱과는 달리 이론적인 기반이 확고하여 확장 및 발전이 용이하다. 본 결과는 한국어에 우선 적용되었으나 한국어에 종속적인 방법이 아니어서 다른 교착어에도 쉽게 적용될 수 있을 것이다.

  • PDF