• 제목/요약/키워드: 웹 문서 공간 질의

검색결과 25건 처리시간 0.026초

웹 문서상의 공간 텍스트 위치 맵핑과 질의 기법 (Techniques for Location Mapping and Querying of Geo-Texts in Web Documents)

  • 하태석;남광우
    • 한국산업정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-10
    • /
    • 2022
  • 웹 기술의 발전과 함께 대량의 웹 문서들이 생산되고 있다. 이 웹 문서에는 다양한 공간적 텍스트들을 포함하고 있으며, 이 텍스트들을 공간정보로 변환함으로서 공간질의로 텍스트 문서를 검색할 수 있는 기반이 된다. 이러한 공간 텍스트들에는 행정지명이나 관심 지역(POI)이름 뿐만이 아니라 우편번호나 지역 전화번호 등까지 폭넓은 영역으로 구성되어 있다. 이 논문은 웹 문서내 내에 존재하는 공간 텍스트 정보를 기반으로 위치를 맵핑 할 수 있는 알고리즘들을 제시하고 있다. 이 알고리즘들을 통해 웹 문서들을 일반 웹 단어 기반 문서 검색 뿐만 아니라, 지도상에서 공간 영역과 텍스트의 복합형태로 해당 지역을 설명하는 문서들을 검색할 수 있게 된다. 마지막으로 이 논문에서는 제안된 알고리즘들을 이용하여 웹 공간 텍스트 질의 시스템을 구현함으로써 유용함을 보였다.

효율적인 웹 마이닝 시스템의 설계 및 구현 (Design and Implementation for the Effective Web)

  • 김형욱;최익규;김민구
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.303-307
    • /
    • 2002
  • 효율적인 웹 마이닝을 위해서는 방대한 인터넷 공간에서 사용자가 원하는 정보를 찾아내고, 이들 중 보다 유용하다고 판단되어진 자료를 선별적으로 제시할 수 있어야 한다. 본 논문에서는 웹 컨텐츠 분석과 HTML 문서들 사이의 링크 연결의 패턴 분석을 기반으로 하는 웹 구조 분석 방법들을 검토하고, 웹 검색 시스템을 구현하여 결과를 분석하였다. 이를 위해 웹 문서의 내용을 인덱싱한 뒤 질의와의 관련성의 확률을 구하는 랭귀지 검색 모델에 링크 구조 분석을 이용한 순위 알고리즘을 사용하여 좋은 결과를 얻고자 하였다. 또한 기존의 링크 관련 알고리즘에서 알려진 문제점을 해결하기 위한 몇가지 테크닉을 사용하였다.

  • PDF

XML캐쉬의 점진적 갱신을 위한 XML변경 처리 모델 (Models of XML Update Processing for Refreshing XML Cache Incrementally)

  • 한승철;황대현;강현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.64-66
    • /
    • 2004
  • XML이 웹 상에서 데이터 교환의 표준으로 부각된 이래 XML데이터의 효율적 관리 기법에 관한 연구가 활발히 수행되고 있다. XML 질의의 표준화 작업도 활발히 이루어져 현재 XQuery가 유력한 표준으로 부각되었다. 그러나 XQuery 등이 완전한 XML 질의어가 되기 위해서는 변경 연산을 제공해야 하는데 XML변경어의 표준화 작업이나 XML 변경 처리 기법에 대한 연구는 아직 미미한 실정이다. 본 논문에서는 e-Commerce 등 XML 데이터베이스 기반 웹 응용의 효율적 지원을 위한 XML 캐쉬를 점진적으로 갱신하는 과정에서 발생하는 XML 변경 연산 처리의 세 가지 기본 모델. TD (텍스트/DOM 기반). PD(PDOM 기반), 그리고 IT (인덱스된 텍스트 기반)를 제안한다. 캐쉬된 XML 문서를 어떤 포맷으로 저장하는가는 이후 XML 변경 연산의 처리 및 요청된 XML문서 반환의 효율성에 영향을 미친다. 이들 모델들은 캐쉬된 XML 문서의 저장 포맷에 따라 구분한 것이다. 이들 모델 각각에 대하여 캐쉬된 XML문서의 갱신 및 반환 기능을 제공하는 XML캐쉬 관리 시스템을 구현하여 이들 기능의 성능 및 공간 부담을 평가한 결과를 기술한다.

  • PDF

u-GIS 환경에서 효율적인 공간 정보 유통을 위한 S-XML 변환 기법 (S-XML Transformation Method for Efficient Distribution of Spatial Information on u-GIS Environment)

  • 이동욱;백성하;김경배;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.55-62
    • /
    • 2009
  • u-GIS 환경에서는 센서 네트워크를 통해 필요한 공간 데이터를 수집하고 이를 실시간 처리 및 가공 또는 기 저장되어 있는 정보와 함께 유통된다. 웹 기반 응용서비스 등에서 인터넷 망을 통한 정보가 요청되는 경우 표준 문서인 XML로 전달된다. 특히 요청되는 정보에 공간 데이터가 포함되는 경우 공간데이터 처리가 가능한 GML, S-XML 등의 문서가 사용된다. 이 과정에서 DSMS에서와 같이 실시간 처리된 스트림데이터는 S-XML 문서 형태로 변환되고, 웹 기반의 공간정보 응용서비스는 인터넷 망을 통해 S-XML 문서를 전달받는다. 대부분의 공간정보 응용서비스는 저장시스템으로 기존의 공간 데이터베이스 관리 시스템을 사용하기 때문에 S-XML 데이터와 SDBMS에서 사용되는 데이터간의 상호 변환과정이 필요하다. 본 논문에서는 공간 데이터의 캐싱을 이용한 S-XML 변환 기법을 제안한다. 제안 기법은 공간 정보유통을 위한 S-XML과 관계형 공간 데이터베이스와의 효율적인 변환을 위해, S-XML에서 공간 데이터에 해당하는 부분을 캐싱하고, 동일 지역의 공간데이터에 대한 변환이 요구될 경우 캐시 데이터를 재사용하여 별도의 변환 비용 없이 변환한다. 제안 기법을 통해 u-GIS 환경에서 공간정보의 유통을 위한 S-XML 문서와 이를 이용하는 웹 기반 공간정보 응용서비스 사이의 변환 비용을 감소하였으며, 성능평가를 통하여 질의 처리 성능이 향상됨을 보인다.

  • PDF

압축된 문서에 대한 질의 처리를 지원하는 XML 압축 알고리즘의 설계 및 구현 (Design and Implementation of a XML Compression Algorithm Supporting Query Processing for Compressed Documents)

  • 이석재;강영준;유재수;조기형
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.90-99
    • /
    • 2004
  • 인터넷의 급속한 확산에 따라 사회 전반의 디지털화와 지식정보화가 급속도로 진행되고 있다. 많은 사용자들은 웹 상에서 다양한 작업을 하고 서비스를 이용하고 있다. 이러한 작업들의 대부분은 XML을 이용한다. XML은 개발자가 필요시 문서의 논리 구조를 정의할 수 있으며, 내용과 스타일이 분리되어있어 문서의 재사용성이 뛰어나다. 하지만 XML은 문서의 내용을 단순히 텍스트 형태로 다루고 문서의 구조를 표현하기 위해 많은 태그들이 추가되기 때문에 문서의 크기가 커질 수 밖에 없다. 팜탑, PDA등 용량이 제한된 기기에서 XML 문서를 보다 잘 활용하기 위해서는 XML문서를 효율적으로 압축해서 사용할 필요가 있다. 이러한 이유로 최근 XML 문서를 효과적으로 압축하고 다루기 위한 XML 압축 기법에 대한 연구가 일부 이루어지고 있지만, 기존 연구들의 대부분은 압축된 XML문서에 대한 질의 처리를 고려하지 않았다. 본 연구에서는 기존의 방법들보다 XML 문서를 효과적으로 압축을 하여 저장 공간의 활용도를 놓이고, 압축된 XML 문서에 대해 질의처리를 가능하게 하여 보다 빠른 질의 처리를 할 수 있는 XML 압축 알고리즘을 설계 및 구현한다.

  • PDF

XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당 (Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases)

  • 이정아;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

XML 기반의 기업간 수주처리시스템의 설계 및 구현

  • 조찬영;서준용;김재균;장길상
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2001년도 추계학술대회 발표논문집:차세대 전상거래 시대의 비즈니스전략
    • /
    • pp.31-36
    • /
    • 2001
  • 최근 기업간 거래는 인터넷을 기반으로 하는 기업간 전자상거래(B2B: business to business electronic commerce)로 시간과 공간을 초월하여 이루어지고 있다. 따라서 국내·외 많은 기업들은 인터넷 기반의 비즈니스와 정보교환으로 업무 효율화 및 기업 경쟁력 강화에 중점을 두고 있다. 최근 온라인 환경의 인터넷 EDI 방식에 많은 기업들이 관심을 가지고 있으며, 전통적 EDI방식의 문제 해결방안으로 웹 문서를 많이 활용하고 있다. 또한, 현재까지 웹 문서는 HTML을 사용하여 정의되고 있는데, 이러한 HTML은 간편한 사용과 높은 이식성을 가진다. 그러나 기업간 발생하는 다양한 문서양식을 표현하기 힘들며, 기업간 서로 상이한 정보시스템에서 발생되는 거래 데이터 등의 통합이 불가능하다 그래서 최근 HTML의 한계를 극복할 수 있는 새로운 언어로 XML이 등장하여 인터넷 기반의 B2B에서 기업간 정보 교환에 적용되어 질 수 있다. 따라서 본 연구에서는 기존 웹 기반의 기업간 수주처리시스템에 XML 언어를 사용한 기업간 데이터 통합 방안을 제시한다. 또한 이를 ‘H’기업에 적용하여 프로토타입 시스템을 구현하고, 그 기대효과를 제시한다.

  • PDF

GML 문서의 통합 지리 정보 검색을 위한 XQuery의 확장 (A Extension of XQuery for Integrated Geographic Information Retrieval of GML)

  • 안영수;박순영;정원일;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.617-619
    • /
    • 2003
  • GML(Geography Markup Language)은 XML(extensible Markup Language)의 장점을 이용하여 지리 데이터의 저장과 전송을 위해 OGC(Open GIS Consortium)에서 제안되었다 이러한 GML은 웹 환경의 발전에 따라 지리 정보 통합을 위해 널리 이용되고 있으나. GML 문서에 대한 지리 데이터 검색 기술은 미흡하다. 최근 W3C(World Wide Web Consortium)에서는 XML 문서로부터 데이터를 추출하기 위한 표준 질의어로 XQuery를 추천하기 위한 작업 초안(working draft) 상태에 있다. 그러나 이러한 XML 질의어는 지리 정보의 추출에 대한 고려는 하고 있지 않다. 따라서 본 논문에서는 지리 정보를 포함하고 있는 GML 문서를 기반으로 지리 정보를 검색. 추출할 수 있는 GML Query language인 GQuery를 제안하고자 한다. 본 논문의 GQuery는 서로 이질적인 공간 데이터베이스의 데이터를 통할하여. 통합된 문서내의 지리정보를 추출하기 위한 사용자 인터페이스로 이용할 수 있다.

  • PDF

XML 문서의 효율적인 변경을 위한 XML 번호체계 (XML Numbering Schemes for Efficient Update of XML Documents)

  • 김영현;강현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.55-58
    • /
    • 2004
  • XML 의 중요성이 부각 되면서 XML 데이터의 효율적 관리 기법에 관한 연구가 활발히 수행되고 있다. XML 질의의 표준화 작업도 활발히 이루어져 현재 XQuery가 유력한 표준으로 부각되었다. 그러나 XQuery 등이 완전한 XML 질의어가 되기 위해서는 변경 연산을 제공해야 하는데 XML 변경어의 표준화 작업이나 XML 변경 처리 기법에 대한 연구는 아직 미미한 실정이다. 본 논문에서는 e-Business 등 XML 데이터베이스 기반 웹 응용의 효율적 지원을 위한 XML 문서 갱신에 대한 기법을 다룬다. XML 문서의 효율적 갱신을 위한 RN(RmdEid, NextChildEid) 번호 체계, R(RmdEid) 번호 체계 을 제시한다. 어떤 XML 번호 체계를 사용하여 XML 문서를 저장하는 가는 XML 문서의 갱신 연산에 중용한 영향을 미친다. 이들 번호 체계들은 데이터베이스내의 테이블 스키마의 차이점으로 구분한 것이다. 이들 번호체계 각각에 대하여 XML 데이터베이스 시스템을 구현하여 이들 기능의 성능 및 공간 부담을 평가한 결과를 기술한다.

  • PDF

시맨틱 웹에서 멀티미디어 데이터 검색을 위한 공간관계 표현 연구 (Representing the Spatial Relations for Searching the Multimedia Data in Semantic Web)

  • 공현장;정관호;김원필;배용근;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.825-828
    • /
    • 2003
  • 웹에는 막대한 양의 멀티미디어 데이터가 있다. 최근에 이러한 멀티미디어 데이터의 효과적 검색을 위한 많은 시스템이 개발되고 있으며, 그 결과 내용기반 이미지 검색과 같은 이미지의 내용을 인식하고 검색하고자 하는 연구가 진행되고 있다. 그렇지만 지금까지의 연구는 웹 검색엔진에 멀티미디어의 검색을 위한 또 하나의 검색엔진이 필요하여 그 무게가 커지고 그 성능도 저하된다. 이에 본 논문에서는 차세대 웹인 시맨틱 웹에서의 의미적 검색에 초점을 맞추어 멀티미디어 데이터 각각에 의미적 정보를 추가하여 웹 문서를 작성한다면 그 검색에 또 다른 검색엔진의 사용없이 효과적 검색이 이루어 질 것을 목적으로 하고 있다. 먼저, 간단한 이미지내에서 객체간의 공간적 관계를 표현하기 위한 새로운 Axiom 을 정의하고, 이를 적용하여 시맨틱 웹에서의 의미적 이미지 검객을 꾀한다.

  • PDF