• 제목/요약/키워드: 웹 검색

검색결과 2,249건 처리시간 0.034초

여과 및 분리 기법을 이용한 한국어 기준명사 추출 (Base-Noun Extraction with Filtering and Segmentation in Korean)

  • 김재훈;김준홍;박호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-10
    • /
    • 2000
  • 웹의 등장으로 방대한 양의 문서를 다루는 정보검색, 정보추출, 정보요약 등의 분야에서 명사 추출은 대단히 중요한 역할을 담당하는 한 모듈이다. 본 논문에서는 대량의 문서에서 효과적으로 명사를 추출하기 위해 여과기법과 분리기법을 이용한 한국어 기준명사 추출 시스템을 기술한다. 기준명사는 명사들 중에서 기본이 되는 명사로서 복합명사는 제외된다. 본 논문의 기본적인 개념은 먼저 여과기법을 이용해서 명사를 포함하지 않은 어절을 미리 제거하고, 그리고 분리기법을 이용해서 명사가 포함된 어절에서 명사어구와 조사를 분리하고, 복합명사에 해당할 경우에는 각 명사를 분리하여 기준명사를 추출한다. ETRI 말뭉치를 대상으로 실험한 결과 재현율과 정확률 모두 약 89% 정도의 성능을 보였으며, 제안된 시스템을 한국어 정보시스템에 적용해 보았을 때, 좋은 결과를 얻을 수 있었다.

  • PDF

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

웹 기반의 전자상거래를 위한 도서검색 시스템 설계 (A Design of Book Retrieval System for Electronic Commerce in based Web)

  • 하추자;정종근;박종훈;김철원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.659-662
    • /
    • 2005
  • XML is standard of web document, and is used in language for document data exchange. XML document is used as example that change existing document to XML or makes new document by XML increases and XML search system to search XML document efficiently accordingly is requiring. This paper describes design and implementation of query processing system for translating XML elements and data between XML documents and relational database and consist of XML to DB processor, DB to XML processor and XML document management processor. Through this, described for design and embodiment of efficient XML document search system of JAVA base using XQL that is proposed in language of quality of XML document.

  • PDF

CoDocs 문서관리시스템의 버전관리 (Document Version Management in CoDocs System)

  • 안건태;김진홍;한천용;정명희;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.290-292
    • /
    • 2000
  • 정보통신 분야에서의 최근의 기술적인 발전에 힙입어 인트라넷을 기반으로 한 조직내 업무를 자동화하고, 또한 정보 공유를 통해 생산성을 높이기 위하여 많은 정보시스템이 구축되고 있다. 이러한 정보시스템은 조직의 성격에 따라 유연성있게 변화하면서 기술문서 등 여러 가지 종류의 문서들을 효과적으로 관리할 수 있도록 지원하는 것이 바람직하다. CoDocs 시스템은 공동작업의 효과적인 지원을 위해 문서를 체계적으로 관리할 수 있는 웹 기반환경에서 구현된 문서관리 시스템이다. 본 논문에서는 CoDocs 시스템에서 구축된 문서정보조직을 기반으로 문서간의 연계성을 높이고 활용성을 증가시키기 위해 문서 버전관리기능을 설계 및 구현하였다. 버전관리는 각 문서의 버전을 저장하여 히스토리(history) 정보를 유지하고 관리하며, 문서간의 연관성을 부여하여 문서등록 및 검색 시 관련문서에 대한 참조기능을 제공한다.

  • PDF

컴포넌트 기반 WAP 응용 자동 생성기의 구현 (Implementation of a Component-based WAP Application Generator)

  • 고민정;강이지;이성혜;박은희;음두헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.193-195
    • /
    • 2003
  • 모바일 기반 전자상거래 시장이 급성장해 2004년 아시아 시장에서는 80억 달러를 넘어설 것으로 예상된다. 이렇게 급증하는 모바일 전자 상거래의 수요에 맞게 신속한 서비스를 제공하기 위해 WAP 응용과 생산성 향상이 요구된다. 본 논문에서 소개하는 WAPSiteGen은 데이터베이스부터 구축해야 하는 WAP 응용과 기존 데이터베이스를 사용하는 WAP 응용의 신속한 작성을 위해, 무선 응용의 사용자 인터페이스로 사용되는 WML 데크들과 함께 이 데크를 구성하는 카드를 통해 이뤄질 질의를 처리하는 JSP 웹 컴포넌트 및 EJB 컴포넌트들을 자동 생성하여 WAP 응용의 생산성 향상을 지원하는 도구이다. WAPSiteGen은 EJB 및 JSP 컴포넌트 기술을 도입함으로써 3-계층 구조를 갖는 WAP 응용의 확장성, 재사용성, 이식성 등을 향상시킨다. 또한, 비슷한 기능을 지원하는 타 상용 도구들과 달리 WAPSiteGen이 생성하는 응용은 질의의 대상인 개체와 이 개체와 연관된 모든 개체들의 집합을 한 단위로 검색 할 수 있어 연관된 정보들을 신속하게 제공할 수 있다.

  • PDF

이차구조요소 기반의 부분구조 검색을 위한 단백질 구조 비교 시스템 (Protein Structure Comparison System for Searching Substructures Based on Secondary Structure Elements)

  • 김진홍;안건태;변상희;이수현;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.811-813
    • /
    • 2003
  • 단백질의 기능은 단백질의 구조에 따라 결정되며, 새로운 단백질의 기능을 파악하기 위하여 이미 밝혀진 단백질의 기능과 구조를 비교하는 방법이 사용되고 있다. 단백질 구조를 비교하는 방법은 단백질 구조를 표현하는 방법에 따라 다양하게 개발되고 있으며, 보다 효과적으로 관련된 연구자들이 자신의 연구에 활용하기 위해서는 빠르고 쉽게 활용할 수 있는 인터페이스를 제공하는 도구가 필요하다. 본 논문에서는 단백질 이차구조 및 그들 사이의 관계를 이용하여 단백질 구조를 표현하는 PSAML과 이를 이용하여 표현된 단백질 구조를 비교하는 시스템인 S4E(Search Substructures of Secondary Structure Elements)에 관하여 기술한다. S4E 시스템은 단백질 이차구조와 그들 사이의 관계(각도, 거리, 길이)를 이용하여 표현된 단백질 구조를 비교하여 유사성이 높은 부분을 찾는 기능을 제공한다. 또한 S4E 시스템은 이차구조 기반의 단백질 구조 데이터베이스(PSAML 데이터베이스) 및 웹 기반 사용자 인터페이스를 제공하여 사용자가 쉽고 효과적으로 단백질 구조 비교를 할 수 있다.

  • PDF

XML 데이터베이스를 위한 다차원 중포 엘리먼트 색인구조의 운용과 할당 (Operations And Assignments Of Multidimensional Nested Element Indexs For XML Databases)

  • 이정아;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.401-404
    • /
    • 2006
  • 최근 XML 데이터베이스는 웹의 발전과 더불어 광범위한 인터넷의 자원 공유에 크게 기여하고 있다. XML로 작성된 문서를 저장하고 검색하기 위해 XML 문서의 저장, 질의언어, 질의처리 등에 대한 분야가 활발히 연구되고 있다. 특히 그 중 질의처리의 처리비용을 줄이기 위한 데이터 질의 최적화 기법에 관한 연구가 중요한 과제이다. 증포된 엘리먼트에 대한 기존의 색인기법들은 일차원 색인구조를 이용함으로써 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원하지 못하는 문제점을 가지고 있다. 따라서 본 논문에서는 XML Schema가 가지는 타입상속 개념을 고려한 XML 질의들에 대한 처리를 효율적으로 지원할 수 있는 다차원 증포 엘리먼트 색인구조와 다차원 경로 엘리먼트 색인구조의 운용법을 제시한다. 또한 효과적인 질의 처리를 하기 위한 XML 데이터베이스 색인구조의 유지비용을 줄이기 위하여 저장 공간 및 갱신 유지 비용을 최소화할 수 있는 효과적인 색인할당 방법을 제시한다.

  • PDF

게임전문용어전자사전 구현에 관한 연구 (Implementation of the Game Terminology Electronics Dictionary)

  • 임충재;윤태수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.355-358
    • /
    • 2002
  • 세계는 지식정보의 창출 및 활용정도가 국가경쟁력을 좌우하는 지식기반사회로 급격히 전환하고 있다. 이러한 상황에서 주요 지식정보의 집중적인 디지털화를 통해서 국가 지식정보 공유체계를 구축하는 것이 무엇보다 시급한 상황이다. 특히 급격하게 성장하고 있는 디지털 콘텐츠 분야의 체계적인 정보화 사업은 관련 분야의 선진국과 경쟁하기 위해서 절실하게 요구된다. 본 논문은 게임산업에 대한 체계적인 정보화를 추진하기 위해서 의미를 기반으로 한 게임전문용어전자사전 구축을 위한 연구 결과를 소개한다. 의미를 기반으로 한 게임전문용어전자사전 구축하기 위해서 다양한 형태의 게임 관련 자료를 통해서 망뭉치를 추출하였다. 추출한 망뭉치로부터 빈도수 등을 이용해서 중요한 의미를 갖는 표제어를 추출하였으며, 추출한 표제어를 이용해서 게임전문용어 시소러스를 구축하였다. 또한 웹 기반으로 게임전문용어전자사전을 구축하기 위해서 SDML 을 이용하여 전문용어를 표기했으며 다양한 검색 기능을 추가해서 게임전문용어전자사전의 프로토타입 시스템을 구축하였다.

  • PDF

플랫폼독립 시스템환경에서 일본어 입력 방법 (A Japanese Input Method for Platform-Free System Environment)

  • 송수범;이형직;변정용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.589-592
    • /
    • 2002
  • 현행 일본어 입력방법은 운영 체제 의존적 문자입력 방법을 채택하고 있다. 즉 운영 체제가 채택하는 문자입력방법과 문자 코드체계에 의존적이다. 특히 인터넷의 발전으로 세계 어느 곳에서나 인터넷을 이용하여 정보 검색이나 진자상거래와 같은 일을 할 수 있게 되었다. 또한 문자코드체계의 발전으로 일본어지원 운영체제가 아니더라도 일본어 폰트만 있으면 일본어로 된 웹사이트를 볼 수 있다. 그러나 일본어 입력은 운영체제의 문자입력기(IME : Input Method Editor)에 의존하기 때문에 일본어지원 운영 체제가 아니면 일본어를 입력 할 수가 없다. 이러한 이유로 웹에서 플랫폼에 상관없이 일본어를 입력 할 수 있는 기능이 절실히 필요하다. 본 논문은 플랫폼 독립적인 환경에서 인터넷을 통한 일본어 입력방법의 필요성과 그것이 가지는 한계점을 검토하고 응용프로그램과 연동하는 일본어 입력방법을 제안하고 구현하였다.

  • PDF

빈발 항목과 의미있는 희소 항목을 포함한 이미지 데이터 연관 규칙 마이닝 (Association Rules Mining on Image Data with Recurrent Items and Significant Rare Items)

  • 송임영;석상기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1359-1362
    • /
    • 2003
  • 최근 인터넷과 웹 기술의 발전 그리고 이를 기반으로 하는 다양한 멀티미디어 컨텐츠가 홍수를 이루고 있지만 멀티미디어 데이터에서 체계적으로 연관 규칙을 마이닝 하는 연구는 초기 단계이다. 본 논문에서는 이미지 프로세싱 분야 및 내용 기반 이미지 검색에 대한 기존 연구를 바탕으로 이미지 데이터 저장소에 저장된 재생성 항목과 희소하게 발생하지만 상대적으로 특정 항목과 높은 비율로 동시에 나타나는 희소 항목을 포함한 내용기반의 이미지 연관 규칙을 찾아내기 위한 탐사 기법을 제안한다 실험 결과 제안된 알고리즘은 기존의 재생성 항목만을 고려한 알고리즘보다 희소 항목을 포함하여 연관 규칙을 탐사하므로 같은 종류의 이미지가 모여 있는 저장소에서 이미지 오브젝트간의 연관 관계를 발견하는 이미지 데이터 마이닝에 효과적이다.

  • PDF