• 제목/요약/키워드: Document Representation

검색결과 113건 처리시간 0.024초

공간 통계 데이터의 시각화 기술 및 시스템 개발 (Visualization Technique of Spatial Statistical Data and System Implementation)

  • 백룡;홍광수;양승훈;김병규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.849-854
    • /
    • 2013
  • 본 논문에서는 공간 데이터를 기반으로 한 도시의 다양한 통계 정보를 제안된 알고리즘을 통해서 시각화하고 시각화된 데이터를 지도와 사상(Mapping)하여 분석할 수 있게 할 뿐만 아니라 공간적 정보를 기반으로 의사 결정을 하는 경우 활용할 수 있는 문서를 사용자의 간단한 조작으로 프로그래밍 방식에 의해 작성해주는 시스템을 제안한다. 제안된 기법은 2차원 지도 데이터에서 특징데이터 값에 대해 색을 이용하여 표현하는 기법인 히트 맵 분석 (Heat Map Analysis)기법과 공간적 근접성을 정의할 때 이용되는 버퍼링 분석 (Buffering Analysis) 기법을 활용한다. 본 시스템을 통해서 공간적 정보를 시각화를 한다면 지역의 분포된 다양한 공간적 정보를 쉽게 파악할 수 있을 것이다. 또한 분석된 정보를 기반으로 제공되고 있는 문서 자동생성기능을 활용한다면 표현된 공간적 정보의 문서화에 필요한 많은 시간과 비용을 절감할 수 있을 것으로 기대된다.

항만물류관리를 위한 XML기반 EDI시스템 (XML-based EDI system for port logistics)

  • 유걸;박종일;진성근;조휘경;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.518-520
    • /
    • 2012
  • 본 논문에서는 항만물류관리를 위한 XML기반의 EDI 시스템에 대해 소개하였다. XML기반의 EDI 시스템은 전자문서로 변환 시 스크립트 파일을 사용하지 않고, 바이너리 형식의 전자문서를 읽고 기록할 때 문서 스캐너와 매퍼를 사용하도록 설계 및 구현하였다. 또한 전자문서간의 변환 룰을 그래픽적으로 표현하기 위해 매핑 툴을 설계 및 구현하였다. 따라서, 본 논문에서 제안하는 항만물류를 위한 XML기반의 EDI 시스템은 XML의 특정의 정점을 가지고 있으며 기존의 EDI 전자문서 처리시스템에 비해 사용자의 편의와 속도의 개선, 타 시스템간의 이식성이 우수해 B2B Gateway 시스템으로 널리 활용될 것이다.

  • PDF

텐서공간모델 기반 시멘틱 검색 기법 (A Tensor Space Model based Semantic Search Technique)

  • 홍기주;김한준;장재영;전종훈
    • 한국전자거래학회지
    • /
    • 제21권4호
    • /
    • pp.1-14
    • /
    • 2016
  • 시멘틱 검색은 검색 사용자의 인지적 노력을 최소화하면서 사용자 질의의 문맥을 이해하여 의미에 맞는 문서를 정확히 찾아주는 기술이다. 아직 시멘틱 검색 기술은 온톨로지 또는 시멘틱 메타데이터 구축의 난제를 갖고 있으며 상용화 사례도 매우 미흡한 실정이다. 본 논문은 기존 시멘틱 검색 엔진의 한계를 극복하기 위하여 이전 연구에서 고안한 위키피디아 기반의 시멘틱 텐서공간모델을 활용하여 새로운 시멘틱 검색 기법을 제안한다. 제안하는 시멘틱 기법은 문서 집합에 출현하는 '단어'가 텐서공간모델에서 '문서-개념'의 2차 텐서(행렬), '개념'은 '문서-단어'의 2차 텐서로 표현된다는 성질을 이용하여 시멘틱 검색을 위해 요구되는 온톨로지 구축의 필요성을 없앤다. 그럼에도 불구하고, OHSUMED, SCOPUS 데이터셋을 이용한 성능평가를 통해 제안 기법이 벡터공간모델에서의 기존 검색 기법보다 우수함을 보인다.

XML 데이타베이스에서 경로-지향 질의처리를 위한 병렬 매치 방법 (A Parallel Match Method for Path-oriented Query Processing in iW- Databases)

  • 박희숙;조우현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.558-566
    • /
    • 2005
  • XML은 인터넷상에서 데이타를 표현하고 교환하기 위한 새로운 표준이다. 본 논문에서는, XML문서에 대한 경로-지향 질의어의 평가를 위한 새로운 접근법에 대하여 기술한다. 본 논문의 접근법에서는, 경로-지향 질의어의 평가속도를 개선하기 위해 경로서명을 이용하는 병렬 매치 인덱싱 구조의 제안과 함께 데이타베이스 안에 저장된 엘리먼트들의 경로서명들과 입력된 질의어의 경로서명 사이에 매치작업을 수행하기 위한 병렬 매치 알고리즘을 설계한다. 먼저, 병렬 매치 구조를 형성하기 위해서는 XML 문서상의 모든 경로서명들에 대한 이진 트라이를 구성한 다음 이들을 병렬 매치 인덱싱 구조로 변환한다. 경로-지향 질의어의 검색 연산을 수행하기 위해 병렬 매치 인덱싱 구조와 병렬 매치 알고리즘을 사용한다. 본 논문에서 제안한 방법에서 알고리즘의 시간 복잡도는 XML 문서내의 경로서명의 수에 대하여 로그값에 비례한다.

Self-Supervised Document Representation Method

  • Yun, Yeoil;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.187-197
    • /
    • 2020
  • 최근 신경망 기반의 학습 알고리즘인 딥 러닝 기술의 발전으로 인해 텍스트의 문맥을 고려한 문서 임베딩 모델이 다양하게 고안되었으며, 특히 대량의 텍스트 데이터를 사용하여 학습을 수행한 사전 학습 언어 모델을 사용하여 분석 문서의 벡터를 추론하는 방식의 임베딩이 활발하게 연구되고 있다. 하지만 기존의 사전 학습 언어 모델을 사용하여 새로운 텍스트에 대한 임베딩을 수행할 경우 해당 텍스트가 가진 고유한 정보를 충분히 활용하지 못한다는 한계를 가지며, 이는 특히 텍스트가 가진 토큰의 수에 큰 영향을 받는 것으로 알려져 있다. 이에 본 연구에서는 다수의 토큰을 포함한 장문 텍스트의 정보를 최대한 활용하여 해당 텍스트의 벡터를 도출할 수 있는 자기 지도 학습 기반의 사전 학습 언어 모델 미세 조정 방법을 제안한다. 또한, 제안 방법론을 실제 뉴스 기사에 적용하여 문서 벡터를 도출하고 이를 활용하여 뉴스의 카테고리 분류 실험을 수행하는 외부적인 임베딩 평가를 수행함으로써, 제안 방법론과 기존 문서 임베딩 모델과의 성능을 평가하였다. 그 결과 제안 방법론을 통해 도출된 벡터가 텍스트의 고유 정보를 충분히 활용함으로써, 문서의 특성을 더욱 정확하게 표현할 수 있음을 확인하였다.

xPlaneb: XML문서 검색을 위한 3차원 비트맵 인덱스 (xPlaneb: 3-Dimensional Bitmap Index for Index Document Retrieval)

  • 이재민;황병연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.331-339
    • /
    • 2004
  • XML은 다양한 장점을 통해 데이타를 표현하고 교환하기 위한 새로운 표준이 되었으며 현대의 많은 연구와 새로운 기술들에서 핵심적인 요소가 되고 있다. 그러나 XML의 장점인 자기 서술적인 특징은 구조적으로 상이한 XML 문서의 확산을 초래하게 되었고 이에 따라 XML의 효과적인 검색에 대한 연구의 필요성이 대두되게 되었다. 본 논문에서는 빠른 검색 속도를 통해 뛰어난 성능을 입증한 비트맵 인덱싱인 BitCube의 문제점을 분석한다. 또한 BitCube의 문제점을 해결하기 위해 연결 리스트를 이용한 새로운 3차원 비트맵 인덱싱인 xPlaneb(XML Plane Web)를 설계 및 구현한다. 제안된 기법은 BitCube의 3차원 배열 인덱스를 효율적인 노드로 재구성하고 BitCube의 연산을 대체하는 새로운 연산들을 활용하여 효과적으로 정보를 추출한다. 성능 평가를 통해 제안된 기법이 클러스터내의 문서의 양이 증가함에 따라 BitCube보다 메모리 사용량과 연산 수행 속도면에서 더 우수하다는 것을 보였다.

UML 표기법을 활용한 게임메카닉스 설계내용 표현방법 (A Representation Method of Game Mechanics Using UML Notations in Game Design)

  • 장희동
    • 한국게임학회 논문지
    • /
    • 제6권4호
    • /
    • pp.47-53
    • /
    • 2006
  • 일반 소프트웨어 개발과 달리, 게임개발은 기획, 프로그래밍, 그리고 그래픽디자인과 같은 다양한 분야의 전문가들이 한 팀을 이루어 진행된다. 그래서 게임개발은 개발참여자들 사이에 정확하고 효율적인 의사소통이 매우 어려운 특징이 있다. 성공적인 게임개발을 위해서, 게임디자인문서의 설계내용들을 모든 개발참여자들이 정확하게 이해하고 있어야 한다. 특히 게임디자인 설계요소인 게임메카닉스는 게임플레이 로직이 집중되어 있기 때문에, 오류 없는 내용과 오류 없는 표현, 그리고 모든 개발참여자들의 정확한 이해가 요구된다. 그러나 게임개발의 규모가 커지면서, 게임메카닉스의 내용도 복잡하고 방대하여, 개발 참여자들이 모든 내용을 정확하게 이해하는 것이 어렵게 되었다. 또한 게임메카닉스의 변경관리를 위한 형상관리가 복잡해져 그 효율성이 떨어지게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 UML표기법을 활용한 게임메카닉스 표현방법을 제안한다. 제안하는 방법은 게임메카닉스의 설계내용을 UML표기법을 사용하여 표현하기 때문에, 비주얼적 표현과 논리적 표현을 동시에 만족한다. 또한 UML 모델기반 형상관리가 가능하기 때문에 효율적인 게임메카닉스의 형상관리가 가능하다. 제안하는 표현방법의 효과성을 제시하기 위해, $\ulcorner$듀드를 잡아라$\lrcorner$ 게임디자인문서의 내용을 제안하는 방법으로 변환하여 표현해서 비주얼적 표현능력, 논리적 표현능력, 그리고 효율적인 형상관리 가능성을 보여주었다.

  • PDF

실험변수를 이용한 정보검색 시스템의 구축 및 평가 : 개체-관계 모델과 관계형 데이터베이스를 이용한 접근 (Implementing and Evaluating an Empirical Variable Retrieval System : The Entity-Relationship and Relational Approach)

  • 오삼균
    • 한국문헌정보학회지
    • /
    • 제32권4호
    • /
    • pp.53-67
    • /
    • 1998
  • 이 연구에서는 실험변수 및 그 통계적 관계를 문서 색인과 검색에 이용하는 가능성을 타진하고 평가하였다. 이를 위해 실험변수검색시스템(Empirical Fact Retrieval System: EFRS)과 유사기존검색시스템(Simulated Traditional Retrieval System: TRS)이라 명명한 두 시스템을 구축, 제한된 질의를 놓고 검색한 결과를 비교 분석하여 보고했으며, 실험변수검색시스템이 가진 잠재적 장점을 전반적으로 고찰하고 관련된 제반 문제들을 논의하였다.

  • PDF

Design and Development of a Multimodal Biomedical Information Retrieval System

  • Demner-Fushman, Dina;Antani, Sameer;Simpson, Matthew;Thoma, George R.
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.168-177
    • /
    • 2012
  • The search for relevant and actionable information is a key to achieving clinical and research goals in biomedicine. Biomedical information exists in different forms: as text and illustrations in journal articles and other documents, in images stored in databases, and as patients' cases in electronic health records. This paper presents ways to move beyond conventional text-based searching of these resources, by combining text and visual features in search queries and document representation. A combination of techniques and tools from the fields of natural language processing, information retrieval, and content-based image retrieval allows the development of building blocks for advanced information services. Such services enable searching by textual as well as visual queries, and retrieving documents enriched by relevant images, charts, and other illustrations from the journal literature, patient records and image databases.

웹문서 검색을 위한 온톨로지 버전 제어 (Ontology Version Control for Web Document Search)

  • 김병곤
    • 디지털산업정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.39-48
    • /
    • 2013
  • Ontology has an important role in semantic web to construct and query semantic data. When system make changes to ontologies, questions arise about versioning of these changes. Applying this changes on a dynamic environment is even more important. To apply these changes, change specification method is needed. Early studies show RDF-based syntax for the operations between old and new ontologies. When several ontology versions can be used for some query, if possible, using possible newest version ontology with prospective use is best way to process the query. Prospective use of ontology means using a newer version of an ontology with a data source that conforms to a more recent ontology. In this paper, for prospective use of ontology version, structure of change specification of class and property through several ontology versions is proposed. From this, efficient adaptive ontology version selection for a query can be possible. Algorithm for structure of version transition representation is proposed and simulation results show possible newest version number for queries.