• 제목/요약/키워드: 개념기반 정보검색

검색결과 368건 처리시간 0.031초

공통기술표현포맷에 기반한 다매체자료의 검색효율 향상에 관한 연구 (Enhancing Expressiveness of Conceptual Modeling for Bibliographic Relationships - A Reflection on the FRBR Entity-Relationship Model -)

  • 최윤선;알렌리니어
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.5-15
    • /
    • 2006
  • 서지관계모형을 위한 개념적 모델인 IFLA의 FRBR (Functional Requirements for Bibliographic Records)에 대한 대안적인 접근이 발표되어 왔지만, FRBR 모델의 내부적인 일관성에 대해서는 많은 연구가 진행되어 있지 않은 실정이다. 본 연구는 FRBR 객체-관계 (entity-relationship) 모델에서 객체들 (entities)간의 관계(relationships) 에서 발생하는 상속 (inheritance) 속성과 관련된 모델의 내부적 모순점을 지적하며, 이러한 문제를 해결하기 위해 FRBR 모델의 표현성(expressiveness)을 강화하기 위한 여러 대안적인 방안을 논의한다.

비구조적 공간정보를 지원하는 개념적 지오시맨틱 웹 서비스 프레임워크의 설계 (Design of a Conceptual Geosemantic Web Service Framework supporting Textual Geospatial Information)

  • 하수욱;남광우
    • Spatial Information Research
    • /
    • 제19권4호
    • /
    • pp.91-97
    • /
    • 2011
  • 본 연구는 공간정보 분야에서 시맨틱 웹 기술을 접목한 서비스 아키텍처를 제안한다. 최근 웹 서비스 기술의 발달과 함께 무선 인터넷 및 스마트폰의 보급을 통해 지리정보와 관련된 다양한 서비스들이 등장하고 있다. 또한 시맨틱 웹 기술이 주요 검색 포털들에 적용됨으로써 일반인들은 온라인상에 공개된 다양한 정보들에 보다 쉽게 접근할 수 있게 되었다. 그러나 공간정보 분야에서는 이질적인 데이터 저장 구조를 갖는 공간정보 데이터에 대한 연계 이외의 활용 가능한 서비스 유형에 대한 연구가 부족한 것이 현실이다. 따라서 본 연구에서는 공간정보 웹 서비스 및 시맨틱 웹과 관련된 표준들을 바탕으로 시맨틱 공간정보 서비스를 구성하는 기능 요소들을 도출하였다. 또한 적용 가능한 유즈케이스들과 시맨틱 공간정보 서비스 아키텍처를 제시하였으며, 이를 통해 향후 시맨틱 공간정보 서비스 구현을 위한 기반을 마련하였다.

웹 이용자의 정보탐색행위 패턴 분석 (Analyzing Patterns in User's Information Seeking Behavior on the Web)

  • 김성진
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.197-214
    • /
    • 2006
  • 전통적인 정보환경에 비해 웹 환경은 매우 다양하고 이질적인 이용자들을 대상으로 하기 때문에 이용자의 개별적 특성에 초점을 맞추어서는 웹 정보탐색행위에 대한 일반적인 이해가 불가능하다. 따라서 본 연구는 웹 이용자에게서 보여지는 공통된 정보탐색행위에 초점을 맞춰 이용자들이 웹에서 어떻게 정보를 찾는지 그 행위 패턴을 분석하고자 한다. 이를 위해 시간대별 인터뷰 기법을 적용하여 Dervin의 인지이동 개념을 기반으로 웹과의 상호작용 속에서 이루어진 일련의 인지적 움직임을 파악하고 하였다. 본 연구는 응답자 21명을 대상으로 37개의 웹 탐색 경험을 조사하였다. 분석결과, 웹 정보탐색행위는 시작, 검색, 브라우징, 조사, 정보발견, 결정/행동, 종료의 7가지 유형으로 구성되었다 응답자별로 매우 다양한 행위 패턴을 보였으며 특히 브라우징 단계를 중심으로 반복되고 순환되면서 웹 정보탐색행위의 다방향적이고 비선형적인 특징을 보였다.

이미지 감정색인을 위한 시각적 요인 분석에 관한 탐색적 연구 (An Exploratory Investigation on Visual Cues for Emotional Indexing of Image)

  • 정선영;정은경
    • 한국문헌정보학회지
    • /
    • 제48권1호
    • /
    • pp.53-73
    • /
    • 2014
  • 감정기반 컴퓨팅 환경의 발전에 따라서 이미지를 포함한 멀티미디어 정보 자원의 감정 접근과 이용은 중요한 연구과제이다. 본 연구는 이미지의 감정색인을 위한 시각적인 요인의 탐색적 규명을 목적으로 한다. 연구목적을 성취하기 위해서 본 연구는 사랑, 행복, 슬픔, 공포, 분노의 5가지 기본감정으로 색인된 15건의 이미지를 대상으로 20명의 연구 참여자와의 인터뷰를 통해서 총 620건의 감정 시각적 요인을 추출하였다. 감정을 촉발하는 시각적 요인(5가지)과 하위 요인(18가지)의 분포와 5가지 감정별 시각적 요인 분포를 분석하여 그 결과를 제시하였다. 이미지의 감정을 인지하는 주요한 시각적 요인으로는 얼굴표정, 인물의 동작이나 행위, 선, 형태, 크기 등의 조형적 요소가 차지하는 비중이 높은 것으로 나타났다. 개별 감정과 시각적인 요인과의 관계를 살펴보면, 사랑 감정은 인물의 동작이나 행위와 밀접하게 나타났으며, 행복 감정은 인물의 얼굴표정이 중요한 것으로 나타났다. 슬픔 감정 역시 인물의 동작이나 행위와 밀접하게 연계되어 있으며, 공포 감정은 얼굴의 표정과 깊은 관계가 있다. 분노 감정은 조형적인 요소인 선, 형태, 크기가 특징적으로 나타났다. 이러한 결과는 이미지가 지니는 내용기반 요소와 개념기반 요소의 복합적인 접근이 효과적인 감정색인에 있어서 중요하다는 것을 제시한다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

다차원 하천공간정보 표준화 및 효율적 유지관리 기술 연구 (A Study for Standardizing and Efficient Maintaining Multi-dimensional Geospatial River Data)

  • 김동수;김경동;유호준;여홍구
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.56-56
    • /
    • 2021
  • 하천단면이나 하상변동 추적 등 하천공간정보는 유량이나 강우 등 수문시계열 정보와 더불어 계획홍수위 산정이나 하천구조물 신설로 인한 하천의 변화를 추적하는 데 있어 근간을 이루는 주요 정보로 국가차원의 유지 및 관리가 필요하다. 국내의 하천공간정보는 RIMGIS, WAMIS, 하천 일람, WINS와 같은 웹기반 시스템에서 정보화 되어 관리되고 있다. 그러나, RIMGIS는 여러 가지 문제점을 노정하고 있어 개선을 적극적으로 검토해볼 시점이라고 볼 있다. 우선, RIMGIS는 구축이 10년 이상된 기술로 구성되어 온라인 시스템 실행속도가 느리고, 물관리 일원화 와중에 관리주체가 불분명해진 상태이며, 제공되는 정보도 하천망이나 유역 정도로 차원 및 정확도도 낮고 활용도 및 현행화도 부족한 상태이다. 또한 공간정보 관리 DB표준으로 효율적인 관계형 구조 대신 하천대장 등을 수치화한 개념의 레이어 단위의 주제도로 관리하다보니 자료중복이 불가피하여 시스템이 무겁고, 자료간 연관검색이 거의 불가하고, 신속한 하천지형 변화 업데이트가 어려운 상태이다. 최근 진행되고 있는 RIMGIS 개선 사업은 여전히 종래의 레이어 단위의 주제도들을 추가하거나 개정하는 데 머물고 있는 상태이다. 이러다 보니 현재 우리나라의 대표적인 하천정보시스템인 RIMGIS의 실무 활용도는 낮은 것으로 알려져 있다. 가장 실무활용도를 저하시키고 현행화 상의 문제로 지적되는 부분은 하천정비기본계획 수립 시 발생한 공간자료 관리 부실이다. 현재 RIMGIS에서는 하천기본계획보고서만 PDF 형태로 제공할 뿐, 실제 지형자료는 과업을 수행한 설계사에 개별 보관되어 활용도뿐만아니라 망실의 우려가 높은 상황이다. 본 연구에서는 하천기본계획수립 시 측량되는 단면을 포함한 다양한 공간자료를 관계형으로 표준화 DB에 효율적으로 저장할 수 있게 하는 방안을 제시하고자 한다.

  • PDF

과학기술분야 용어 간 관계추출 시스템의 평가를 위한 테스트컬렉션 구축 (Construction of Test Collection for Evaluation of Scientific Relation Extraction System)

  • 최윤수;최성필;정창후;윤화묵;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.754-758
    • /
    • 2009
  • 대용량 문서에서 포함된 정보를 추출하는 작업은 정보검색분야 뿐만 아니라 질의응답과 요약분야에서 매우 유용하다. 정보 추출 분야 중 관계추출 기술이 중요하게 인식되고 있으나, 기계학습모델을 기반으로 개발하기 위한 학습집합과 개발된 기술을 평가하기 위한 평가집합의 부재로 연구에 난항을 겪고 있다. 본 논문은 한국과학기술정보연구원(KISTI)이 보유하고 있는 해외학술지 데이터를 기반으로 과학기술용어에 대한 관계추출 기술 시스템을 개발하고 평가하기 위한 테스트 컬렉션(KREC2008) 구축을 위한 구축방법 및 절차를 기술한다. 해외 학술지 데이터의 초록을 대상으로 기술용어를 추출하였고, 기술용어의 쌍의 관계에 해당되는 단어를 Wordnet에 매핑하여 동사의 개념을 일반화하는 여러 개의 개념화된 후보군을 추출하였다. 평가기준 및 절차 교육이 이루어진 평가자가 개념화된 후보군에서 적합하다고 판단되는 "개념"을 "관계"로 지정하였다. Wordnet을 이용하여 "관계"에 대한 후보군을 생성하였기때문에, 일관성 있는 관계설정의 품질의 향상시켰고 비전문가도 쉽게 테스트컬렉션을 구축할 수 있는 방법을 제공하였다. 현재 KREC2008은 정보추출 연구자 및 개발자에게 공개되어 있으며, 과학기술분야 관계추출 시스템의 개발 및 신뢰도 평가를 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용될 예정이다.

  • PDF

그리드 컴퓨팅을 위한 온톨로지 기반의 시맨틱 정보 시스템 (Ontology Based Semantic Information System for Grid Computing)

  • 한병전;김형래;정창성
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.87-103
    • /
    • 2009
  • 그리드 컴퓨팅 환경은 기존의 분산 컴퓨팅 기술의 확장된 개념으로, 다양한 분야에서 저비용의 고성능 컴퓨팅 퍼포먼스를 얻기 위하여 그리드를 이용하고 있다. 그러나 공통적으로 이용할 수 있는 정보 시스템의 부재로, 현재의 그리드는 대규모의 단일한 환경으로서의 그리드가 아닌, 기존의 클러스터 컴퓨터와 같은 의미로 사용되고 있다. 따라서 자신이 구성한 분산 컴퓨팅 환경을 그리드 환경의 한 부분으로 포함시키기 위해서는 컴퓨팅 환경에 대한 정보를 그리드의 이용자가 공유할 수 있어야 하며, 정보 서비스를 공개하여 공유할 수 있도록 해야 한다. 따라서 본 논문에서는 정보의 공유와 확장이 용이하며, 플랫폼에 독립적인 서비스를 제공할 수 있는 정보 시스템을 구축하기 위한 웹 서비스, 온톨로지 기반의 Semantic Information System Framework(WebSIS)을 제안한다. WebSIS를 통하여 온톨로지를 이용하는 정보 시스템의 제작을 용이하게 하며, 온톨로지의 공유와 재사용, 확장의 특징을 활용할 수 있는 구조를 제안한다. 또, 그리드 컴퓨팅 환경이 기존의 분산 컴퓨팅 환경에 비해 복잡해짐에 따라 작업을 수행하기 위한 적절한 자원의 할당에도 좀 더 많은 고려사항이 존재하게 되었고, 이를 효과적으로 처리하기 위해서는 좀 더 고수준의 정보처리를 필요로 하게 되었다. 이에 우리는 WebSIS와 함께 WebSIS를 이용하여 그리드 환경을 이용하는 작업의 자동화를 위한, 온톨로지 기반의 고수준의 정보처리가 가능한 Resource Information Service를 구현하였고, 이를 통하여, 효율적인 공유와 확장을 위한 온톨로지 모델을 제안한다. 또한, 기존의 용어 매칭이 아닌 의미 정보를 이용한 검색과 정보 처리를 제안한다.

  • PDF

질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법 (A New Similarity Measure for Improving Ranking in QA Systems)

  • 김명관;박영택
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권6호
    • /
    • pp.529-536
    • /
    • 2004
  • 본 논문에서는 질의응답시스템의 성능을 개선하기 위해 문장의 위치정보와 질의형태분류기를 사용하여 질의에 대한 대답순위를 조정하는 새로운 질의-문서 유사도 계산을 제안한다. 이를 위해 첫째로 문서내용을 표현하고 문서의 위치정보를 반영하기 위해 개념그래프를 사용한다. 이 방법은 문서비교에 대표적으로 사용되는 Dice-Coefficient에 기반하고 문장에서 단어의 위치정보론 반영한 유사도 계산이다. 두번째로 질의응답시스템의 대답순위를 개선하기 위하여 질의형태를 고려한 기계학습을 통한 질문에 대한 분류를 하였으며 이를 위해서 뉴스그룹의 FAQ 문서 30,000개를 가지고 기계학습 방법인 나이브 베이지안을 사용한 분류기를 구현하였다. 이에 대한 평가를 위해 세계적인 정보검색대회인 TREC-9의 질의응답시스템분야에 제출된 데이타를 가지고 실험하였으며 기존의 방법에 비해 자동학습기법을 사용하였음에도 평균상호순위가 0.29, 상위 5위에 정답을 포함시킨 경우가 55.1%의 성능을 보였다. 이 방법은 다른 시스템과 달리 질의형태분류를 기계학습 방법을 사용하여 자동으로 학습하는 것에 의의를 갖는다.

영상 데이터를 활용한 실내 토폴로지 구현에 관한 연구 (A Study on the Implementation of Indoor Topology Using Image Data)

  • 김문수;강혜영;이지영
    • 한국측량학회지
    • /
    • 제34권3호
    • /
    • pp.329-338
    • /
    • 2016
  • 최근 실내공간정보에 대한 수요가 증가함에 따라 다양한 활용 서비스가 개발되고 있다. 그동안 2차원 또는 3차원 실내공간정보 서비스에서, 최근에는 전방위 영상 기반의 실내공간정보 서비스가 증가하고 있다. 단순히 실내공간의 가시화만을 제공하는 기존 전방위 영상 기반 서비스가 속성 검색, 질의 가능 서비스 등을 제공하기 위해서는 공간간의 위치 관계가 정의된 토폴로지 데이터가 반드시 필요하다. 이에 따라 본 연구에서는 전방위 영상 기반의 다양한 실내공간정보 서비스를 위해 필요한 실내 토폴로지 데이터를 국제 표준인 IndoorGML 형식에 맞춰 생성하는 방법을 제안하도록 한다. 본 연구에서는 영상으로부터 IndoorGML 데이터 생성을 위해 1)IndoorGML 기본 개념의 영상 적용을 위한 고려사항 분석, 2)IndoorGML 데이터 생성을 위해 필수 정의 요소인 ‘공간’을 대표하는 객체 식별 방법 제시, 3)공간 사이의 연결성을 정의로 구분하여 IndoorGML 데이터 생성 방법을 제안한다. 제안한 방법은 서울시립대학교 21세기관 6층을 대상으로 적용되어 IndoorGML 데이터를 생성하도록 한다. 본 연구는 향후 IndoorGML을 기반으로 개발되는 다양한 실내공간정보 서비스에 토폴로지 데이터를 생성하는 한 가지 유형의 방법을 제시한다는 점에서 의의가 있다.