• 제목/요약/키워드: Graph Retrieval

검색결과 52건 처리시간 0.027초

제품 설계 정보 재사용을 위한 그래프 기반의 부품 영상 정보와 설계 정보의 병합 (Integration of Component Image Information and Design Information by Graph to Support Product Design Information Reuse)

  • 이형재;양형정;김경윤;김수형;김선희
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.1017-1026
    • /
    • 2006
  • 최근에는 제품 개발의 효율성 증대를 위해서 다양한 분야의 전문가들이 참여하는 분산된 협업적 개발 환경이 필수적으로 인식되고 있으며 이에 따른 제품 설계 정보의 재사용 문제가 새롭게 부각되고 있다. 본 논문에서는 제품 설계 정보의 재사용을 위해 멀티미디어 기기에서 획득된 제품 영상을 부품 단위로 분할하여 속성 관계 그래프를 생성하고 이를 통해 제품 설계 정보를 검색하는 시스템을 제안한다. 본 논문에서 제안한 시스템은 라벨링 방법으로 제품 영상을 분할하고, 각 분할 영역의 속성과 영역간의 관계를 표현하는 속성 관계 그래프를 생성한다. 속성 관계 그래프는 제품 설계 정보를 추가하여 확장함으로써 영상 검색을 통한 제품 설계 정보의 재사용이 가능하다. 본 시스템의 주요 이점은 다음과 같다. 첫째, 주변 장치로부터 쉽게 획득할 수 있는 멀티미디어 영상을 이용하므로 특정 설계 툴에 종속적이지 않다. 둘째, 비율을 이용한 특징 벡터에 의해 다양한 크기의 유사 부품을 포함하는 영상의 검색이 가능하다. 셋째, 분할된 각 부품의 영역에 대한 다양한 영상 정보와 그들의 관계를 적용하기 때문에 검색 능력이 뛰어나다.

도메인 질의응답 시스템 (Domain Question Answering System)

  • 윤승현;임은희;김덕호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.144-147
    • /
    • 2015
  • Question Answering (QA) 서비스는 사용자의 자연어 질의에 대응하는 정확한 답변을 제공하는 시스템이다. 본 연구는 특정 도메인에 관련한 사용자들의 질문에 대해 QA 서비스가 자동으로 대응하는 방법에 관한 연구이다. 이를 수행하기 위하여 사용자의 자연어 질문을 이해하고, 정형 데이터 및 비정형 데이터로부터 사용자 질문에 적합한 답변을 도출하여 제공하는 방법을 제시한다. 실험 결과 top 1 accuracy 68%, top 5 accuracy 77% 결과를 얻었다. 또한 본 논문은 QA 시스템 내부 모듈이 전체 accuracy에 미치는 영향에 대해서도 기술하였다.

융합 인덱싱 방법에 의한 조인 쿼리 성능 최적화 (Join Query Performance Optimization Based on Convergence Indexing Method)

  • 짜오티엔이;이용주
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.109-116
    • /
    • 2021
  • RDF(Resource Description Framework) 데이터 구조는 그래프로 모델링하기 때문에, 관계형 데이터베이스와 XML 기술의 기존 솔루션은 RDF 모델에 바로 적용하기 어렵다. 우리는 링크 데이터를 더욱 효과적으로 저장하고, 인덱스하고, 검색하기 위해 융합 인덱싱 방법을 제안한다. 이 방법은 HDD(Hard Disk Drive) 와 SSD(Solid State Drive) 디바이스에 기반한 하이브리드 스토리지 시스템을 사용하고, 불필요한 데이터를 필터하고 중간 결과를 정제하기 위해 분리된 필터 및 정제 인덱스 구조를 사용한다. 우리는 3개의 표준 조인 검색알고리즘에 대한 성능 비교를 수행했는데, 실험 결과 제안된 방법이 Quad와 Darq와 같은 다른 기존 방법들에 비해 뛰어난 성능을 보인다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

위키피디아 링크를 이용한 랭크 기반 개념 계층구조의 자동 구축 (Automated Development of Rank-Based Concept Hierarchical Structures using Wikipedia Links)

  • 이가희;김한준
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.61-76
    • /
    • 2015
  • 흔히 대용량 텍스트 데이터의 분류를 위한 인덱싱 데이터 구조로서 계층 개념 트리가 활용된다. 본 논문은 개념 계층구조를 자동적으로 구축하기 위해 위키피디아를 이용한 일반성 랭크 기반 기법을 제안한다. 이것의 목적은 위키피디아 문서를 하나의 개념으로 정의하여 이들 간의 계층적 위상관계를 생성하는 것이다. 이를 위해 위키피디아 문서들 간의 링크 개수를 주요 인자로 하여 개념 일반성을 가늠하는 랭킹함수를 고안하였으며, 이를 활용하여 개념 간 확률적 포함관계를 산출함으로써 안정적인 개념 간 계층 구조를 생성한다. 결과적으로 계층적 관계를 담은 개념쌍은 DAG 구조로 시각화 된다. Open Directory Project 계층구조를 사용한 성능 분석을 통해 제안 기법이 기준 기법에 비해 성능이 우수하며 고품질 계층 관계를 안정적으로 추출할 수 있음을 확인하였다.

트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구 (Topic-Network based Topic Shift Detection on Twitter)

  • 진설아;허고은;정유경;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.285-302
    • /
    • 2013
  • 본 연구는 높은 접근성과 간결성으로 인해 방대한 양의 텍스트를 생산하는 트위터 데이터를 분석하여 토픽의 변화 시점 및 패턴을 파악하였다. 먼저 특정 상품명에 관한 키워드를 추출한 후, 동시출현단어분석(Co-word Analysis)을 이용하여 노드와 에지를 통해 토픽과 관련 키워드를 직관적으로 파악 가능한 네트워크로 표현하였다. 이후 네트워크 분석 결과를 검증하기 위해 출현빈도 기반의 시계열 분석과 LDA 토픽 모델링을 실시하였다. 또한 트위터 상의 토픽 변화와 언론 기사 검색결과를 비교한 결과, 트위터는 언론 뉴스에 즉각적으로 반응하며 부정적 이슈를 빠르게 확산시키는 것을 확인하였다. 이를 통해 기업은 대중의 부정적 의견을 신속하게 파악하고 이에 대한 즉각적인 의사결정 및 대응을 위한 도구로 본 연구방법을 활용할 수 있을 것으로 기대된다.

웹 데이타베이스에서 하이퍼텍스트 모델 확장 및 데이타베이스 게이트웨이의 동적 서버 할당 (Hypertext Model Extension and Dynamic Server Allocation for Database Gateway in Web Database Systems)

  • 신판섭;김성완;임해철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.227-237
    • /
    • 2000
  • 웹 데이타베이스는 웹 환경에서 하이퍼텍스트 모델을 바탕으로 멀티미디어 처리를 위한 부가적인 구조와 관계형 또는 객체지향형 데이타베이스 관리 시스템을 접목하여 구축하는 대용량의 멀티미디어 데이타베이스 응용 시스템이다. 그러나 기존의 하이퍼텍스트 모델링 기법과 DBMS 통로 형태로는 웹 서비스 고급화에 필수적인 다양한 표현능력과 DBMS 연동과정에서의 병목발생으로 인한 동시성 기능이 제한된다. 따라서, 본 논문에서는 하이퍼텍스트 모델링 측면에서 암시적 질의 수행 기능을 지원하고 동적으로 생성되는 항해 모델과 가상 그래프 구조를 제안한다. 또한 항해 유형 분류를 통해 노드와 링크의 생성 규칙을 유도하고 제안된 모델과 웹 데이타베이스 시스템 후위에 위치하는 관계형 모델과의 상호 사상기법을 연구한다. 그리고 데이타베이스 통로의 효율을 향상시키기 위해 가중치를 기반으로 질의처리 서버를 동적으로 할당하는 스케줄링 기법을 제안하여 시스템 전체의 성능을 개선하고, 제안된 기법이 상대적으로 높은 복잡도를 갖는 동시 질의 요구에 적합함을 보인다.

  • PDF

교통 빅데이터의 효율적 저장 및 검색 기술의 설계와 구현 (Design and Implementation of Efficient Storage and Retrieval Technology of Traffic Big Data)

  • 김기수;이재진;김홍회;장유림;함유근
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.207-220
    • /
    • 2019
  • 최근 정보통신기술의 발달은 센서를 바탕으로 수많은 데이터를 구축하고 이를 이용하여 실시간 서비스를 제공할 수 있게 한다. 교통안전공단에서는 디지털 운행기록계를 통해 전국의 상용차의 운행 정보를 수집하고 있다. 전국 상용자의 운행 정보는 교통 분야에서 다방면으로 활용이 가능하다. 그 중 특히 자율주행 분야에서는 실시간으로 운행정보를 분석하여 위험 운전에 대응을 하거나 방지하는데 도움을 줄 수 있다. 그러나 전통적인 데이터베이스 시스템을 이용하여 대용량의 데이터를 실시간 서비스에 적합한 수준의 성능으로 처리하는 데는 한계가 존재한다. 특히 국내에서는 이와 같은 기술적인 문제로 상용차 운행정보의 실시간 분석을 위한 대규모 교통 빅데이터의 처리가 이전에 시도된 적이 없다. 이런 문제를 해결하기 위해 본 연구에서는 새로운 방식의 데이터베이스 서버 시스템 최적화를 진행하였고 실시간 서비스가 가능한 수준임을 확인하였다. 구축된 데이터베이스 시스템을 이용하여 디지털 트윈, 자율주행환경을 마련하기 위한 기반 데이터를 확보할 수 있을 것으로 기대된다.

  • PDF

빅데이터 분석을 활용한 워터파크 현황 및 인식 분석 (Analysis of Waterpark Status and Recognition Using Big Data Analysis)

  • 김재환;이재문
    • 디지털융복합연구
    • /
    • 제15권10호
    • /
    • pp.525-535
    • /
    • 2017
  • 본 연구는 최근 워터파크와 관련된 키워드를 통해 소비자 인식, 워터파크 현황을 살펴보고자 한다. 본 연구는 네이버와 다음을 수집채널로 선정하였으며, 키워드는 '워터파크'를 사용하였다. 자료 분석기간은 2015년 1월 1일부터 2016년 12월 31일까지 총 2년간을 연구기간으로 한정하였다. 분석결과 첫째, 빈도수를 살펴본 결과, 2015년 몰래카메라, 롯데워터파크, 검거, 용의자, 김해 2016년 롯데워터파크, 물놀이, 여름, 개장, 입장권 순으로 나타났다. 둘째, 연결정도 중심성 분석결과, 2015년 몰래카메라, 검거, 용의자, 여성, 샤워실 2016년 물놀이, 롯데워터파크, 여름, 원마운트, 입장권 순으로 나타났다. 셋째, N-GRAM 네트워크 그래프를 실시한 결과, 2015년 워터파크/몰래카메라, 몰래카메라/몰래카메라, 용의자/검거, 김해/롯데워터파크, 워터파크/용의자, 2016년 원마운트/워터파크, 김해/롯데워터파크, 워터파크/입장권, 워터파크/워터파크, 워터파크/개장 순으로 나타났다. 넷째, CONCOR분석을 실시한 결과, 2015년 3개의 그룹과 2016년 2개의 그룹이 형성되었다.

Rectangle Layout을 이용한 XML 기반 모바일 정보 시각화 시스템 (An XML based Mobile Information Visualization System for Mobile Devices using Information layout Techniques)

  • 유희용;전서현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권9호
    • /
    • pp.776-786
    • /
    • 2006
  • 본 논문은 제한된 디스플레이를 가지는 모바일 디바이스 상에서 XML로 작성된 정보를 사용자에게 효과적으로 보여주는 rectangle layout을 이용한 XML 기반의 모바일 정보 시각화 시스템을 제안한다. 먼저 트리 형태의 정보뿐만 아니라 사이클이 존재하는 그래프 정보까지 기술하도록 XML 스키마를 정의한다. XML로 기술된 정보에 대해 디스플레이 화면상에 배치할 때, 사각형의 형태를 가지는 디스플레이 화면의 특징을 고려하여 기존 radial layout을 개선한 rectangle layout 방식을 적용한다. 그 다음 전체 정보와 사용자가 관심을 가지는 정보를 동시에 표현하기 위해 어안 뷰(fisheye view)알고리즘의 DOI를 rectangle layout에 표현된 모든 정보에 적용한다. 또한 사용자가 새로운 관심 대상 정보를 선택하였을 때, 정보들의 화면 재배치에 따른 변화에 사용자 혼란을 줄이고 사용자의 인지력을 향상시키기 위한 방법을 모바일 디바이스의 능력을 고려하여 제안한다. 제안된 focus+context 방식의 정보 시각화 시스템은 데스크 탑에 비해 CPU 계산 능력과 디스플레이 화면, 메모리 제약이 심한 PDA, 셀룰라 폰, 스마트 폰과 같은 모바일 디바이스 상에서 정보 검색에 효과적인 인터페이스를 제공한다. 본 논문에서는 제안한 정보 시각화 시스템을 PDA상에 구현하고 제안된 rectangle layout을 이용한 정보 시각화 방식과 기존 radial layout을 이용한 정보 시각화 방식에 다양한 조건을 적용하여 실험 및 평가를 진행한다.