• Title/Summary/Keyword: Semantic Graph

검색결과 130건 처리시간 0.026초

빅데이터 분석을 활용한 워터파크 현황 및 인식 분석 (Analysis of Waterpark Status and Recognition Using Big Data Analysis)

  • 김재환;이재문
    • 디지털융복합연구
    • /
    • 제15권10호
    • /
    • pp.525-535
    • /
    • 2017
  • 본 연구는 최근 워터파크와 관련된 키워드를 통해 소비자 인식, 워터파크 현황을 살펴보고자 한다. 본 연구는 네이버와 다음을 수집채널로 선정하였으며, 키워드는 '워터파크'를 사용하였다. 자료 분석기간은 2015년 1월 1일부터 2016년 12월 31일까지 총 2년간을 연구기간으로 한정하였다. 분석결과 첫째, 빈도수를 살펴본 결과, 2015년 몰래카메라, 롯데워터파크, 검거, 용의자, 김해 2016년 롯데워터파크, 물놀이, 여름, 개장, 입장권 순으로 나타났다. 둘째, 연결정도 중심성 분석결과, 2015년 몰래카메라, 검거, 용의자, 여성, 샤워실 2016년 물놀이, 롯데워터파크, 여름, 원마운트, 입장권 순으로 나타났다. 셋째, N-GRAM 네트워크 그래프를 실시한 결과, 2015년 워터파크/몰래카메라, 몰래카메라/몰래카메라, 용의자/검거, 김해/롯데워터파크, 워터파크/용의자, 2016년 원마운트/워터파크, 김해/롯데워터파크, 워터파크/입장권, 워터파크/워터파크, 워터파크/개장 순으로 나타났다. 넷째, CONCOR분석을 실시한 결과, 2015년 3개의 그룹과 2016년 2개의 그룹이 형성되었다.

외부참조를 통한 IndoorGML과 CityGML의 결합 (A Linkage between IndoorGML and CityGML using External Reference)

  • 김준석;유성재;이기준
    • Spatial Information Research
    • /
    • 제22권1호
    • /
    • pp.65-73
    • /
    • 2014
  • 최근 대형 실내공간을 대상으로 Indoor Google Map과 같은 실내지도 및 내비게이션 서비스가 부분적으로 제공되고 있다. 이러한 서비스들을 위해서 실내 데이터가 필요하며, 실내를 표현하는 데이터 모델 표준으로 CityGML과 IFC가 널리 사용되고 있다. 이 두 표준들은 실내의 가시화와 건축 구조물의 분석 등에 필요한 기하 정보들을 담고 있는데, 실내공간 내비게이션은 기하정보뿐만 아니라 의미적인 정보, 그리고 네트워크와 같은 위상정보도 필요로 한다. 이러한 요구에 맞춰 실내공간정보의 표현 및 저장, 교환을 위한 데이터 모델이자 GML3의 응용 스키마인 IndoorGML이 OGC의 표준으로 제정되고 있다. IndoorGML은 기하적인 요소들을 직접 표현할 수 있을 뿐만 아니라 다른 문서를 외부 참조하는 것이 가능하다. CityGML이나 IFC로 구축된 데이터가 많이 구축되고 있기 때문에 이를 가공하여 IndoorGML의 생성에 활용한다면 시간과 구축비용 줄여 경제적인 이득을 볼 수 있다. 이러한 이유로 본 논문은 CityGML으로 구축된 실내공간 데이터를 IndoorGML의 데이터로 유도하고 연결하는 방법을 제시한다. CityGML과 IndoorGML의 대응관계에 대해 분석하고, 두 표준으로 만들어진 인스턴스 문서들을 서로 연결할 때 나타나는 문제와 이슈들에 대해 살펴보고, 이에 대한 해결 방안에 대해 논의한다.

소프트웨어 제품 계열 공학의 온톨로지 기반 휘처 공동성 및 가변성 분석 기법 (Ontology-based Approach to Analyzing Commonality and Variability of Features in the Software Product Line Engineering)

  • 이순복;김진우;송치양;김영갑;권주흠;이태웅;김현석;백두권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.196-211
    • /
    • 2007
  • 제품 계열 공학에서 제품의 공통성 및 가변성 분석을 결정짓게 하는 기준인 휘처 (feature) 분석에 대한 기존 연구는 개발자의 직관이나 도메인 전문가의 경험에 근간으로 분석 기준이 객관적이지 못하며, 비정형적인 휘처 분석으로 인한 이해 당사자 (stakeholder)의 공통된 휘처의 이해 부족 및 불명확한 휘처를 추출하는 문제점이 있었고, 기 개발된 소프트웨어에서 사용된 휘처의 재사용 개념이 부족했었다. 본 논문에서는 특정 도메인의 휘처 모델을 온톨로지로 변환하여 의미 기반 유사성 분석 기준에 의해 휘처의 공통성과 가변성을 추출하는 기법을 제시한다. 이를 위해, 먼저 공통된 휘처 중심의 메타 휘처 모델 기반으로 휘처의 속성을 정립하고, 메타 모텔에 준거하여 휘처 모델을 생성하여 온톨로지로 변환 후, 휘처 온톨로지 리포지토리 (Repository)에 저장한다. 이후, 동일 제품 계열 도메인의 휘처 모델 구축 시, 기 존 생성 모델과 온톨로지의 의미 기반 유사성 비교 분석 기법을 통해 휘처의 공통성과 가변성을 추출하는 것이다 또한 유사성 비교 알고리즘을 툴로 구현하였으며, 전자 결재 시스템 도메인의 실험 및 평가를 통 해 효과성을 보인다. 본 기법을 통해 메타 휘처 모델의 구문적 정립으로 이해성과 정확성을 제고시켜 고품질의 휘처 모델을 구축할 수 있으며, 온톨로지의 의미 기반 매핑으로 휘처의 공통성 및 가변성 추출을 정형화할 수 있고, 재사용성을 향상시킬 수 있다.

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

RDF 웹 문서의 부분적인 정보 은닉과 관련한 접근 권한 충돌 문제의 분석 (Analysis of Access Authorization Conflict for Partial Information Hiding of RDF Web Document)

  • 김재훈;박석
    • 정보보호학회논문지
    • /
    • 제18권2호
    • /
    • pp.49-63
    • /
    • 2008
  • RDF는 W3C의 시맨틱 웹에서 사용하는 기본적인 온톨로지 모델이다. 그리고 더욱 다양한 온톨로지 관계를 정의하는 OWL은 이러한 RDF 기본 모델을 확장한 것이다. 최근 Jain과 Farkas는 RDF에 대한 RDF 트리플에 기반을 둔 접근 제어 모델을 제시하였다. 그들 연구의 초점은 RDF 온톨로지 데이터에서 고려해야 하는 추론에 의한 접근 권한 충돌 문제를 소개한 것이다. 비록 RDF 모델이 XML로 표현되지만, 기존의 XML 접근 제어 모델을 RDF에 적용하기 어려운 것이 바로 이러한 RDF 추론 때문이다. 하지만, Jain과 Farkas는 그들의 연구에서 먼저 RDF 접근 권한 명세시의 권한 전파가 RDF 상/하위 온톨로지 개념에 대하여 어떻게 이루어지는 지를 정의하고 있지 않다. 이것이 중요한 이유는 추론에 의한 권한 충돌의 문제는 결국 권한 명세시의 권한 전파와 권한 추론시의 권한 전파 사이에서의 충돌 문제이기 때문이다. 본 논문에서는 먼저 RDF 트리플에 기반을 둔 RDF 접근 권한 명세 모델에 대하여 자세히 소개한다. 다음으로 이러한 모델을 바탕으로 RDF 추론 시의 권한 충돌 문제를 자세히 분석한다. 다음으로 권한 명세시의 권한 충돌 여부를 신속히 조사하기 위하여 포함 관계 추론과 관련한 그래프 레이블링 기법을 이용하는 방법을 간략히 소개한다. 마지막으로 Jain과 Farkas 연구와의 비교 및 제안된 충돌 발견 알고리즘의 효율성을 보이는 몇 가지 실험 결과를 제시한다.

상호작용성에 의한 SNS 영향유저 선정에 관한 연구 : 연속적인 참조관계가 있는 블로고스피어를 중심으로 (Finding Influential Users in the SNS Using Interaction Concept : Focusing on the Blogosphere with Continuous Referencing Relationships)

  • 박현정;노상규
    • 한국전자거래학회지
    • /
    • 제17권4호
    • /
    • pp.69-93
    • /
    • 2012
  • 블로그, 페이스북, 트위터와 같은 SNS(Social Network Service)는 유저와 포스트를 노드로, 유저와 포스트, 포스트와 포스트, 또는 유저와 유저 사이에 형성되는 다양한 관계를 링크로 하는 그래프로 표현될 수 있다. 본 논문은 이러한 그래프 구조를 분석하여 다른 유저들의 생각과 행동에 영향을 미치는 영향 유저를 선별하는 방법에 대해 논한다. 기본적인 패러다임으로 기존의 투표성 개념이 아닌, 다양한 시맨틱 웹 자원의 중요도를 평가하기 위해 제안된 상호작용성 개념을 초기 SNS의 하나인 블로고스피어의 영향력 평가에 적용함으로써, 여러 모의 실험을 통해 그 타당성과 적용 가능성을 입증하였다. 모의 실험은 각 대안이 제공하는 결과의 타당성 정도에 따라 성능을 비교 분석할 수 있는 네트워크 모형을 디자인하여 사용하였다. 또, 이러한 네트워크 모형에 대한 링크 가중치 튜닝의 결과 변화를 살펴봄으로써, 가중치 조합의 차이에서 발생하는 실험 오차를 줄이고, 실제 적용의 용이함을 비교 분석하였다. 부가적으로, 스팸 필터링 목적에서 포스트 컨텐츠 점수를 링크 구조 기반 방법 안에 포함시킬 수 있는 방법도 제안하였다. 본 연구는 SNS 영향유저 선별에 대한 연구의 출발점으로서, 다음과 같은 점에서 기존 연구와 구별된다. 첫째, 스크랩, 댓글, RSS, 친구 등 기존 연구에서 유의미한 속성으로 간주했지만, 그래프 기반 방법으로 함께 고려할 수 없었던 다양한 영향력 속성들을 종합적으로 반영할 수 있는 그래프 기반 영향력 평가 프레임웍을 제시한다. 둘째, 이 프레임웍은 영향력이 높은 개체들과 상호작용하는 개체가 영향력이 낮은 개체들과 상호작용하는 개체보다 높은 영향력을 갖게 되는 일반적인 현상을 구현할 수 있는 양방향성을 반영한다. 셋째, 영향력 평가 면에서 다른 사람들의 추종액션을 유발한 정도를 가장 중요한 요인으로 고려하여, 일련의 참조관계에 대해 기존의 페이지랭크나 HITS(Hypertext Induced Topic Selection)와는 다른 관점에서 접근하였다.

스마트 TV 환경에서 정보 검색을 위한 사용자 프로파일 기반 필터링 방법 (A User Profile-based Filtering Method for Information Search in Smart TV Environment)

  • 신위살;오경진;조근식
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.97-117
    • /
    • 2012
  • 인터넷 사용자는 비디오를 보면서 소셜 네트워크 서비스를 이용하고 웹 검색을 하고, 비디오에 나타난 상품에 관심이 있을 경우 검색엔진을 통해 정보를 찾는다. 비디오와 사용자의 직접적인 상호작용을 위해 비디오 어노테이션에 대한 연구가 진행되었고, 스마트 TV 환경에서 어노테이션 된 비디오가 활용될 경우 사용자는 객체에 대한 링크를 통해 원하는 상품의 정보를 쉽게 확인할 수 있게 된다. 사용자가 상품에 대한 구매를 원할 경우 상품에 대한 정보검색 이외에 상품평이나 소셜 네트워크 친구의 의견을 통해 구매 결정을 한다. 소셜 네트워크로부터 발생되는 정보는 다른 정보에 비해 신뢰도가 높아 구매 결정에 큰 영향을 미친다. 하지만 현재 소셜 네트워크 서비스는 의견을 얻고자 할 경우 모든 소셜 네트워크 친구들에게 전달되고 많은 의견을 얻게 되어 이들로부터 유용한 정보를 파악하는 것은 쉽지 않다. 본 논문에서는 소셜 네트워크 사용자의 프로파일을 기반으로 상품에 대해 유용한 정보를 제공할 수 있는 친구를 규명하기 위한 필터링 방법을 제안한다. 사용자 프로파일은 페이스북의 사용자 정보와 페이스북 페이지의 'Like' 정보를 이용하여 구성된다. 프로파일의 상품 정보는 GoodRelations 온톨로지와 BestBuy 데이터를 이용하여 의미적으로 표현된다. 사용자가 비디오를 보면서 상품 정보를 얻고자 할 경우 어노테이션된 URI를 이용하여 정보가 전달된다. 시스템은 소셜 네트워크 친구들에 대한 사용자 프로파일과 BestBuy를 기반으로 어노테이션된 상품에 대한 의미적 유사도를 계산하고 유사도 값에 따라 순위가 결정한다. 결정된 순위는 유용한 정보를 제공할 수 있는 소셜 네트워크 상의 친구를 규명하는데 사용된다. 참가자의 동의하에 페이스북 정보를 활용하였고, 시스템에 의해 도출된 결과와 참가자 인터뷰를 통해 평가된 결과를 이용하여 타당성을 검증하였다. 비교 실험의 결과는 제안하는 시스템이 상품 구매결정을 하기 위해 유용한 정보를 획득할 수 있는 방법임을 증명한다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

텍스트 마이닝 기법을 활용한 고전 추리 소설 작가 간 문체적 차이와 문체 구조에 대한 연구 (A study on detective story authors' style differentiation and style structure based on Text Mining)

  • 문석형;강주영
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.89-115
    • /
    • 2019
  • 본 연구는 고전 추리 소설 작가로 유명한 아서 코난 도일과 애거서 크리스티의 문체적 차이점을 데이터 분석을 통해 제시하고, 나아가 텍스트 마이닝에 입각한 문체 연구의 해석적 방법론을 제시하고자 시행되었다. 추리 소설의 핵심 요소인 사건과 인물에 더해 작가의 문법적인 집필 방식을 문체로 정의하고 분석을 시도하였다. 작가 별로 각 2권, 총 4권의 책을 선정하였으며 문장 단위로 텍스트를 나누어 데이터를 확보하였다. 각 문장에 따른 감성 점수를 부여한 뒤 페이지 진행에 따른 감성을 시각화하였으며, 페이지에 따라 토픽 모델링을 적용하여 소설 속 사건 진행 흐름을 파악할 수 있었다. 동시 발생 매트릭스(co-occurrence matrix)를 구성하고 네트워크 분석(Network Analysis)을 시행함으로써 사건이 진행되는 과정에서 인물들 간 관계의 변화를 확인할 수 있었다. 또한 전체 문장을 총 6가지 문체를 기준으로 문법적인 체계를 나누어 작가 간, 그리고 작품 간 집필 방식의 차이점을 확인하였다. 이러한 일련의 연구 과정은 문체에 대한 이해를 바탕으로 글 전체의 맥락을 파악할 수 있도록 도움을 줄 수 있으며, 나아가 기존에 개별적으로 진행되었던 문체 연구를 통합시킴으로써 문체 구조에 대한 이해를 도울 수 있다. 그리고 이러한 선행된 이해를 통해 온라인 텍스트를 비롯한 비정형 데이터 속 문체의 존재를 발견하고 구체화하는 작업에 기여할 수 있다. 뉴미디어를 포함한 온라인 텍스트를 심도 있게 분석하고자 하는 시도가 증가하고 있는 상황에서 해당 연구들과 연계를 통해 보다 의미 있는 온라인 텍스트 분석에 기여할 것으로 기대된다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.