• 제목/요약/키워드: 시맨틱 마이닝

검색결과 23건 처리시간 0.029초

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

온톨로지 기반의 쇼핑 사이트 고객을 위한 검색 시스템 (Ontology based Retrieval System for Shopping Sites Customer)

  • 구미숙;황정희;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.51-54
    • /
    • 2004
  • 시멘틱 웹은 기존의 웹과는 달리 정보의 의미가 정의되고, 이들 간의 의미적 연결을 지원한다는 특징이 있어서, 최근 차세대 웹으로 부각되고 있다. 이러한 의미적 연결을 위해서 시맨틱 웹의 기반인 온톨로지가 필요하다. 온톨로지는 리소스에 대한 메타데이터를 정의하여 의미적 연결이 가능하게 하므로 효율적인 정보 검색이 가능하다. 이 논문에서는 정보 검색의 효율을 증가시키기 위해서 시맨틱 웹의 핵심인 온톨로지 기반의 정보 검색 시스템을 제안한다. 쇼핑 사이트에서 효율적인 마케팅을 위해 사용자의 구매 패턴을 조사하여 고객에게 알맞은 정보 추천을 하기 위한 것을 목적으로 한다. 온톨로지의 구축은 XTM을 기반으로 토픽맵을 이용하였다. 그리고 온톨로지를 기반으로, 사용자의 구매패턴을 찾아서 정확한 정보 전달을 위해서 데이터 마이닝 기법을 이용하였다. 빈발패턴 트리 기법을 기반으로 하는 멀티 레벨 멀티 디멘션 빈발 패턴 마이닝 알고리즘을 이용하여 사용자 패턴을 분석하여 정보 검색에 효율을 기하였다.

  • PDF

의약품 시맨틱 소셜네트워크와 이미지 매칭을 이용한 스마트폰 기반의 Cyber Medicine Guider 연구 (A Study of Cyber Medicine Guider based on Smart Phone using Medicine Semantic Social Network and Image Matching)

  • 김수경;안기홍
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.64-66
    • /
    • 2010
  • 본 연구는 모바일 플랫폼 기반의 서비스 콘텐츠 제공을 위해 온톨로지와 텍스트 마이닝 및 소셜 네트워크기술을 융합한 시맨틱 소셜 네트워크 기술과 이미지 매칭 기술을 이용하여 주변의 의약품에 대한 정확한 정보를 획득하고 이를 사용자의 병증에 적용할 수 있는지에 대한 지식을 제공하고 스마트폰의 아바타와 컴퓨터 기반 대화를 진행하여 사용자의 병증에 대한 가진단을 제공하는 Cyber Medicine Guider를 연구하여 스마트폰 플랫폼 기반의 서비스 지향적 지능형 컨텐츠의 가능성을 제시하고자 한다.

  • PDF

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

시맨틱 기반의 Open API 정보제공을 위한 시맨틱 어노테이션 기법 연구 (A Study on Semantic Annotation Scheme for Providing Open API information Based Semantic)

  • 김상일;김화성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.175-176
    • /
    • 2011
  • 웹 서비스는 최근 급속한 발전과 함께 기존의 단절적이고 폐쇄적인 서비스에서 벗어나 정보를 개방하고 공유할 수 있는 웹 2.0 시대로 발전하고 있다. 또한 스마트 폰과 같은 휴대용 단말기의 빠른 보급과 함께 웹 서비스는 고정된 장소에서뿐만 아니라 이동 환경 등 다양한 장소에서 사용될 수 있어 웹 서비스에 대한 관심이 더욱 고조되고 있다. 이러한 웹 서비스는 Open API(Application Programming Interface)를 이용한 형태로 제공된다. 따라서 수집한 Open API 정보를 빠르고 쉽게 사용하려면 사용자에게 필요한 정보만을 제공할 수 있는 기술이 필요하다. 본 논문에서는 국외의 타겟 사이트에서 획득한 Open API 데이터를 기반으로 데이터 마이닝을 통한 Open API정보의 시맨틱 어노테이션에 대한 연구를 수행하였다.

데이터 마이닝에서의 상식 기반 후처리 기법 (Common-Sense Knowledge based Post-Processing Technique in Data Mining)

  • 이인기;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.25-28
    • /
    • 2011
  • 새로운 지식과 패턴을 발견하고자 하는 데이터 마이닝 알고리즘들은 큰 수의 규칙들을 생성하는 문제점을 가지고 있다. 최근 들어 이러한 문제를 해결하기 위한 방법으로 다양한 유용성(Interestingness) 연구들이 데이터 마이닝의 후처리 단계에서 진행되고 있다. 그러나 이러한 접근방법들 역시 지식을 습득하기 위한 과정에서 병목현상을 보여줌으로써 수많은 상식수준의 규칙을 정제하지 못하고 있다. 본 연구에서는 이러한 문제점을 해결하기 위한 방안으로 상식을 기반으로 하는 Common-Sense 척도를 정의하고 구현한다. 규칙이 얼마나 상식에 가까운지를 시맨틱 차원교체 기법을 이용한 유사도 분석을 통해 측정한다.

지능형 지식서비스를 위한 의미기반 XML 마이닝 시스템 연구 (Development of Semantic-Based XML Mining for Intelligent Knowledge Services)

  • 백주련;김진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.59-62
    • /
    • 2018
  • XML을 대상으로 하는 연구가 최근 5~6년 사이에 꾸준한 증가를 보이며 이루어지고 있지만 대다수의 연구들은 XML을 구성하고 있는 엘리먼트 자체에 대한 통계적인 모델을 기반으로 이루어졌다. 이는 XML의 고유 속성인 트리 구조에서의 텍스트, 문장, 문장 구성 성분이 가지고 있는 의미(semantics)가 명시적으로 분석, 표현되어 사용되기 보다는 통계적인 방법으로만 데이터의 발생을 계산하여 사용자가 요구한 질의에 대한 결과, 즉 해당하는 정보 및 지식을 제공하는 형식이다. 지능형 지식서비스 제공을 위한 환경에 부합하기 위한 정보 추출은, 텍스트 및 문장의 구성 요소를 분석하여 문서의 내용을 단순한 단어 집합보다는 풍부한 의미를 내포하는 형식으로 표현함으로써 보다 정교한 지식과 정보의 추출이 수행될 수 있도록 하여야 한다. 본 연구는 범람하는 XML 데이터로부터 사용자 요구의 의미까지 파악하여 정확하고 다양한 지식을 추출할 수 있는 방법을 연구하고자 한다. 레코드 구조가 아닌 트리 구조 데이터로부터 의미 추출이 가능한 효율적인 마이닝 기법을 진일보시킴으로써 다양한 사용자 중심의 서비스 제공을 최종 목적으로 한다.

  • PDF

시맨틱 웹에서 다중 혼합필터링을 이용한 개인화된 의상 코디 시스템 (Personalized Apparel Coordi System using Multiple Hybrid-Filtering on Semantic Web)

  • 은채수;송창우;이승근;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.178-182
    • /
    • 2006
  • 인터넷과 웹이 일상생활의 일부가 되면서 온라인상에는 방대한 양의 정보가 쌓이게 되었다. 이러한 흐름 속에서 정보의 양은 급속도로 늘어나는 현상을 보이며, ‘개인화’ 를 통해 수많은 데이터들 사이에서 원하는 정보를 자동으로 찾아내는 기술의 중요성이 부각되고 있다. 이를 ‘추천시스템’ 이라 부르며, 내용기반 필터링과 협력적 필터링 등의 연구가 활발히 이루어지고 있다. 그러나 사용자에게 가장 중요한 영향을 미치는 또래의 선호도, 지역, 시대 등의 복합적인 환경을 반영하는데 아직까지 어려움을 지니고 있다. 따라서 본 논문에서는 기존의 필터링들을 조합하고 좀더 편리하게 정보를 공유하고 학습할 수 있는 시맨틱 웹에서 연관 이웃 마이닝 기법을 통해 개인화된 추천 시스템을 설계한다. 생활에서 흔히 접할 수 있는 의상을 다양한 사용자에게 특화되어 코디해주는 시스템을 웹에서 제공한 결과 불필요한 검색시간이 줄어들고 사용자의 피드백을 통해 점차 만족도가 향상됨을 알 수 있었다.

  • PDF

테크놀로지 인텔리전스 서비스의 시각화 요소 평가 -사용자 평가를 통한 효용성 분석- (Usefulness Evaluation on Elements for Visualization of Technology Intelligence Service)

  • 이진희;김태홍;이미경;김진형;정한민;성원경;김도완
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.533-542
    • /
    • 2011
  • 정보 시각화 요소는 사용자에게 정보를 효율적으로 서비스하기 위한 기술로서, 웹의 진화 과정상에서 그 중요성을 높여가고 있다. 본 연구의 분석 대상인 InSciTe는 대용량의 논문과 특허 데이터를 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스이다. 본 연구에서는 대용량의 논문과 특허 데이터를 대상으로 시맨틱 웹 기술과 텍스트 마이닝 기술을 이용하여 R&D 전략 수립을 지원하는 테크놀로지 인텔리전스 서비스인 InSciTe의 시각화 요소들에 대한 효용성 평가를 수행하고, 각각의 서비스 유형마다 정량적 및 정성적 분석을 통하여 사용자들이 선호하는 디자인과 적용 방법을 제안한다. 효용성 평가 결과, InSciTe 내의 시각화 요소들은 사용자의 인지력을 향상시키기 위하여 사용자 친화적으로 구현되었다는 결론을 얻었다.

SRR을 이용한 분산 도메인 문서 객체 관리 (A Distributed Domain Document Object Management using Semantic Reference Relationship)

  • 이종득
    • 디지털융복합연구
    • /
    • 제10권5호
    • /
    • pp.267-273
    • /
    • 2012
  • 시맨틱 관계성은 포맷되지 않은 많은 문서 객체들을 계층적으로 구조화한다. 그러나 분산 응용도메인에서 관련 데이터를 추출하여 구조화하기란 쉽지 않는 일이다. 이러한 문제를 해결하기 위하여 본 논문에서는 분산된 응용 도메인 객체들을 서비스할 수 있도록 시멘틱 참조 관련성을 이용한 새로운 객체 관리 기법을 제안하였다. 제안된 기법은 응용 도메인 객체들로부터 시멘틱 유사성을 추출하기 위하여 프로파일 구조를 이용하였으며, 추출된 객체들의 시멘틱 관계성을 결정하기 위하여 joint matrix를 이용하였다. 제안된 기법의 성능을 알아보기 위하여 시뮬레이션을 수행하였으며, 시뮬레이션 결과 제안된 기법이 기존의 텍스트 마이닝 기법과 정보추출기법에 비해서 검색 성능이 우수함을 알게 되었다.