• 제목/요약/키워드: Implicit Extraction

검색결과 34건 처리시간 0.02초

공간 데이타 마이닝을 위한 개방형 객체 관리 시스템의 설계 및 구현 (Design and Implementation of an Open Object Management System for Spatial Data Mining)

  • 윤재관;오병우;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제1권1호
    • /
    • pp.5-18
    • /
    • 1999
  • 최근 들어 공간 데이타베이스 시스템에 저장되어 있는 공간 데이타로부터 새로운 지식을 자동으로 추출해야 할 필요성이 증가함에 따라 공간 데이타베이스 시스템에 명시적으로 저장되어 있지 않은 암시적인 지식이나 공간 데이타간의 연관 관계, 그리고 다른 새로운 지식을 추출해 내는 학문인 공간 데이타 마이닝에 대한 연구가 증가하고 있다. 이러한 유용한 지식을 공간 데이타로부터 추출하기 위해서는 공간 데이타를 효율적으로 저장하고, 빠른 인덱스와 검색 기능을 제공하고, 또한 분산환경을 지원할 수 있는 객체 관리 시스템이 필요하다. 본 논문에서는 공간 데이타 마이닝 시스템에서 사용되는 공간, 비공간, 지식 데이타를 효율적으로 관리할 수 있는 개방형 객체 관리 시스템을 설계 및 구현하였다. 개방형 객체 관리 시스템을 개발하기 위하여 본 논문에서는 현재 많은 분야에서 사용되고 있는 Open OODB에 공간 데이타 타입의 지원, 동적인 클래스의 생성 객체-지향 개념의 상속성 지원, 공간 인덱스의 지윈, 공간 연산 함수 제공 등의 기능을 추가하여 확장하였다. 또한, 본 논문에서는 다른 공간 데이타베이스 시스템이나 공간 데이타 마이닝 시스템과의 상호운영성을 증가시키기 위하여 데이타 모델링을 위해 ODMG 2.0, 데이타 모델링과 공간 데이타의 교환을 위해 SDTS(Spatial Data Transfer Standard), 그리고 클라이언트와 서버간의 효율적 연동을 위해 OpenGIS Simple Features Specification for CORBA를 수용하였다.

  • PDF

인터넷 토론 사이트의 논쟁댓글 및 논쟁관계 시각화 (Extracting and Visualizing Dispute comments and Relations on Internet Forum Site)

  • 이윤정;정인준;우균
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.40-51
    • /
    • 2012
  • 최근에는 인터넷 토론 사이트에서 댓글을 이용해 다른 사람들과 토론이나 논쟁하는 경우를 흔히 볼 수 있다. 논쟁을 통해 게시물의 내용과는 다른 새로운 의견이 나타날 수도 있으므로 논쟁댓글을 파악하고 식별하는 것은 중요한 문제라고 할 수 있다. 본 논문에서는 국내의 인터넷 토론 사이트인 SkepticalLeft와 아고라에서 수집한 댓글을 통해 인터넷 토론 게시판에서 논쟁댓글의 특성을 분석하였다. 그리고 이를 바탕으로 댓글 목록의 논쟁구간과 논쟁관계를 검출하고 이를 시각화하는 방법을 제안한다. 제안 방법의 성능을 보이기 위해 논쟁댓글과 논쟁 쌍을 검출하고 정확도와 재현율 그리고 F-measure를 측정하였다. 논쟁댓글검출 성능은 F-measure가 0.84(SkepticalLeft)와 0.83(아고라)으로 측정되었고, 논쟁 쌍 검출은 각각 0.75(SketpcialLeft)와 0.82(아고라)로 측정되었다. 제안 방법은 댓글 작성자의 순서관계만을 이용하므로 사용언어나 철자법에 제약받지 않는다. 또한 시각화된 뷰를 통해 게시판 이용자들이 댓글에 내포된 논쟁구조를 파악하는데 도움을 줄 것이다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.