• 제목/요약/키워드: 데이터 확장 기법

검색결과 827건 처리시간 0.023초

빅데이터 분석기법을 활용한 아파트 가격 관련 뉴스 기사의 극성 분석 (A Study on the Polarity of Apartment Price News Using Big Data Analysis Method)

  • 조상연;홍은표
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.47-54
    • /
    • 2019
  • 본 연구는 빅데이터 분석 방법인 오피니언 마이닝을 사용하여 아파트 가격 관련 뉴스 기사의 극성을 확인하는 연구로 자료는 2012년, 2018년 2년간 네이버에 게시된 인터넷 뉴스 기사를 사용하였다. 감성분석 모형을 모델링하고 주제 지향형 감성사전 구축 방법을 제안하였다. 제안한 감성분석 모형을 통해 분석한 결과, 아파트 가격이 상승하는 시기에는 사회적 이슈 선정에 있어서 언론사의 성향에 따라 차이가 있는 것을 확인하였고 정부와 동일한 성향의 언론사에서 긍정 기사가 많은 것을 확인하였다. 부동산 분야에서 사용할 수 있는 감성분석 모형을 제시하고 부동산 관련 비정형 데이터의 극성을 분석하였다는 것에 의의가 있다. 향후 다양한 분야에 접목하기 위해서는 주제별 감성사전을 구축해야 하며 다양한 비정형 데이터를 수집하고 수집 기간을 확장하는 것이 필요하다.

대용량 공간데이터베이스를 위한 확장된 밀도-격자 기반의 공간 클러스터링 알고리즘 (An Enhanced Density and Grid based Spatial Clustering Algorithm for Large Spatial Database)

  • ;김호석;;김경배;배해영
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.633-640
    • /
    • 2006
  • 공간 데이터마이닝 분야에서 객체간의 거리, 연결성, 상대적인 밀도를 기반으로 비슷한 객체들을 하나의 그룹으로 묶는 공간 클러스터링은 중요한 컴포넌트이다. 공간 클러스터링 알고리즘은 밀도 기반 클러스터링과 격자 기반 클러스터링 알고리즘 등으로 나눌 수 있다. 밀도 기반 클러스터링 알고리즘은 다양한 모양과 크기의 클러스터를 구분할 수 있으며, 잡음을 제거할 수 있는 장점을 가지고 있는 반면에, 격자 기반 클러스터링 처리속도가 빠르다는 장점을 가지고 있다. 하지만, 대량의 공간 데이터 집합을 클러스터링 하는 것은 데이터 처리 비용이 급격하게 증가하기 때문에 클러스터링 처리 결과에 큰 영향을 준다. 본 논문은 대용량의 공간 데이터베이스에서 공간 객체간의 고밀도 영역을 식별하여 잡음을 제거하기 위한 수치데이터 값과 기본 격자간격 개수를 정의하는 확장된 밀도-격자 기반 클러스터링 알고리즘을 제안한다. 제안 알고리즘은 고밀도 영역 식별을 위하여 threashold(DT)를 정의하였으며, 격자 및 밀도 기반 기법의 장점을 이용하여 임의의 객체 클러스터링을 식별할 수 있는 성능을 향상시켰다. 성능평가에서 기존의 클러스터링 알고리즘과의 다양한 비교 평가 실험을 통하여, 제안 알고리즘이 빠르고 정확한 데이터 클러스터링 결과를 나타냄을 보인다.

클릭스트림 분석을 위한 웹 서버 시스템의 설계 및 구현 (Design and Implementation of Web Server for Analyzing Clickstream)

  • 강미정;정옥란;조동섭
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.945-954
    • /
    • 2002
  • 인터넷을 통한 비즈니스에 수익 모델에 대한 관심이 높아지면서 방문자별로 개인화된 서비스를 제공하려는 노력이 커지고 있다. 개인화(Personalization)란 고객 한 명을 대상으로 하여 그 고객 한 사람을 위한 정보나 제품을 제공해주는 작업을 말한다. 개인화 서비스를 위해서 전 처리과정인 사용자 프로파일 생성과정이 필요하며, 적극적인 개인화 서비스를 제공하기 위해서는 충분한 고객 데이터가 필요하다. 본 논문에서는 웹사이트 상에서 사용자 행위 패턴을 파악할 수 있는 클릭스트림 정보를 모듈화 하였으며, 이를 이용하여 확장된 웹 로그 시스템을 구현하였다. 클릭스트림 정보를 웹 로그정보에 포함시켜 사용자의 행위 패턴을 파악할 수 있도록 웹 서버 시스템을 설계하고 구현하였다. 그리고 이 웹 서버는 웹사이트로부터 얻은 클릭스트림 정보를 분류하고 저장하여 관리자가 쉽게 분석할 수 있다. 이때 데이터베이스 저장 기술로 OLE DB Provider상에서 수행되는 ADO(ActiveX Data Object)기술을 사용함으로써 확장된 웹 로그 처리 시스템을 설계하였다. 확장된 웹 로그 DB를 패턴분석, 군집분석 등의 마이닝(Mining) 기법을 통하여 맞춤서비스에 대한 사용자 프로파일을 구축할 수 있다.

워게임 지원용 멀티미디어 전문가시스템 구축 (A Construction of The Multimedia Expert System For Wargame Su, pp.rt)

  • 김화수;조문희;박홍규;박경원
    • 지능정보연구
    • /
    • 제3권1호
    • /
    • pp.143-160
    • /
    • 1997
  • 현재 우리 군에서는 첨단과학무기를 이용한 전투력을 신속히 집중, 전환시키고 효과적으로 통합 운용해야하는 각급 제대의 지휘관 및 참모의 지휘통제능력 향상을 위하여 첨단 컴퓨터장비를 이용하여 시뮬레이션 기법을 통한 워게임 모델을 개발하여 이를 이용한 훈련을 실시하고 있다. 이 워게임 모델중 지상전투의 가장 기본이 되는 근접전투 시뮬레이션은 미국에서 개발도입된 "COBRA" 시스템을 이용하고 있으나 한국실정에 맞는 시스템으로 확장 및 유지보수가 어렵고, 상위시스템의 서브시스템으로만 운영되고있어 자체 교육훈련 및 전투분석을 위한 단독시스템으로 운영이 어려운 실정이다. 본 논문에서는 이러한 문제점을 극복하고, 방대한 양의 지식을 효율적이고 효과적으로 표현할 수 있으며 시스템의 확장 및 유지보수가 용이하고 우리실정에 적합한 전투 훈련을 실시하도록 지원하는 워게임(근접전투) 지원용 멀티미디어 전문가시스템을 개발하였다. 본 논문에서 개발한 전문가시스템은 쌍방이 부대들의 근접전투를 실시할 때 실전에서 나타날 수 있는 가능한 모든 상황의 데이터를 이용하여 전투상황을 분석하며, 기존의 획일적이고 단순한 형태로 결과를 판정하던 것을 전투원의 사기, 체력, 전투한계 등 심리적 요소까지 고려함으로써 새로이 변화되는 전쟁양상에 쉽게 적응할 수 있는 확장성 및 유지보수가 용이하며 시스템 단독으로 운영하여 반복적으로 전투를 분석하고 교육훈련을 실시하도록 함으로써 실전적이고 실질적인 근접전투 워게임지원이 가능하다. 본 논문에서는 전문가 시스템을 개발함에 있어서 지식베이스 모듈, 추론엔진 모듈 및 설명 모듈은 전문가 시스템 개발도구인 Smart Elements를 이용하여 구축하였으며, 사용자 인터페이스 모듈은 멀티미디어 저적도구인 툴북 3.0을 이용하였으며, 마지막으로 전체적인 모듈은 API를 이용 통합하여 하나의 응용소프트웨어를 생성하였다.

  • PDF

효율적인 여과를 위한 그리드 필터를 갖는 R-Tree 의 확장 (Extended R-Tree with Grid Filter for Efficient Filtering)

  • 김재흥
    • Spatial Information Research
    • /
    • 제8권1호
    • /
    • pp.155-170
    • /
    • 2000
  • 공간 인덱스인 R-Tree를 이용하여 조건에 만족하는 공간 객체를 찾기 위해서 MBR의 비교하는 여과 과정만으로는 부정확한 경우가 있으며 그러한 경우에는 해당 공간 객체를 읽어 조건과 직접 비교하는 과정, 즉 정제과정이 필요하게 된다. 정제과정을 수행하기 위해서는 디스크 입출력이 요구되고 고비용 공간 연상을 수행해야 하므로 이는 검색 비용이 커지는 요인이 된다. 그래서, 여과 과정후의 후보 객체수를 최소화하기 위한 2단계 여과 기법들이 연구되었지만, 여과 효율이 떨어지거나, 추가로 데이터를 유지해야하거나, 원래 객체의 정보를 잃어버려 객체들을 재구성해야하는 문제점이 발생한다. 따라서, 본 논문에서는 이차 여과 과정에서 공간 객체의 존재여부를 저장하는 진위 테이블인 그리드 필터를 이용하여 간단한 논리 연산만으로 공간객체를 검색할 수 있도록 하는 확장된 R-Tree를 제안한다. 그러므로, 그리드 필터를 가지는 확장된 R-Tree 는 효율적인 이차 여과과정을 수행하기 때문에 여과를 위한 연산비용이 작고, 근사의 질이 높아 여과 효율이 우수하다.

  • PDF

확장형 디스플레이를 위한 분산 렌더링 시스템의 네트워크 대역폭 감소 기법 (A New Network Bandwidth Reduction Method of Distributed Rendering System for Scalable Display)

  • 박우찬;이원종;김형래;김정우;한탁돈;양성봉
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권10호
    • /
    • pp.582-588
    • /
    • 2002
  • 확장형 디스플레이(Scalable Display)는 큰 화면과 높은 화질의 영상을 생성하여 사용자들에게 보다 현실적인 느낌을 주고 이에 몰입할 수 있는 환경을 제공하는 시스템이다. 최근 들어서 이러한 확장형 디스플레이는 자체 그래픽 가속기와 메모리, CPU, 저장장치를 갖는 개별 PC들을 네트워크로 연결한 클러스터 환경에서 구축되고 있다. 하지만 클러스터 환경에서 분산 렌더링을 수행하면 제한된 대역폭 때문에 네트워크 병목점을 갖게 된다. 본 논문은 이러한 네트워크 트래픽을 줄이는 새로운 알고리즘을 제안하고, 이를 기존의 분산 렌더링 시스템에 적용하여 구현한 내용을 소개한다. 제안하는 기하 추적(geometry tracking) 알고리즘은 전송되는 데이터들을 색인화하여 중복된 기하정보 전송을 방지하여 네트워크 부하를 줄이는 방법으로, 실험을 통해서 최대 42%까지 네트워크 트래픽을 감소시킬 수 있었다.

고성능 데이터 발간/구독 미들웨어의 이벤트, 버퍼 처리 기술 및 성능 분석 (Implementation and Performance Analysis of Event Processing and Buffer Managing Techniques for DDS)

  • 윤군재;최 훈
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.449-459
    • /
    • 2017
  • DDS(Data Distribution Service)는 유연성, 확장성, 실시간 통신 환경을 지원하는 통신 미들웨어이다. 본 논문에서는 DDS 미들웨어의 성능을 향상시키기 위한 방법들을 제안한다. DDS 미들웨어 내부 동작과 관련된 세부 이벤트를 정의하고, 이벤트 구동형 구조에 적용하기 위해 하나의 DDS 메시지를 의미 있는 서브메시지 단위로 분해함으로써 처리 복잡도를 낮출 수 있다. 제안하는 히스토리캐시 관리 기법은 DDS의 특성 상 상태접근과 임의접근이 빈번하게 발생한다는 사실을 이용한다. 제안한 방법들을 본 연구팀이 개발한 EchoDDS에 적용하여 성능을 향상시켰다.

온라인 게임 환경에서 사용자 행위 정보에 기반한 봇 프로그램 탐지 기법 연구 (The Study of Bot Program Detection based on User Behavior in Online Game Environment)

  • 윤태복
    • 한국산학기술학회논문지
    • /
    • 제13권9호
    • /
    • pp.4200-4206
    • /
    • 2012
  • 최근 온라인 게임 산업이 급속도로 확장되었다. 하지만, 온라인 게임에서 봇 프로그램으로 인하여 다양한 게임 서비스 피해사례가 발생하고 있다. 특히, 게임 머니 및 아이템의 비정상적인 수집은 게임이 가지는 본연의 재미를 잃어버리게 하고, 궁극적으로 게임의 생명주기에 결정적으로 악영향을 미치게 된다. 본 논문은 게임 로그 데이터의 플레이 패턴을 이용한 봇 탐지 방법을 제안한다. 인간 플레이어로부터 봇과 차별화된 모델을 만들기 위해 인간 플레이어의 행동뿐만 아니라 봇 데이터도 분석에 활용한다. 실험에서는 서비스 중인 온라인 게임을 이용하여 사용자와 봇의 모델을 생성하고 유효한 결과를 확인하였다.

핫스팟지역에서 협동방식 블루투스기지국의 제안과 성능분석 (A Proposal of Collaborating Bluetooth Basestation in Hot Spot Area with Its Performance Analysis)

  • 김동원;조동욱;류원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1369-1372
    • /
    • 2003
  • 가까운 장래에 싼 가격의 블루투스가 여러 가지 이동, 휴대 장치에 내장되어 다양한 응용서비스를 제공할 것이다. 본 논문에서는 공항이나 쇼핑몰 등 사람들이 많이 몰리는 공공장소와 같은 핫스팟(hot spot) 지역에서 블루투스 기지국을 통한 음성서비스 제공을 위하여 다수의 기지국을 유서 LAN으로 협동시켜 각각 기지국별로 따로 제공되던 음성 채널들을 집합화(aggregation) 함으로써 보다 많은 음성 서비스 채널들을 동시에 수용할 수 있는 방법을 제시하고 성능을 분석하였다. 단독으로 동작하는 기지국은 ACL채널을 사용하는 경우 7개까지의 채널 수용이 가능하므로 이상적인 경우에서도 오버랩 영역의 기지국의 개수가 n이면 7n 만큼 채널의 증가가 가능한 반면 협동으로 동작하면 블록킹 율도 개선되면서 집합화된 채널들을 보간(interpolation) 기법을 통한 통계적 사용으로 음성 패킷의 허용 손실 범위 내에서 음성채널의 수를 약 14n 정도까지 확장할 수 있다. 또한 음성전송과 데이터 전송이 혼합 서비스 될 때 수용하는 음성 채널의 수에 따른 데이터 전송지연시간 특성을 분석하였다.

  • PDF

전자문서의 XML 문서로의 변환 및 저장 시스템 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.106-108
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 전자 문서에서 사용자가 제공한 구조적인 규칙과 XML 기반 전자 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)전자문서의 원시 XML 문서로의 변환 방법 2)XML 기반 구조적인 규칙과 작성된 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 전자문서의 변환을 위해서 독립적으로 동작하는OCX 기반의 전자문서 변환 데몬(Daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 데이터 포멧으로 생성하거나 DB에 저장할 수 있다. 본 시스템은 전자 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리시스템과 성과정보시스템에 적용하여 그 성과를 입증하였다.

  • PDF