• 제목/요약/키워드: Term Clustering

검색결과 178건 처리시간 0.026초

단기조사 교통량을 이용한 AADT 추정연구 (A study on the estimation of AADT by short-term traffic volume survey)

  • 이승재;백남철;권희정
    • 대한교통학회지
    • /
    • 제20권6호
    • /
    • pp.59-68
    • /
    • 2002
  • 도로의 설계 및 운영 등에 필요한 연평균 일 교통량은 365일 조사에 의한 것이 아닌 단기간 조사된 교통량을 사용하는 것으로써 이를 추정하려는 연구는 이전부터 있어왔다. 본 연구에서는 기존 연구를 바탕으로 이 AADT 추정의 방법을 개선시키고자 하였다. 먼저 그룹간의 차이를 뚜렷이 보여줄 수 있는 변수를 찾기 위해 그룹의 수를 변화시켜가며 각 그룹의 시간변 동요인들(전체, 주중, 토요일, 일요일, 주중-토요일, 주중-일요일)의 값을 살펴보아 그 차이가 가장 뚜렷한 변동 요인을 주중-일요일의 시간변동 요인으로 선정하였다. 그 다음 월 변동요인만을 사용하여 상시조사지점을 clustering하였다. 그룹간의 시간변동요인의 차이를 가장 크게 하는 것을 원칙으로 군집분석을 한 결과 10개의 그룹으로 묶을 수 있었다. 선정된 주중-일요일의 시간변동 요인을 사용하여 판별분석과 신경망을 통한 그룹할당을 했다. 신경망의 적중률이 판별분석의 경우보다 훨씬 좋았고, RMSE. U-test 결과도 더 좋았다. 결과를 전체적으로 살펴보면, 본 연구에서 사용한 방법(월 변동요인만을 사용하여 군집분석 한 후, 각 그룹에서 월별로 요일변동요인을 구해 적용한 AADT 추정)의 결과가 이전 연구인 월변동과 요일변동을 이용한 AADT 추정의 결과보다 훨씬 좋았다. 그리고 그룹할당의 변수를 주중-일요일의 시간변동요인으로 달리하였을 때, 신경망의 경우 그룹할당의 적중률이 더 높아지는 것을 볼 수 있었다.

장기간 SPOT/VEGETATION 정규화 식생지수를 이용한 지면 변화 탐지 개선에 관한 연구 (The Study of Land Surface Change Detection Using Long-Term SPOT/VEGETATION)

  • 염종민;한경수;김인환
    • 한국지리정보학회지
    • /
    • 제13권4호
    • /
    • pp.111-124
    • /
    • 2010
  • 지표면의 환경변화를 관측하는 것은 토지사용과 기후변화, 기상연구, 농업, 지표면의 에너지 균형 및 환경시스템에 매우 중요한 연구로 이용되어지고 있다. 최근 위성영상을 이용한 변화탐지는 국지 단위 환경변화 탐지를 위해 그 필요성이 높아지고 있는 실정이며, 특히 잦은 개발과 변화로 주기적인 탐지가 필요한 도심지역의 변화탐지는 국토환경변화 및 지역계획 연구에 대한 효율적인 의사결정 지원이 가능하므로 그 활용성이 매우 높아지고 있다. 이러한 배경으로, 위성 영상을 이용한 원격탐사 자료를 활용한 분석은 비교적 짧은 시간에 광범위한 지역의 영상 정보를 취득할 수 있기 때문에 국토 환경변화 관리 분야에서의 적용 가능성이 높다. 본 연구에서는 인공위성 자료를 활용하여 변화탐지를 수행할 때 공간정보 추출의 정확성을 높이는 기술 개발을 위해 시계열자료의 통계적 분석을 통한 변화탐지기법 개발을 수행하였다. 전처리된 자료를 이용하여 정규화 식생지수를 산출하고 K-mean clustering 무감독 분류를 통해 처리된 데이터를 연구영역의 10년간 자료를 이용한 평균 정규화 식생지수 값과 표준편차 값을 계산하여 각각의 화소별 상대적인 변화량을 측정하여 변화 정도를 탐지하였다. 일반적으로 변화 탐지 수행 시, 태양광 채널을 이용할 경우 기하학적 특성에 의해 발생하는 방향성 효과를 보정하여야 한다. 본 연구에서는 대기 보정과 방향성 보정이 수행된 중 저해상도 정규화 식생지수를 이용하여 객관적인 변화 임계치 값을 결정하였다. 연구결과 반사도 값의 차이를 이용한 변화탐지보다 객관적이고 명확하게 변화지역을 탐지할 수 있었다.

주식시장관리제도와 소셜 미디어의 역할 - 개인 투자자 집단 유형과 토픽 분석 - (The Role of stock market management and social media - Analyzing the types of individual investor and topic -)

  • 김정수;이석준
    • 경영과정보연구
    • /
    • 제34권5호
    • /
    • pp.23-47
    • /
    • 2015
  • 국내 주식시장 내 개인 투자자들은 주식거래를 장기적인 투자방안보다 단기 매매차익 실현 수단으로 인식하고 있어 시장의 투명성과 건전성을 강화하기 위한 주식 시장관리제도의 역할이 중요하다. 특히, 개인 투자자들은 금융정책에 의한 시장조치로 불확실한 상황에 직면하여 투자환경에 따라 동태적 의사결정에 영향을 받게 되므로 투자자 보호를 위한 시장조치의 실효성 여부를 투자자들의 반응과 행동변화를 통해 접근할 필요가 있다. 본 연구는 시장관리 조치(상장적격성 실질심사) 전후로 개인 투자자 집단의 유형 및 반응의 변화추이를 분석하고자 하였다. 분석을 위해, 상장적격성 실질심사 대상기업 중 텍스트 분석이 가능한 9개의 기업을 선정(2009년~2014년)한 후, 국내 주식 관련 소셜 미디어(종목 토론실)로부터 웹 크롤링을 통해 개인들의 메시지를 수집하였다. 사건 발생에 따른 개인 투자자들의 관심사(토픽)와 변화추이는 텍스트 클러스터링과 토픽모델링 방법을 활용하여 개인 투자자 유형을 투자자와 비투자자 집단으로 분류하여 분석하였다. 분석결과, 특정 주식 종목 내 다양한 이해관계자 형태가 존재하며, 실질심사 대상 선정 전후로 비투자자 유형은 감소하고, 투자자는 시장 참여 유형에 따른 비중변화가 나타나는 현상을 발견하였다. 이러한 결과를 토대로 시장 조치에 따른 주식시장 내 제도의 영향을 시간(사건)경과에 따라 개인 투자자들의 반응변화를 통해 파악한 데 본 연구의 의의가 있다.

  • PDF

저고도 원격탐사 영상 분석을 통한 수륙경계선 추출 (Extraction of Waterline Using Low Altitude Remote Sensing)

  • 정다운;이종석;백지연;조영헌
    • 대한원격탐사학회지
    • /
    • 제36권2_2호
    • /
    • pp.337-349
    • /
    • 2020
  • 본 연구에서는 저고도 원격탐사 기구인 Helikite를 이용하여 연안지역의 영상을 획득하였다. 그리고 획득된 영상에서 4 종류의 영역 분할 알고리즘을 이용하여 육지와 수괴의 영역을 분할해 낸 후 경계 검출법을 이용해 수륙경계선을 추출하였다. 실측데이터의 부재로 정량적인 비교는 불가능했으나, 수괴와 육지의 구분이 비교적 명확한 적외선(Infrared band) 영역의 영상을 기준으로 각 알고리즘들에 의해 추출된 수륙경계선을 비교하였다. 그 결과, 영상에서 수괴와 육지의 구분이 모호한 부분에서 각각의 알고리즘의 결과가 크게 차이가 나는 것을 발견할 수 있었다. 이는 각 알고리즘이 영역을 구분하는데 사용되는 영상의 수치값(Digital number)의 임계치를 선정하는 과정에서 생긴 차이라고 판단된다. 이와 같이 다양한 알고리즘을 통한 수륙경계선의 추출은 향후 연속 모니터링이 가능한 자동 관측시스템과 함께 활용하여 고정지역에서 얻은 수년의 장기간의 데이터를 통해 연안 지역 형태의 급격한 변화를 설명하는데 도움을 줄 것으로 기대된다.

주식가격변화의 장기기억속성 존재 및 영향요인에 대한 실증연구 (An Empirical Study for the Existence of Long-term Memory Properties and Influential Factors in Financial Time Series)

  • 엄철준;오갑진;김승환;김태혁
    • 재무관리연구
    • /
    • 제24권3호
    • /
    • pp.63-89
    • /
    • 2007
  • 본 연구는 금융시계열자료의 특징적 속성을 관찰하고자 하는 연구시도의 일환으로, 실제자료 뿐만 아니라 이론자료를 이용하여 장기기억속성의 존재와 장기기억속성의 정도에 영향을 미칠 수 있는 가능한 요인을 수익률 및 변동성차원에서 체계적으로 검증하는 것이 목적이다. 검증결과의 견고함을 위하여, 이론자료 뿐만 아니라 24개국 주식시장의 지수자료, KOSPI 시장지수를 구성하는 430개 개별주식자료를 함께 사용하였다. 관찰된 검증결과를 요약 정리하면 다음과 같다. 첫째, 이론자료와 실제자료를 이용하여 장기기억속성의 존재여부를 체계적으로 검증한 결과에 의하면, 분석자료에 관계없이 수익률차원에서는 장기기억속성의 존재를 확인할 수 있는 긍정적인 증거를 발견하지 못하였으나, 변동성차원에서는 강한 장기기억속성의 증거를 지지하는 증거를 발견할 수 있었다. 둘째, 관찰된 변동성의 장기기억속성 정도에 영향을 미칠 수 있는 가능한 요인으로는, 분석자료에 관계없이, 금융시계열자료에서 일반적으로 관찰되는 변동성 군집효과의 속성이 가능한 것으로 확인되었다.

  • PDF

온라인 게임 로그 데이터 클러스터링 기반 일일 단위 게임봇 판별 (Detecting Daily-Driven Game-Bot Based on Online Game Play Log Clustering)

  • 김주환;최진영
    • 정보보호학회논문지
    • /
    • 제31권6호
    • /
    • pp.1097-1104
    • /
    • 2021
  • 온라인 게임 봇은 이미 수 많은 방식을 통해 사람들에게 알려져 왔으며, 사용자의 게임 흥미 저하, 게임 내 경제 순환 파괴, 게임 컨텐츠 및 수명 단축 등 많은 문제점을 야기한다. 정상적이지 않은 게임 봇 운영을 방치하는 것은 장기적으로 게임 제작사와 게임 플레이어에게 모두 악영향을 미치게 되므로 이에 대한 탐지 및 제재는 필수가 되었다. 하지만 제재 단계에서 생기는 오인 제재의 딜레마를 피하기 쉽지 않다. 게임사 측에서 유저를 제재하기 위해서는 객관적인 분석 지표인 로그를 가지고 제재 여부를 판단해야 하며, 로그에서 추출한 정보를 근거로 확보해야 한다. 본 연구에서는 탐지 대상 기간의 로그에 대하여 이를 일일 단위로 나누어서 게임봇 유저 판별을 수행할 것이다. 일일 단위 탐지를 위해 탐지 기간을 하루 단위로 나누어 해당 일자에 대한 게임봇 여부를 우선 판별하고, 이후 최종 결과를 판단하였다. 제안한 방법론을 통해 일반 유저 스타일과 게임봇 유저 스타일이 섞여 있는 경우를 쉽게 탐지해 낼 수 있을 것이다. 본 논문에서 제안한 방법론으로 테스트한 결과, 분류 정확도를 확인할 수 있는 지표 중 하나인 F1-score가 0.898에서 0.945로 향상되었다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

시간적 군집특성을 고려한 강우모의모형의 선정 (A Selection of the Point Rainfall Process Model Considered on Temporal Clustering Characteristics)

  • 김기욱;유철상
    • 한국수자원학회논문집
    • /
    • 제41권7호
    • /
    • pp.747-759
    • /
    • 2008
  • 본 연구에서는 관측강우의 통계특성 및 발생특성을 가장 적절하게 재현해 주는 강우모형을 선정하고자 하였다. 강우모형으로 Poisson과정에 근거한 점과정모형인 RPPM, NS-RPPM, modified NS-RPPM을 고려하여 모의자료에 대한 통계분석을 수행하였다. 그 결과, NS-RPPM과 modified NS-RPPM을 이용하여 모의된 자료가 여러 집성시간의 통계치를 적절하게 재현하였다. 또한 modified NS-RPPM을 이용하여 모의된 자료가 관측자료와 가장 유사한 발생특성을 가지는 것을 알 수 있었다. 특히, 홍수, 산사태 등 자연재해의 발생에 큰 영향을 주는 큰 강도를 가지는 강우를 관측치와 가장 유사하게 재현하였다. 모의된 강우사상의 총 강우량, 강우기간, 강우사상 간의 간격을 관측강우와 비교해본 결과 또한 modified NS-RPPM이 가장 좋은 결과를 보였다. 본 연구의 결과를 종합해 볼 때, 강우의 장기 모의를 위해 modified NS-RPPM을 이용하는 것이 가장 적절할 것으로 판단된다.

Bayesian HMM 기반의 건강 상태 분류 및 예측 (Health State Clustering and Prediction Based on Bayesian HMM)

  • 신봉기
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1026-1033
    • /
    • 2017
  • 본 논문은 계층적 디리슐레 과정(HDP)과 은닉 마르코프 모형(HMM)이 결합된 베이스 통계학적 방법과 HMM의 상태 지속 정보를 이용한 건강 상태 예측 방법을 제안한다. HDP-HMM은 베이스 방법의 HMM 확장 모형으로서 건강의 동적 특성을 고려하여 불확실하고 가늠하기조차도 어려운 건강 상태의 수를 추정할 수 있게 해준다. 모의 데이터와 실제 건건 검진 데이터를 이용한 시험을 통하여 흥미 있는 행동 특성을 볼 수 있었으며 최대 5년까지로 제한한 미래 예측도 충분한 가능함을 확인하였다. 미래는 불확실하며 예측 문제는 본질적으로 어렵다. 그러나 본 연구의 실험 결과로 동적인 문맥 하에서 다중 후보 가설을 제시함으로서 실용 가능한 건강상태의 장기 예측이 가능하다는 것을 읽을 수 있었다.

자동분류기반 성격 유형별 도서추천시스템 개발을 위한 실험적 연구 (A Experimental Study on the Development of a Book Recommendation System Using Automatic Classification, Based on the Personality Type)

  • 조현양
    • 한국도서관정보학회지
    • /
    • 제48권2호
    • /
    • pp.215-236
    • /
    • 2017
  • 이 연구의 목적은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 어린이 청소년을 위한 추천도서의 책소개 정보를 활용하여 개인별 성격유형에 적합한 도서를 합리적으로 추천할 수 있는 서평 자동분류시스템을 개발하는 것이다. 연구에서 사용한 데이터는 국립어린이청소년도서관에서 제공하는 501권의 유아 및 아동도서를 대상으로 하였다. 실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나 논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 있다.