• 제목/요약/키워드: 클러스터 평가 지표

검색결과 22건 처리시간 0.023초

문서 클러스터를 위한 워드넷기반의 대표 레이블 선정 방법 (Representative Labels Selection Technique for Document Cluster using WordNet)

  • 김태훈;손미애
    • 인터넷정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.61-73
    • /
    • 2017
  • 본 연구에서는 문서 클러스터링 결과 도출된 개별 클러스터가 함축하고 있는 의미를 파악하는 데 필요한 어휘들의 정보량을 활용한 문서 클러스터 레이블링(Documents Cluster Labeling) 방법을 제안하였다. 이를 위해, 클러스터에 포함된 어휘들이 해당 클러스터에서 얼마나 중요한 비중을 차지하고 있는지 파악하기 위하여 각 어휘의 출현 빈도와 정보량을 이용한 어휘의 가중치를 계산한 후, 워드넷을 이용하여 클러스터에 포함된 어휘들의 최근접 공통 상위어를 후보 레이블로 식별하였다. 이상의 과정을 거쳐 식별된 후보 레이블의 정보량과 클러스터내에서의 중요도 가중치를 활용해, 해당 클러스터의 의미와 특징을 포괄적으로 표현할 수 있는 대표 레이블을 결정하였다. 본 연구의 우수성을 입증하기 위해 다음과 같은 실험을 수행하였다. 실험은 본 연구에서 제안한 방법에 따라 선정된 레이블과 후보 레이블을 워드넷에 프로젝션한 후, 워드넷상에서 이들 레이블의 위치(깊이)를 확인하였다. 또한 선정된 후보 레이블을 상위어로 갖고 있는 클러스터 내 어휘의 수를 도출하여, 휴리스틱 방법에 따라 선정된 레이블을 전문가가 찾은 대표 레이블과의 비교를 수행하였다. 평가지표로 후보 레이블의 적합성($Suitability_{cl}$)과 대표 레이블의 적절성($Appropriacy_{rl}$)을 활용하였다. 실험 결과, 본 연구에서 제안한 방법을 적용해 문서 클러스터 레이블링을 수행할 경우, 후보 레이블의 적합성의 경우 기존의 방법보다 약간 감소하지만 계산량이 기존 방법의 약 20% 정도로 감소하였으며, 대표 레이블의 적절성의 경우 기존의 방법보다 우수한 결과를 도출하는 것을 확인하였다.

소셜네트워크 분석과 클러스터 분석 방법을 활용한 스타트업 회사의 트위터 팔로워 네트워크에 대한 탐색적 연구 (Exploring Twitter Follower-Networks of Startup Companies Employing Social Network Analysis and Cluster Analysis)

  • 류승희
    • 벤처창업연구
    • /
    • 제14권4호
    • /
    • pp.199-209
    • /
    • 2019
  • 기업의 소셜미디어 활용이 빠른 속도로 증가함에 따라 성공적인 소셜미디어 활용전략의 중요성이 커지고 있다. 이러한 중요성은 새로이 시장에 진입하여 신속하게 시장에서의 인지도를 확대하고 미래고객을 확보해야 할 필요성이 큰 스타트업 회사에게 더욱 절실하다고 할 수 있다. 본 연구의 목적은 스타트업 회사의 소셜미디어 활용의 특징을 보여주는 지표를 탐색적으로 조사, 분석하는데 두고 있다. 주요 지표는 전반적인 소셜미디어 관련 활동을 보여주는 지표와 소셜미디어 서비스을 통해 형성된 소셜네트워크 구조의 특성과 관련 지표를 포함한다. 스타트업 회사의 이러한 지표를 좀 더 객관적으로 평가하기 위하여 잘 갖춰진 기존 회사의 지표와 비교, 분석 하였다. 본 연구를 위해 여러 소셜미디어 서비스 중 트위터를 선정하고, 트위터 REST API를 통해 측정지표와 관련된 데이터와 팔로워네트워크(follower-network)에 대한 데이터를 수집하였다. 주요 분석방법으로 각 회사의 소셜네트워크 구조의 특성을 분석하기 위해 소셜네트워크분석기법이 활용되었으며, 클러스터분석 기법을 이용하여 스타트업 회사와 기존 회사의 측정지표를 비교, 분석하였다. 분석결과에 따르면 대부분의 측정지표에서 스타트업 회사와 기존 회사 간에 유의미한 차이를 보여주고 있다. 특징적인 분석결과의 하나로 스타트업 회사들이 상대적으로 많은 수의 인플루언서 (influencer)를 팔로워네트워크에 가지고 있다는 점이다. 또한, 스타트업 회사를 포함하는 클러스터의 네트워크 모듈성(modularity)과 추이성(transitivity)이 기존 회사에 비해 상대적으로 높은 것으로 나타났다. 이러한 결과는 스타트업 회사의 소셜네트워크 안에 기존 회사에 비해 내부결속력이 높은 상대적으로 많은 수의 커뮤니티가 존재한다는 점을 시사한다고 할 수 있다. 스타트업 회사의 이러한 특징은 잠재고객 및 비즈니스 파트너와의 효과적인 정보교환을 촉진할 수 있으며, 따라서 향후 일반적인 스타트업 회사의 소셜미디어 노력은 어떻게 인플루언서를 확보할 것인지, 또한 어떻게 내부결속력이 높은 긴밀한 네트워크를 구축할 것인지에 초점을 두어야 할 필요성이 있음을 시사하고 있다.

Development of an unsupervised learning-based ESG evaluation process for Korean public institutions without label annotation

  • Do Hyeok Yoo;SuJin Bak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.155-164
    • /
    • 2024
  • 본 연구는 ESG 등급이 제공되지 않는 국내 공공기관의 ESG 등급을 추정하는 비지도 학습 기반 군집모형을 제안한다. 이를 위해, 스펙트럼 군집과 k-means 군집에서 최적의 클러스터 수를 비교했고, 그 결과의 신뢰성을 보장하기 위해 성능지표인 Davies-Bouldin Index (DBI)를 계산했다. 결과적으로, 스펙트럼 군집과 k-means 군집에서 각각 0.734 및 1.715의 DBI 값을 산출했는데, 이는 값이 작을수록 우수한 성능을 의미하므로 스펙트럼 군집의 우수성을 확인하였다. 게다가, T-검정 및 ANOVA를 이용하여 ESG 비재무 데이터 간 통계적으로 유의미한 차이를 밝혀내고, 상관계수를 이용하여 ESG 항목 간 상관관계를 확인했다. 본 연구는 이러한 결과를 바탕으로 기존 ESG 등급 없이 공공기관별 ESG 성과 순위를 추정할 가능성을 제시한다. 이는 최적의 클러스터 수를 계산한 다음, 각 클러스터 내 ESG 데이터의 평균 총합을 결정함으로써 달성된다. 따라서, 제안된 모델은 다양한 국내 공공기관의 ESG 등급을 평가하는 근거로 활용될 수 있고, 국내 지속가능경영 실천과 성과관리에 유용할 것으로 기대된다.

생태계서비스 번들을 이용한 경기도 도시의 유형화 (Categorization of Citiesin Gyeonggi-do Using Ecosystem Service Bundles)

  • 김일권;김성훈;이주은;권혁수
    • 환경영향평가
    • /
    • 제28권3호
    • /
    • pp.201-214
    • /
    • 2019
  • 생태계서비스의 개념은 지역의 생태자원을 관리하고 효율적으로 사용하는데 중요하다. 지역 생태계가 동시에 제공하는 다양한 생태계서비스는 생태계서비스 번들로 표현된다. 생태계서비스 번들은 지역 생태계서비스 특성을 파악하고, 유사한 생태계서비스를 제공하는 지역들을 그룹화하여 지역 생태계서비스 관리정책을 용이하게 한다. 본 연구는 경기도 도시들을 대상으로 11개 생태계서비스 항목들을 모형과 통계지표를 이용하여 평가하고, 시군별 생태계서비스 번들을 제작하였다. 또한 생태계서비스 평가결과에 대한 주성분분석과 클러스터분석을 수행하여 경기도 시군들을 유형화하였다. 연구결과 경기도 도시들의 생태계서비스는 조절, 문화, 공급서비스 유형들로 분류되며 각각의 유형들은 지역특성에 따라서 도시형, 도시산림형, 농촌형, 산림형으로 구분되었다. 각각의 유형들은 지역의 인문사회 및 자연환경 특성을 반영하는 토지이용과 연관되어 나타났다. 본 연구결과는 지역 생태계서비스 특성을 파악하는데 중요한 정보를 제공하여 지역 생태계서비스 관리정책을 수립하는데 유용하게 사용될 수 있다.

보행 관련 뇌파의 신호원 추정을 위한 비통합 데이터 분석 방법 (A non-merging data analysis method to localize brain source for gait-related EEG)

  • 송민수;정지욱;지인혁;추준욱
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.679-688
    • /
    • 2021
  • 보행능력은 의학적으로 다양한 뇌신경계 질환에서 사용되는 평가 지표이다. 보행에 관련된 뇌 활성화를 측정하고 분석하는 방법으로 뇌파 데이터에 대해 독립성분을 추출한 뒤 신호원 추정 및 시간-주파수 분석이 주로 사용된다. 기존의 트레드밀 기반 보행 뇌파 분석은 분할 측정한 뒤, 데이터를 병합하여 신호 전처리, 독립성분분석 및 신호원 추정을 수행하고 피험자 간 군집화를 통하여 대표 성분 클러스터들을 추출한다. 본 연구에서는 보행 뇌파에 대하여 데이터 통합 없이 각각의 분할 측정된 데이터에 대하여 개별적으로 신호 전처리, 독립성분분석 및 신호원 추정을 수행하고 모든 피험자로부터 추정된 독립성분에 대하여 피험자 간 군집화를 수행하는 새로운 방법을 제안한다. 데이터 통합이 독립성분 군집화 및 시간-주파수 분석에 미치는 영향을 조사하기 위해 기존의 통합 데이터에 기반한 두 가지 분석 방법과 본 연구에서 제안하는 데이터 통합이 없는 분석 방법을 비교하였다. 그 결과, 통합 데이터 방법들에서는 각각 2개씩의 성분 클러스터를 도출하였으나 제안하는 방법을 통해 4개의 성분 클러스터를 도출, 적은 피험자 수에도 불구하고 세분화된 보행 뇌 신호 성분 클러스터를 도출할 수 있었음을 확인하였다.

저심도 지중 수소저장시설에서의 수소가스 누출에 따른 불포화 지반의 수리-역학적 거동 예측 연구 (Prediction of Hydrodynamic Behavior of Unsaturated Ground Due to Hydrogen Gas Leakage in a Low-depth Underground Hydrogen Storage Facility)

  • 고규현;전준서;김영석;김희원;최현준
    • 한국지반공학회논문집
    • /
    • 제38권11호
    • /
    • pp.107-118
    • /
    • 2022
  • 최근 증가하는 수소에너지 수요에 대응할 수 있는 안정적인 수소 저장 기술에 대한 사회적 니즈가 증가하고 있으며, 이 중 지중수소저장은 대규모 수소 저장이 가능하여 가장 경제적이고 합리적인 저장 방식으로 인식되고 있다. 국내의 경우, 인공적인 방호구조물을 활용한 저심도 수소 저장 방식을 고려하고 있는데, 이와 관련된 안전기준 확립 및 지반 안정성 평가가 중요해지고 있다. 본 연구에서는 저심도 지중 수소저장시설에서의 수소가스 누출 시 발생할 수 있는 지반의 수리역학적 거동을 복합해석 모델을 통해 평가하였다. 벤치마크 실험을 통하여 해석 모델의 예측 신뢰성을 검증한 후, 메타모델을 활용한 매개변수연구를 수행하여 고압수소가스의 지반 침투에 따른 지표면 융기현상에 대한 영향 인자들의 민감도에 대해 평가하였다. 분석결과, 수소가스의 지반누출에 따른 지표변위 변화에 대한 민감도는 지반의 탄성계수가 가장 큰 것으로 확인되었다. 이러한 연구결과는 향후 수소가스 누출뿐만 아니라 수소가스 폭발에 대한 지반 복합해석 평가 시 유용한 기초자료로 활용될 것이다.

부착돌말영양지수(TDI)를 활용한 습지환경 평가 (Wetland Habitat Assessement Utilizing TDI(Trophic Diatom Index))

  • 김성기;최종윤
    • 한국환경생태학회지
    • /
    • 제33권5호
    • /
    • pp.525-538
    • /
    • 2019
  • 낙동강에 위치한 신규조성 습지의 현황 파악 및 관리 방안 마련을 위한 기초연구의 일환으로 부착규조류의 서식현황과 종다양성을 분석하고 부착돌말영양지수(TDI, Trophic Diatom Index)의 적용가능성을 평가하였다. 조사 기간 동안, 부착규조류는 총 38과 173종이 출현하였으며, 봄과 가을에 각각 156종, 154종으로 비슷한 종수를 나타냈다. 자기조직화지도(SOM)를 활용한 분석 결과, 부착규조류의 분포는 각 습지의 영양염류의 농도와 강우 등의 환경요인에 따라 영향 받는 것으로 나타났다. 클러스터 1의 경우, 대부분 가을시기이며, 총인과 총질소 등의 영양염류의 농도와 부착규조류의 종수 및 풍부도가 낮음에도 불구하고, 부착돌말영양지수가 높은 지점들로 구성되었다. 이와 반대로, 클러스터 4는 봄시기의 지점들이며, 총질소가 높음에도 불구하고 부착돌말영양지수가 낮은 특징을 보였다. 신규조성 습지 대부분이 유입 유출구 기능이 원활하지 않은 점을 감안하면, 여름철에 증가된 유량은 가을철에 영양염류 값을 감소시키며, 탁도 증가로 인해 빛의 유입이 원활하지 않아 부착규조류의 종수와 풍부도가 낮아진다. 이와 반대로, 봄철에는 낮은 수위로 인해 부착규조류가 부착할 수 있는 기질표면이 부족하며, 호오탁성 종이 정착 및 발달하기에 이른 시기이기 때문에 부착돌말영양지수 값이 낮게 측정된다. 다양한 기존 연구에서, 부착돌말영양지수를 서식환경 및 수질 평가지표로 활용하고 있으나, 본 습지는 흐름이 적고 정체수역에 가깝기 때문에 대부분 영양염류 농도가 높아 부착돌말영양지수의 평가지표 가치성은 낮은 것으로 판단된다. 여름강우나 유입 유출 조절부의 기능이 부착규조류의 종다양성과 분포에 영향을 미치는 점을 종합적으로 감안한 지속적이고 주기적인 추가 조사가 필요하다.

공간 빅데이터와 야간 위성영상을 활용한 도시 활력 평가: 대구시를 사례로 (Urban Vitality Assessment Using Spatial Big Data and Nighttime Light Satellite Image: A Case Study of Daegu)

  • 정시윤;전병운
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.217-233
    • /
    • 2020
  • 본 연구는 공간 빅데이터, 공공 Wi-Fi AP와 야간 위성영상과 같은 새로운 지리 데이터를 활용하여 2018년 대구광역시의 도시 활력을 평가하였다. 새로운 지리 데이터는 다양한 시공간 스케일에서 도시민의 활동을 보다 직접적으로 파악하기 위하여 본 연구에서 사용되었다. 이동전화 데이터, 대중교통 스마트카드 데이터, 신용카드 데이터와 같은 세 가지 공간 빅데이터가 도시 활력의 사회적, 경제적 및 모빌리티 측면을 반영하기 위하여 사용되었다. 반면에, 공중 Wi-Fi AP와 야간 위성영상은 도시 활력의 가상적 및 물리적 측면을 고려하기 위하여 사용되었다. 다섯 개의 도시활력 지표들은 주성분 분석을 통해 통합되어 네 개의 시간대에서 집계구별 도시 활력 지수로 변환 되었다. 연구 결과에 의하면, 높은 도시 활력을 가진 다섯 개의 클러스터가 대구 도심, 대구은행 네거리와 범어역 네거리, 성서, 동대구역, 칠곡 3지구 주변에서 확인되었다. 또한, 도시 활력 지수는 같은 도시 공간상에서도 시간대별로 변한다는 것이 밝혀졌다. 본 연구는 도시 활력을 측정하기 위한 대리변수로 공간 빅데이터, 공공 Wi-Fi AP, 야간 위성영상을 통합하여 활용할 수 있는 가능성을 제시한다.

거주지 분화에 대한 공간통계학적 접근 (II): 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석 (A Spatial Statistical Approach to Residential Differentiation (II): Exploratory Spatial Data Analysis Using a Local Spatial Separation Measure)

  • 이상일
    • 대한지리학회지
    • /
    • 제43권1호
    • /
    • pp.134-153
    • /
    • 2008
  • 이 논문의 주된 목적은 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석을 통해 거주지 분화 연구에서 공간통계학적 접근이 가지는 의의를 논증하는 것이다. 탐색적 공간데이터 분석은 공간 데이터를 다양한 과학적 지도학적 시각화 방식을 통해 탐색함으로써 패턴을 발견해 내고, 의미 있는 가설을 수립하며, 더 나아가 공간 데이터에 대한 통계학적 모델을 평가하는 것을 주목적으로 한다. 이 연구는 국지 통계량에 기반한 탐색적 공간데이터 분석이 구체적인 연구 수행에서 실질적인 도움을 줄 수 있다는 믿음에 기반을 두고 진행된 것이다. 중요한 결과는 다음과 같다. 첫째, 이미 개발된 전역적 공간 분리성 측도로부터 국지적 공간 분리성 측도를 도출하였다. 둘째, 두 가지 유의성 검정을 위한 가정, 즉 총체적 랜덤화 가정과 조건적 랜덤화 가정에 기반한 가설검정 방법을 제시하였다 셋째, 측도와 유의성 검정을 바탕으로 한 탐색적 공간데이터 분석 기법으로 '공간 분리성 산포도 지도'와 '공간 분리성 이례치 지도'를 제시하였다. 부가적으로 각 인구 집단 별 집중도에 대한 표준화 지표도 제시되었다. 넷째, 개발된 기법을 우리나라 7대 도시의 고학력 집단과 저학력 집단간 거주지 분화에 적용한 결과, 특히, 이변량 공간적 클러스터와 공간적 특이점을 확인하는 데 유용성이 있는 것으로 드러났다.

PCA-DEA 모델을 기반으로 한 중국 주요연안 항만의 운영 효율성 평가 (Evaluation of the operational efficiency of major coastal ports in China based on the PCA-DEA model)

  • 장해청;이향숙
    • 한국항만경제학회지
    • /
    • 제40권1호
    • /
    • pp.87-118
    • /
    • 2024
  • 국내 운송을 담당하는 연안항들은 국가와 도시의 발전에 필수적인 역할을 하고 있다. 항만 효율성은 항만 경쟁력을 확보하기 위한 중요한 요소로, 이에 대한 연구는 기존 문헌에서 지속적으로 진행되었다. 중국의 경우 주로 지방의 항만 클러스터에 대한 연구에 초점을 맞추고 있는데, 미시적 관점에서만 접근하고 있으며, 최신 자료도 부재한 상황이다. 따라서 본 연구에서는 최신 자료를 활용하여 중국 상위 17개 연안항의 운영 효율성을 종합적으로 분석하고자 한다. 본 연구에서는 컨테이너 처리량을 산출변수로 선정하고, 크게 토지, 자본, 노동, 인프라에 속하는 13개 지표로부터 PCA(Principal Component Analysis) 분석을 통해 4개의 투입변수를 최종 선정하였다.그런 다음 17개 항구의 운영 효율성을 DEA (데이터 포위 분석)로 분석했습니다. 분석 결과, 상하이, 닝보-저우산, 광저우, 샤먼, 둥관의 5개 항만이 효율적인 반면, 나머지 12개의 항만은 상대적으로 비효율적인 것으로 나타났다. 본 연구는 중국의 연안항을 보다 거시적 관점에서 비교·분석한 것으로 이를 통해 상대적 비교가 가능하며, 향후 항만의 발전 전략 및 정책 수립을 위한 기초자료로 활용할 수 있을 것이다.