• 제목/요약/키워드: 공간데이터 마이닝

검색결과 176건 처리시간 0.033초

빅데이터를 활용한 생활밀착형 치유정원 연관키워드 분석 (An Analysis of Keywords Related to Neighborhood Healing Gardens Using Big Data)

  • 황지루이;이애란
    • 토지주택연구
    • /
    • 제13권2호
    • /
    • pp.81-90
    • /
    • 2022
  • 본 연구는 도심내 정신건강의 녹색치유공간의 사회적 필요성에 기인하여 생활밀착형 정원에 대한 현 시대의 사회적 인식요소 분석을 통해 발전방향을 모색하였다. 연구 방법으로 빅데이터 툴 중 덱스톰을 활용하여 웹정보 데이터를 수집하고, 텍스트마이닝을 진행하여 키워드 분석, 네트워크 분석과 담론분석을 통해 요소의 추출과 관계성을 파악하였다. 분석 결과 첫째, 치유공간과 치유환경은 도시 내부인 생활밀착의 공간 안에 친화적 건강 환경을 구축하고 있었다. 둘째, 생활밀착은 시설뿐 아니라 생활문화와 도시환경을 연동하여 국가와 지방행정, 시민이 참여하는 사업과 활동을 담고 있으며 생활밀착형 정원은 녹색복지와 서비스 프로그램을 통해 내실화되고 있다. 결론으로 정신건강에 유익하고 친근한 생활권의 공익형 정원은 긍정적 자극을 줄 수 있는 치유 환경으로서의 녹색인프라이다.

터널시설물 점검진단 데이터의 텍스트마이닝 분석을 통한 유형별·지역별 중점 유지관리요소의 이해 (Understanding Facility Management on Tunnel through Text Mining of Precision Safety Diagnosis Data)

  • 서정은;오진탁
    • 한국공간구조학회논문집
    • /
    • 제21권3호
    • /
    • pp.85-92
    • /
    • 2021
  • The purpose of this paper is to understand the key factors for efficient maintenance of rapidly aging facilities. Therefore, the safety inspection/diagnosis reports accumulated in the unstructured data were collected and preprocessed. Then, the analysis was performed using a text mining analysis method. The derived vulnerabilities of tunnel facilities can be used as elements of inspections that take into account the characteristics of individual facilities during regular inspections and daily inspections in the short term. In addition, if detailed specification information and other inspection results(safety, durability, and ease of use) are used for analysis, it provides a stepping stone for supporting preemptive maintenance decision-making in the long term.

텐서공간모델 기반 시멘틱 검색 기법 (A Tensor Space Model based Semantic Search Technique)

  • 홍기주;김한준;장재영;전종훈
    • 한국전자거래학회지
    • /
    • 제21권4호
    • /
    • pp.1-14
    • /
    • 2016
  • 시멘틱 검색은 검색 사용자의 인지적 노력을 최소화하면서 사용자 질의의 문맥을 이해하여 의미에 맞는 문서를 정확히 찾아주는 기술이다. 아직 시멘틱 검색 기술은 온톨로지 또는 시멘틱 메타데이터 구축의 난제를 갖고 있으며 상용화 사례도 매우 미흡한 실정이다. 본 논문은 기존 시멘틱 검색 엔진의 한계를 극복하기 위하여 이전 연구에서 고안한 위키피디아 기반의 시멘틱 텐서공간모델을 활용하여 새로운 시멘틱 검색 기법을 제안한다. 제안하는 시멘틱 기법은 문서 집합에 출현하는 '단어'가 텐서공간모델에서 '문서-개념'의 2차 텐서(행렬), '개념'은 '문서-단어'의 2차 텐서로 표현된다는 성질을 이용하여 시멘틱 검색을 위해 요구되는 온톨로지 구축의 필요성을 없앤다. 그럼에도 불구하고, OHSUMED, SCOPUS 데이터셋을 이용한 성능평가를 통해 제안 기법이 벡터공간모델에서의 기존 검색 기법보다 우수함을 보인다.

워드 임베딩을 이용한 아마존 패션 상품 리뷰의 사용자 감성 분석 (User Sentiment Analysis on Amazon Fashion Product Review Using Word Embedding)

  • 이동엽;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제8권4호
    • /
    • pp.1-8
    • /
    • 2017
  • 현대 사회에서 패션 시장의 규모는 해외와 국내 모두 지속적으로 증가하고 있다. 전자상거래를 통해 상품을 구입하는 경우 다른 소비자들이 작성한 상품에 대한 평가 데이터는 소비자가 상품의 구입 여부를 결정하는데에 영향을 미친다. 기업의 입장에서도 상품에 대한 소비자의 평가 데이터를 분석하여 소비자의 피드백을 반영한다면 기업의 성과에 긍정적인 영향을 미칠 수 있다. 이에 본 논문에서는 아마존 패션 상품의 리뷰 데이터를 학습하여 형성된 워드임베딩 공간을 이용하여 사용자의 감성을 분석하는 모델을 구축하는 방법을 제안한다. 실험은 아마존 리뷰 데이터 570만건을 학습하여 형성된 워드임베딩 공간을 이용하여 긍정, 부정 리뷰 데이터의 개수에 따라 총 3개의 SVM 분류기 모델을 학습하는 방식으로 진행하였다. 실험 결과 긍정 리뷰 데이터 5만건, 부정 리뷰데이터 5만건을 이용하여 SVM 분류기를 학습하였을 때 88.0%로 가장 높은 정확도(accuracy)를 나타냈다.

외국인 관광객 리뷰데이터를 활용한 토픽모델링 기반의 공간분석: 대구광역시를 사례로 (Spatial analysis based on topic modeling using foreign tourist review data: Case of Daegu)

  • 정지우;김서윤;김현유;윤주혁;장원준;김건욱
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.33-42
    • /
    • 2021
  • 스마트폰 기반의 관광 플랫폼들이 활성화되면서 리뷰 데이터를 활용한 정책 수립 및 서비스 고도화가 다양한 분야에서 이루어지고 있다. 관광 리뷰 데이터를 활용한 선행연구들의 경우 국내 관광객 중심의 연구가 대다수 수행되었으며, 외국인 관광객 연구의 경우 일부 언어로 수집된 데이터와 텍스트 마이닝 기법에 한정하여 연구가 수행되었다. 이에 본 연구에서는 온라인 리뷰 사이트를 통해 '대구 명소' 키워드를 지정하여 외국인들이 작성한 리뷰 데이터 3,515건을 수집하였다. 그리고 LDA 기반의 토픽모델링을 수행하여 관광 토픽을 도출하였으며, 각 토픽별 전역 및 국지적 공간 분석을 수행한 점이 선행연구와 차별성이라 할 수 있다. 분석 결과 전역적 공간 자기상관이 존재하며, 외국인들이 주로 방문하는 관광지들이 국지적으로 결집되어 있음을 확인하였다. 또한 대다수 토픽에서 중구를 중심으로 핫스팟이 도출되었으며, 분석 결과를 바탕으로 지자체 외국인 관광정책 수립 및 토픽모델링 기반의 공간분석 연구의 기초연구로 활용되길 기대하며, 본 연구의 한계점 또한 제시하였다.

텍스트마이닝을 활용한 대전시 공공도서관 이용자의 인식과 경험 연구 - SNS와 온라인 뉴스 기사를 중심으로 - (A Study on the Perception and Experience of Daejeon Public Library Users Using Text Mining: Focusing on SNS and Online News Articles)

  • 최지원;곽승진
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.363-384
    • /
    • 2024
  • 본 연구는 텍스트마이닝 기법을 중심으로 빅데이터 분석을 활용하여 대전시 공공도서관에 대한 이용자의 인식과 경험을 살펴보고자 수행되었다. 이를 위하여 첫째, 소셜미디어에 나타난 이용후기 데이터를 수집하여 대전시 공공도서관에 대한 이용자들의 전반적인 인식과 평가를 탐색하였다. 둘째, 온라인 뉴스 기사 분석을 통해 사회적으로 논의되고 있는 현안을 파악하였다. 분석 결과, 첫째로 어린이 동반 이용자 비중의 높다는 것과 다음으로 LDA 분석을 통한 토픽이 '문화행사/프로그램', '자료 이용', '물리적 환경 및 시설', '도서관 서비스'의 네 가지 분류로 나타난다는 것, 마지막으로 뉴스기사 데이터에 도서관 및 복합문화공간 추가 건립과 도서관 협력 체계 구축에 대한 키워드가 핵심적으로 등장한다는 것을 확인하였다. 이를 바탕으로 지역 균형을 고려한 공공도서관 건립과 육아 및 보육 기관과의 업무협약을 통한 사회적 육아공동체 네트워크 조성을 제안하였다. 본 연구를 활용하여 대전시 공공도서관의 정책적·사회적 흐름을 알아보고 지역사회 수요를 반영하는 공공도서관 운영을 데이터에 기반하여 실행할 수 있기를 기대한다.

FP-tree를 이용한 사용자 선호도 조사 : 헬스클럽에 적용 (User Preference survey by FP-tree : Apply to fitness club)

  • 홍의찬;김원영;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.753-754
    • /
    • 2009
  • 오늘날 산업 전반에 걸쳐 데이터베이스 시스템이 사용되고 있다. 이에 따라 데이터베이스의 양은 점차 증가하고 방대한 양의 데이터에서 유용한 정보를 얻는 데이터 마이닝 기법이 중요한 기술로 발전해 나가고 있다. 최근 헬스클럽과 같은 개인의 취미와 여가를 위한 공간의 중요성이 대두되고 있는데 반해 사용자의 증가로 인한 불편이 문제가 되고 있다. 본 논문에서는 헬스클럽을 통해 사용자들의 선호도를 조사하여 불편을 줄이고 나아가 효율적인 시간 분배 방법을 제시해 보고자 한다.

빅데이터 마이닝에 의한 공시지가 민원의 시공간적 분석모델 제시 (A Suggestion for Spatiotemporal Analysis Model of Complaints on Officially Assessed Land Price by Big Data Mining)

  • 조태인;최병길;나영우;문영섭;김세훈
    • 지적과 국토정보
    • /
    • 제48권2호
    • /
    • pp.79-98
    • /
    • 2018
  • 이 연구는 빅데이터 마이닝에 기초하여 공시지가 민원에 대한 시공간적 특성을 분석하는 모델을 제시하는 데 목적이 있다. 특히 이 연구는 행정 민원이 제기되는 원인을 학술적 요인보다는 시공간적 측면에서 찾았고, 그러한 민원 발생의 경향을 시공간적으로 모니터링하는 모델을 제시하였다. 2006년부터 2015년까지 인천광역시 중구의 공시지가에 대한 6,481개의 민원정보가 시간 및 공간적 특성을 고려해 수집되었고 분석을 위해 사용되었다. 텍스트 마이닝 기법을 이용해 주요 키워드의 빈도수를 도출했으며, 소셜 네트워크 분석을 통해 주요 키워드 간의 관계를 분석하였다. 키워드의 가중치와 연관되는 TF(term frequency)와 TF-IDF(term frequency-inverse document frequency)를 산출함으로써, 공시지가의 민원 발생에 대한 주요 키워드를 식별하였다. 마지막으로 Getis-Ord의 $Gi^*$의 통계량에 기초한 핫스팟 분석을 통해 공시지가 민원의 시공간적 특성을 분석하였다. 연구 결과, 공시지가 민원의 특성은 시공간적으로 연계된 군집 형태를 형성하면서 변화하고 있음을 알 수 있었다. 텍스트 마이닝과 소셜 네트워크 분석 방법을 이용하여 자연어 기반의 공시지가 민원에 대한 발생 원인을 정량적으로 규명할 수 있음을 알 수 있었으며, 키워드 가중치인 단어 빈도(TF) 및 단어 빈도와 역문서 빈도의 조합값(TF-IDF)의 상대적인 차이가 있어 시공간적인 민원 특성을 분석하기 위한 주요 설명변수로 활용될 수 있음을 알 수 있었다.

텍스트마이닝 기법을 활용한 사회기반시설 기후변화 영향의 공간정보 표출 (Visualizing Spatial Information of Climate Change Impacts on Social Infrastructure using Text-Mining Method)

  • 신하나;류재나
    • 대한원격탐사학회지
    • /
    • 제33권5_3호
    • /
    • pp.773-786
    • /
    • 2017
  • 본 연구는 텍스트마이닝 기법을 사용하여 사회기반시설에 대한 기후변화 영향 데이터들을 추출 및 분석하고, 이들을 행정구역 공간정보와 연계하여 분석 표출하고자 하였다. 우선 전력시설, 교통 도시기반시설, 유류 자원관리시설, 환경시설, 용수공급시설의 사회기반시설 중 다섯 가지(폭염, 한파, 호우, 대설, 강풍) 기후 요소로부터 영향을 많이 받은 시설을 파악하고, 각 시설별로 주요한 영향을 미치는 기후 요소를 분석하였다. 사회기반시설의 기후변화 영향은 시설의 위치에 영향을 받을 것으로 기대되어, 사회기반시설 기후변화 영향을 지역 중심으로 비교 분석 및 시각화 하였다. 연구 결과, 사회기반시설 중 교통 도시기반시설이 기후변화 영향을 가장 많이 받았으며, 사회기반시설에 대한 기후변화 영향은 주로 호우와 대설에 의해 발생하는 것으로 확인되었다. 사회기반시설 기후변화 영향의 공간정보를 분석 및 표출한 결과, 강원도와 서울 지역에 위치한 사회기반시설들이 기후변화 영향을 상대적으로 많이 받은 것으로 나타났다. 본 연구는 텍스트마이닝을 통해 사회기반시설 기후변화 영향에 대한 비정형화된 정보를 추출 및 처리하여 분석하고, 이를 공간정보로 표출 시도하였다는 점에서 의미가 있다.

Topographic non-negative matrix factorization에 기반한 텍스트 문서로부터의 토픽 가시화 (Topographic Non-negative Matrix Factorization for Topic Visualization from Text Documents)

  • 장정호;엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.324-329
    • /
    • 2006
  • Non-negative matrix factorization(NMF) 기법은 음이 아닌 값으로 구성된 데이터를 두 종류의 양의 행렬의 곱의 형식으로 분할하는 데이터 분석기법으로서, 텍스트마이닝, 바이오인포매틱스, 멀티미디어 데이터 분석 등에 활용되었다. 본 연구에서는 기본 NMF 기법에 기반하여 텍스트 문서로부터 토픽을 추출하고 동시에 이를 가시적으로 도시하기 위한 Topographic NMF (TNMF) 기법을 제안한다. TNMF에 의한 토픽 가시화는 데이터를 전체적인 관점에서 보다 직관적으로 파악하는데 도움이 될 수 있다. TNMF는 생성모델 관점에서 볼 때, 2개의 은닉층을 갖는 계층적 모델로 표현할 수 있으며, 상위 은닉층에서 하위 은닉층으로의 연결은 토픽공간상에서 토픽간의 전이확률 또는 이웃함수를 정의한다. TNMF에서의 학습은 전이확률값의 연속적 스케줄링 과정 속에서 반복적 파리미터 갱신 과정을 통해 학습이 이루어지는데, 파라미터 갱신은 기본 NMF 기반 학습 과정으로부터 유사한 형태로 유도될 수 있음을 보인다. 추가적으로 Probabilistic LSA에 기초한 토픽 가시화 기법 및 희소(sparse)한 해(解) 도출을 목적으로 한 non-smooth NMF 기법과의 연관성을 분석, 제시한다. NIPS 학회 논문 데이터에 대한 실험을 통해 제안된 방법론이 문서 내에 내재된 토픽들을 효과적으로 가시화 할 수 있음을 제시한다.

  • PDF