• 제목/요약/키워드: Topic Clustering

검색결과 99건 처리시간 0.025초

Analyzing the Factors of Gentrification After Gradual Everyday Recovery

  • Yoon-Ah Song;Jeongeun Song;ZoonKy Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.175-186
    • /
    • 2023
  • 본 연구는 단계적 일상회복 이후 상권 회복세와 함께 임대료가 급상승한 시점에 주목하여 젠트리피케이션 분석 모형을 구축하고 그 특징을 살펴보는 것이 목적이다. 최근 국내에서는 팬데믹 이후 거리두기의 영향으로 대규모 상권보다는 소규모 상권이 형성되었다. 바로 핫플레이스라고 알려진 골목상권이다. 핫플레이스는 다양한 미디어와 사회관계망서비스를 통해 집객효과를 누리며 인기를 끌고 있다. 그에 따라 유동인구가 증가하면서 상권이 활성화 되고 임대료가 급상승하는 현상이 발생하고 있다. 하지만 소상공인의 경우 임대료 급상승은 매출 증가로도 감당하지 못해 해당 지역을 이탈하는 젠트리피케이션 현상으로 이어질 수 있다. 따라서 본 연구에서는 상권이 다시 활성화되면서 임대료가 급상승하는 시점을 찾아 그 이전과 이후를 분석하고자 한다. 먼저 젠트리피케이션에 관련하여 언급되는 토픽을 탐색하기 위해 텍스트 데이터를 수집한 후 LDA 토픽 모델링을 실시한다. 이를 참고하여 상권 단위로 데이터를 수집하고 젠트리피케이션 분석 모형을 구축한 다음 특징을 분석한다. 팬데믹으로 상권이 침체된 이후 재활성화 되고 있는 시점에 본 모형을 통한 젠트리피케이션 분석이 소상공인 정책에 기여할 수 있기를 바란다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.

직원경험 요인 파악 및 직무 만족도에 끼치는 영향력 분석 (Identification of Employee Experience Factors and Their Influence on Job Satisfaction)

  • 이주현;이소현;김희웅
    • 경영정보학연구
    • /
    • 제25권2호
    • /
    • pp.181-203
    • /
    • 2023
  • 기존에 우수한 인재를 유치하기 위한 기업들의 경쟁이 심화됨에 따라, 직원들의 직무 만족도 관리가 중요해지고 있다. 이에 많은 기업의 관리자들은 직원들의 일상적인 경험과 고충을 파악하여 직무만족도를 개선하기 위해 투자하고 있다. 그러나 직원 경험에 대한 충분한 이해의 부족으로 관리자들의 투자는 효과를 보지 못하고 있다. 본 논문은 전 세계적으로 가장 큰 직장인 커뮤니티인 글래스도어의 직원 리뷰와 기업 평점을 활용하여 직원 경험의 세부 요인들과 직무 만족도 간 관계를 조사한다. 이때 K-평균 군집화, Sentiment LDA Topic Modeling 등 텍스트 마이닝 기법을 활용하여 직급에 따른 주요 경험을 추출하고, DistilBERT 감성 분석을 통해 각 직원경험 요인의 감성점수를 측정한다. 이후 도출된 직원 경험 요인과 감성 점수를 계량적으로 분석하여 각 직원 경험 요인과 직무 만족도 간의 관계를 파악한다. 그 결과, 조직 관리자와 일반 직원의 직장 내 경험에는 상당한 차이가 있는 것으로 발견되었다. 또한 고객관계, 자율성 등은 관리자의 만족도에 영향을 미치지 않는 등, 직무 만족도에 영향을 미치는 직원경험 역시 직급 간 상이했다. 본 연구는 직업적응이론을 기반으로 텍스트 마이닝과 계량 모델링 방법을 이용하여 직원경험의 주요 요인을 확인하고 이를 검증함으로써 관련 연구분야의 문헌을 확장한다. 더불어, 본 연구결과는 직원들의 직무 만족도 개선을 위한 인사관리 전략에 활용될 수 있으며, 궁극적으로는 기업의 생산성을 개선할 것으로 기대한다.

머신러닝 기반의 신약 재창출 관련 연구 동향 분석 (Analysis of Research Trends Related to drug Repositioning Based on Machine Learning)

  • 유소연;임규건
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.21-37
    • /
    • 2022
  • 신약을 개발하는 한 가지 방법의 하나인 신약 재창출(Drug Repositioning)은 이미 사람들에게 사용할 수 있도록 승인된 약물들이 다른 용도로 사용되도록 하여 새로운 적응증을 발견하는 유용한 방법이다. 최근에는 머신러닝 기술의 발달로 방대한 생물학적 정보를 분석하여 신약 개발에 활용하는 경우가 증가하고 있다. 신약 재창출에 머신러닝 기술을 활용하면 효과적인 치료법을 신속하게 찾아내는 데 도움을 줄 것이다. 현재 심각한 급성 호흡기 증후군인 코로나바이러스(COVID-19)에 의한 신종 질병으로 전 세계가 힘든 시간을 보내고 있다. 이미 임상적으로 승인된 약물의 용도를 변경하는 신약 재창출은 COVID-19 환자를 치료하기 위한 치료제의 대안이 될 수 있다. 본 연구는 머신러닝 기법을 활용하여 신약 재창출 분야에 대한 연구 동향을 살펴보고자 한다. Pub Med에서 웹 스크래핑 기법을 사용하여 'Drug Repositioning'이라는 키워드로 총 4,821건의 논문을 수집하였다. 데이터 전처리 후, 4,419건의 논문을 대상으로 빈도분석, LDA 기반 토픽모델링, Random Forest 분류 분석 및 예측 성능평가를 수행하였다. Word2vec 모델을 기반으로 연관어를 분석하였고, PCA 차원 축소 후 K-Means 군집화하여 레이블을 생성한 후, t-SNE 알고리즘을 이용하여 논문이 형성하고 있는 그룹을 시각화하고, LDA 결과에 계층적 군집화를 적용하여 히트맵으로 시각화하였다. 본 연구는 신약 재창출과 관련된 연구 주제가 무엇인지를 파악하고, 머신러닝 알고리즘을 사용하여 대량의 문헌에서 의미 있는 주제를 도출하고 시각화하는 방법을 제시하였다. 향후 신약 재창출 분야의 연구나 개발 전략을 수립하기 위한 기초자료로 활용되는 데 도움을 줄 것이라고 기대한다.

동시출현단어 분석을 활용한 오픈액세스 분야의 지적구조 분석: 2013년부터 2018년까지 출판된 문헌정보학 저널을 기반으로 (Domain Analysis on the Field of Open Access by Co-Word Analysis: Based on Published Journals of Library and Information Science during 2013 to 2018)

  • 김선겸;김완종;서태설;최현진
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.333-356
    • /
    • 2019
  • 기존 상업 출판사 중심의 학술 커뮤니케이션 체제가 가져온 위기를 해소할 수 있는 대안으로 오픈액세스가 등장하였다. 본 연구는 계량정보분석 기법 가운데 하나인 동시출현단어 분석을 활용하여 오픈액세스 분야의 최신 연구 경향을 반영하는 지적구조를 제시하고 주제영역이 어떻게 구성되었는지 확인하는 것을 주된 목적으로 두며, 기존에 수행되었던 오픈액세스 지적구조 분석 연구와 비교분석하였다. 이를 위해 Web of Science로부터 오픈액세스 관련 키워드 검색을 통하여 2013년 1월 1일부터 2018년 11월 31일까지 출판된 문헌정보학 분야 논문 총 761편을 수집하였으며, 이들 논문 가운데 제목과 초록으로부터 명사구 형태의 키워드 총 2,321개를 추출하였다. 오픈액세스 지적구조 분석을 위해 네트워크 분석을 통하여 13개의 세부 주제영역이 추출되었으며, 지적관계를 시각화하여 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하고 이 결과를 다차원축적지도에 표시하여 키워드들과의 상관관계를 분석하였다. 이를 통해 앞으로 오픈액세스 영역에서의 연구 방향성 모색에 도움이 될 것으로 기대한다.

"비급천금요방(備急千金要方)" 침구편(鍼灸篇)으로 구성한 경혈(經穴) 네트워크에 공간적 위치 변수가 미치는 영향 (Spatial Influence on Acupoints Network Derived from the Chapter on Acupuncture & Moxibustion in "Beijiqianjinyaofang")

  • 김민욱;양승범;안성훈;손인철;김재효
    • Korean Journal of Acupuncture
    • /
    • 제29권3호
    • /
    • pp.431-440
    • /
    • 2012
  • Objectives : Recently, network science is very popular topic in various scientific fields and many studies have reported that it gives meaningful results on studying characteristics of a complex system. In this study, based on network theory, we made acupoints network using data of combined acupoints which appeared at "Beijiqianjinyaofang". We focused to find out the distinctive roles of remote and local combinations on the network. Furthermore, we aimed to identify the possibility of numerical and quantitative application to acupuncture researches. Methods : Based on examples of combined acupoints in "Beijiqianjinyaofang", the network consisted of 291 nodes and 2,431 links. The spatial distances between combined acupoints were calculated by the human dummy model. We removed the links step by step for the three cases - remote, local, and random cases, and observed the characteristic changes by calculating path lengths, similarity indices, and clustering coefficients. Also cluster analysis was carried out. Results : The network had a small number of remote links, and a large number of local links. These two links had the distinct characteristics. Whereas the local links formed a cluster of nearby nodes, remote links played a role to increase the correlation between the clusters. Conclusions : These results suggest that acupoints network increases the connectivity between the distal part and the trunk of human body, and enables various combinations of the acupoints. This finding conclusively showed that mechanism of combined acupoints could be interpreted meaningfully by applying network theory in acupuncture researches.

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로 (A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables)

  • 최가람;최성필
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.231-250
    • /
    • 2018
  • 본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

미국의 산업집적 추이와 도로교통망의 인과관계 분석 (Evolution of Industrial Agglomeration and Its Causal Relation with Road Networks in the U.S.)

  • 송예나
    • 대한지리학회지
    • /
    • 제48권1호
    • /
    • pp.72-86
    • /
    • 2013
  • 산업집적은 경제지리학에서 오랫동안 연구되어온 주제 중의 하나이며 지금까지 다양한 방법을 통해 산업집적 현상을 설명하고 이의 영향을 평가해왔다. 하지만 시계열 데이터를 이용해 집적의 추이를 살펴본 연구는 아직 활발히 이루어지지 않고 있다. 본 연구는 지난 29년 간의 데이터를 이용해 사례로 선정된 산업들의 집적 정도를 평가하고 이러한 시계열 패턴과 도로 네트워크의 확장이 어떠한 인과관계를 맺고 있는 지 살펴보고 있다. 집적 정도를 측정한 결과 사례로 선정된 산업의 종사자들은 지리적으로 균등하게 분포되지 않고 있었다. 또한 사례 산업들 간에 공통된 시계열적 변화 특성은 나타나지 않았으나 각 산업의 발전 단계 및 비즈니스 환경 변화가 개별 산업의 집적 정도에 영향을 주고 있는 것으로 보이고 있다. 집적 정도와 도로교통망 사이의 관계를 살펴보기 위해 각 산업 별로 Granger causality test를 실시하였고 도로 교통망이 산업 집적에 영향을 주고 있음을 몇몇 사례를 통해 확인할 수 있었다. 그러나 이와 반대의 경우 혹은 상호 간에 영향을 주는 사례도 나타나 교통망과 산업집적이 보다 복잡한 관계를 맺고 있음을 보여준다.

  • PDF

Application of the L-index to the Delineation of Market Areas of Retail Businesses

  • Lee, Sang-Kyeong;Lee, Byoungkil
    • 한국측량학회지
    • /
    • 제32권3호
    • /
    • pp.245-251
    • /
    • 2014
  • As delineating market areas of retail businesses has become an interesting topic in marketing field, Lee and Lee recently suggested a noteworthy method, which applied the hydrological analysis of geographical information system (GIS), based on Christaller's central place theory. They used a digital elevation model (DEM) which inverted the kernel density of retail businesses, which was measured by using bandwidths of pre-determined 500, 1000 and 5000 m, respectively. In fact, their method is not a fully data-based approach in that they used pre-determined kernel bandwidths, however, this paper has been planned to improve Lee and Lee's method by using a kind of data-based approach of the L-index that describes clustering level of point feature distribution. The case study is implemented to automobile-related retail businesses in Seoul, Korea with selected Kernel bandwidths, 1211.5, 2120.2 and 7067.2 m from L-index analysis. Subsequently, the kernel density is measured, the density DEM is created by inverting it, and boundaries of market areas are extracted. Following the study, analysis results are summarized as follows. Firstly, the L-index can be a useful tool to complement the Lee and Lee's market area analysis method. At next, the kernel bandwidths, pre-determined by Lee and Lee, cannot be uniformly applied to all kinds of retail businesses. Lastly, the L-index method can be useful for analyzing the space structure of market areas of retail businesses, based on Christaller's central place theory.