• 제목/요약/키워드: 빅데이터 기법

검색결과 785건 처리시간 0.022초

미세먼지 저감을 위한 그린인프라 계획요소 도출 - 텍스트 마이닝을 활용하여 - (Derivation of Green Infrastructure Planning Factors for Reducing Particulate Matter - Using Text Mining -)

  • 석영선;송기환;한효주;이정아
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.79-96
    • /
    • 2021
  • 그린인프라 계획은 미세먼지 저감을 위한 대표적인 조경 계획 방안 중 하나이다. 이에, 본 연구에서는 미세먼지 저감을 위한 그린인프라 계획 시 활용될 수 있는 요소를 텍스트 마이닝 기법을 활용하여 도출하고자 하였다. 미세먼지 저감계획, 그린인프라 계획 요소 등의 키워드를 중심으로 관련 선행연구, 정책보고서 및 법률 등을 수집하여 텍스트 마이닝을 통해 단어 빈도-역 문서 빈도(Term Frequency-Inverse Document Frequency, 이하 TF-IDF) 분석, 중심성 분석, 연관어 분석, 토픽 모델링 분석을 실시하였다. 연구결과, 첫째, TF-IDF 분석을 통해 미세먼지 및 그린인프라와 관련된 주요 주제어는 크게 환경문제(미세먼지, 환경, 탄소, 대기 등), 대상 공간(도시, 공원, 지역, 녹지 등), 그리고 적용 방법(분석, 계획, 평가, 개발, 생태적 측면, 정책적 관리, 기술, 리질리언스 등)으로 구분할 수 있었다. 둘째, 중심성 분석 결과, TF-IDF와 유사한 결과가 도출되었으며, 주요 키워드들을 연결하는 중심단어는 '그린뉴딜', '유휴부지'임을 확인할 수 있었다. 셋째, 연관어 분석 결과, 미세먼지 저감을 위한 그린인프라 계획 시, 숲과 바람길의 계획이 필요하며, 미기후 조절의 측면에서 수분에 대한 고려가 반드시 필요한 것으로 확인되었다. 또한, 유휴공간의 활용 및 혼효림의 조성, 미세먼지 저감 기술의 도입과 시스템의 이해가 그린인프라 계획 시 중요한 요소가 될 수 있음을 확인할 수 있었다. 넷째, 토픽 모델링 분석을 통해 그린인프라의 계획요소를 생태적·기술적·사회적 기능을 중심으로 분류하였다. 생태적 기능의 계획요소는 그린인프라의 형태적 부분(도시림, 녹지, 벽면녹화 등)과 기능적 부분(기후 조절, 탄소저장 및 흡수, 야생동물의 서식처와 생물 다양성 제공 등), 기술적 기능의 계획요소는 그린인프라의 방재 기능, 완충 효과, 우수관리 및 수질정화, 에너지 저감 등, 사회적 기능의 계획요소는 지역사회 커뮤니티 기능, 이용객의 건강성 회복, 경관 향상 등의 기능으로 분류되었다. 이와 같은 결과는 미세먼지 저감을 위한 그린인프라 계획 시 리질리언스 및 지속가능성과 같은 개념적 키워드 중심의 접근이 필요하며, 특히, 미세먼지 노출 저감의 측면에서 그린인프라 계획요소의 적용이 필요함을 시사한다고 볼 수 있다.

서울·경기지역 화강암의 탄성파속도와 탄성계수에 의한 암석의 일축압축강도와의 상관성 연구 (A Study on the Correlation between Uniaxial Compressive Strength of Rock by Elastic Wave Velocity and Elastic Modulus of Granite in Seoul and Gyeonggi Region)

  • 손인환;김병국;이벽규;장승진;이수곤
    • 한국재난정보학회 논문집
    • /
    • 제15권2호
    • /
    • pp.249-258
    • /
    • 2019
  • 연구목적: 본 연구에서는 서울 경기지역의 화강암을 대상으로 시추조사 시 채취된 암석 시료에서 측정된 물리적 특성 중 탄성파속도와 탄성계수로부터 암석의 일축압축강도와의 상관성을 분석하여 암석의 일축압축강도를 추정하는 것을 목적으로 한다. 연구방법: 119개의 화강암 시추 코아 시료를 대상으로 탄성파 속도와 탄성계수 그리고 일축압축강도와의 상관관계를 도출하기 위하여 실내 암석 실험을 실시하였다. 연구결과: 화강암에 대하여 탄성파속도와 일축압축강도 그리고 탄성계수와의 상호 관계를 단순회귀와 다중회귀로 분석한 결과는 전반적으로 관계식에 나타난 것처럼 신뢰도가 낮음을 확인하였다. 이는 화강암의 구성 입자가 균질하지 못하여 탄성파속도와 탄성계수를 이용한 압축강도 추정에 대한 활용성이 낮은 원인으로 사료된다. 결론: 본 연구에서 암석의 탄성파속도와 탄성계수로부터 일축압축강도를 추정하기 위한 상관관계를 분석하기 위하여 단순회귀분석과 다중회귀분석 방법을 이용하였다. 단순회귀분석은 결정계수($R^2$)가 0.61~0.67 이었으며, 다중회귀분석은 0.71로 나타났다. 따라서 다중회귀분석을 이용하여 암석의 일축압축강도를 추정할 때 다소 신뢰성이 높아질 수 있다. 또한, 향후 탄성파 속도와 탄성계수를 이용한 암석의 일축압축강도를 추정할 때 다양한 통계분석 기법(회귀분석, 인공신경망, 빅데이터 분석 등)을 활용하면 보다 신뢰성이 높은 결과를 얻을 수 있을 것으로 본다.

사회연결망분석을 활용한 한국 남자축구대표팀 경기성과 분석: 벤투 감독 경기를 중심으로 (Analyzing the Performance of the South Korean Men's National Football Team Using Social Network Analysis: Focusing on the Manager Bento's Matches)

  • 정연식 ;강은경 ;양성병
    • 지식경영연구
    • /
    • 제24권2호
    • /
    • pp.241-262
    • /
    • 2023
  • 스포츠 경기에서 발생하는 현상이나 경기기록을 분석하는 스포츠 경기분석 분야에 첨단기술과 다양한 과학적 분석기법이 적용되고 있으며, 그 중 패스네트워크 분석에 사회연결망분석 방법이 활발히 활용되고 있다. 축구는 선수 간 패스라는 상호작용을 통해 경기가 이루어지는 대표적인 스포츠인 만큼 사회연결망분석을 이용하여 기존에는 측정할 수 없었던 경기에 대한 새로운 정보를 제공하고자 노력하고 있다. 이에, 본 연구에서는 단일 축구팀의 (1) 시간 흐름에 따른 패스네트워크의 변화를 분석하고, (2) 전술의 변화에 영향을 미치는 주요 요인 중 경기의 성격 변화(카타르월드컵 vs. A매치)와 (3) 상대팀 변화(FIFA랭킹 상위팀 vs. FIFA랭킹 하위팀)에 대한 패스네트워크까지 총 세 가지 상황을 비교∙분석하고자 하였다. 보다 구체적으로, 벤투 감독 부임 이후 한국 남자축구국가대표팀의 경기 중 10 경기를 선별하고, 이에 대한 네트워크 지표를 추출하였으며, 축구팀 경기력 평가모델의 네 가지 지표(효율성, 응집력, 취약성, 활동성/리더십)를 추출된 데이터에 적용한 후 세 가지 상황을 각각 분석하였다. 연구결과, 시간 흐름에 따른 경기력 분석에서 응집력이 유의하게 상승하고, 취약성이 유의하게 하락하는 것을 확인할 수 있었고, 경기성격 변화에 따른 비교분석에서는 카타르월드컵 경기가 A매치 경기보다 평가모델의 모든 항목에서 경기력이 우수한 것으로 나타났다. 마지막으로, 상대팀의 변화에 따른 비교분석에서는 FIFA랭킹 하위팀과의 경기가 상위팀과의 경기보다 평가모델의 모든 항목에서 경기력이 우수하게 나타났다. 본 연구의 결과가 축구팀의 감독 선임 및 경기 전략을 수립하는데 주요한 기초자료로 활용되어 축구팀의 경기력 향상에 기여할 수 있기를 기대한다.

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.