• 제목/요약/키워드: Text Mining Method

검색결과 447건 처리시간 0.025초

해양사고 온톨로지 구축 및 데이터 관리방안 연구: 서해남부해역 선박사고 상황보고서 분석을 중심으로 (A Study on Marine Accident Ontology Development and Data Management: Based on a Situation Report Analysis of Southwest Coast Marine Accidents in Korea)

  • 이영재;강성경;구자영
    • 해양환경안전학회지
    • /
    • 제25권4호
    • /
    • pp.423-432
    • /
    • 2019
  • 매년 해양활동이 증가하며 해양사고 발생빈도가 높아지고 있다. 이에 따라 해양안전을 위한 각종 연구 활동과 정책이 실행되고 있다. 하지만 이러한 노력에도 불구하고 매년 해양사고가 증가하고 있어 이들의 실효성에 대한 문제가 제기되고 있다. 문헌연구 결과에 따르면, 통계연보를 활용한 선행연구는 통계제공항목 간 비교를 통해 두드러지는 항목에 대한 예방책을 제시하고 있다. 2000년대 이후에는 대형 해양사고가 반복적으로 발생하면서 '사고대응'에 대한 사례연구(case study)가 진행되고 있다. 국내 해양안전을 위한 정책수립 연구과정에서 통계연보나 사고사례를 주 자료로 활용하고 있으나 현재 자료는 사후결과 요약정도의 수준이다. 따라서 본 연구에서는 해양사고 사례분석 및 개선방안 관련 문헌연구를 통해 현행 해양관련 연구와 정책의 한계를 탐색하였다. 또한 자료 활용 한계를 개선하기 위한 방안의 일환으로 선박사고 상황보고서 속성분석, 텍스트 마이닝을 통해 해양사고 정보 분류체계인 온톨로지(ontology)를 수정 보완하였다. 해당 항목은 '신고자, 신고수단, 구조세력, 대응 조치사항, 대응취약성, 적재물, 유류유출경위, 피해유형, 사고처리결과'이며, 이 항목들은 분류체계 표준용어를 활용해 향후 지속적으로 수집 활용할 수 있다. 마지막으로 온톨로지를 실질적으로 활용하기 위한 데이터 수집 및 품질확보 방안을 제시했다. 결과적으로 현재 해양안전이 직면한 문제를 명확히 파악하고 '품질이 확보된 충분한 정보'를 활용한다면 보다 다양한 연구와 실효성 있는 정책 실현이 가능할 것이다.

기간별 이슈 매핑을 통한 이슈 생명주기 분석 방법론 (Analyzing the Issue Life Cycle by Mapping Inter-Period Issues)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.25-41
    • /
    • 2014
  • 최근 스마트 기기를 통해 소셜미디어에 참여하는 사용자가 급격히 증가하고 있다. 이에 따라 빅데이터 분석에 대한 관심이 높아지고 있으며 최근 포털 사이트에서 검색어로 자주 입력되거나 다양한 소셜미디어에서 자주 언급되는 단어에 대한 분석을 통해 사회적 이슈를 파악하기 위한 시도가 이루어 지고 있다. 이처럼 다량의 텍스트를 통해 도출된 사회적 이슈의 기간별 추이를 비교하는 분석을 이슈 트래킹이라 한다. 하지만 기존의 이슈 트래킹은 두 가지 한계를 가지고 있다. 첫째, 전통적 방식의 이슈 트래킹은 전체 기간의 문서에 대해 일괄 토픽 분석을 실시하고 각 토픽의 기간별 분포를 파악하는 방식으로 이루어지므로, 새로운 기간의 문서가 추가되었을 때 추가된 문서에 대해서만 분석을 추가 실시하는 것이 아니라 전체 기간의 문서에 대한 분석을 다시 실시해야 한다는 실용성 측면의 한계를 갖고 있다. 둘째, 이슈는 끊임 없이 생성되고 소멸될 뿐 아니라, 때로는 하나의 이슈가 둘 이상의 이슈로 분화하고 둘 이상의 이슈가 하나로 통합되기도 한다. 즉, 이슈는 생성, 변화(병합, 분화), 그리고 소멸의 생명주기를 갖게 되는데, 전통적 이슈 트래킹은 이러한 이슈의 가변성을 다루지 않았다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 대상 기간 전체의 문서를 한꺼번에 분석하는 방식이 아닌 세부 기간별 문서에 대해 독립적인 분석을 수행하고 이를 통합할 수 있는 방안을 제시하였으며, 이를 통해 새로운 이슈가 생성되고 변화하며 소멸되는 전체 과정을 규명하였다. 또한 실제 인터넷 뉴스에 대해 제안 방법론을 적용함으로써, 제안 방법론의 실무 적용 가능성을 분석하였다.

한.일 고등학교 세계지리 교과서 내용 비교 분석 -국제이해교육의 관련 내용을 중심으로- (Comparative Analysis of Korean and Japanese Textbooks on World Geography: Focused on the Contents of Global Education)

  • 양원택
    • 한국지역지리학회지
    • /
    • 제2권2호
    • /
    • pp.75-92
    • /
    • 1996
  • 본 연구는 국제이해교육에 대한 이론적 바탕을 제공하고, 또 현재 한 일 고등학교에서 쓰이고 있는 세계지리 교과서의 국제이해 관련 내용을 2개의 중심주제, 6개의 소주제, 20개의 중심개념의 교과서 분석틀로 나누어 비중도 분석을 실시하여, 학생들이 사용하고 있는 세계지리 교과서가 국제 이해교육을 위해 효율적으로 구성되어 있고 그 내용이 적절한지 개괄적으로 살펴봄으로서 앞으로 한 일 고등학교 세계지리 교과서의 구성 및 내용체계가 어떠한 방향으로 나아가야 할 것인가를 제시하고자 한 연구이다. 한국의 6차 교육과정에 의한 세계지리 교과서와 일본의 6차 개정에 의한 세계지리 교과서를 비교 분석한 결과에 의하면, 중심주제인 상호의존의 영역에서는 양국이 거의 비슷한 비중을 보였으며, 상존(常存)문제의 영역인 인권, 인구, 자원문제에 있어서는 상당한 비중 차이를 보였는데 이는 한국과 일본의 교육과점의 차이로 볼 수 있다. 즉 한국의 경우 단원별로 계통지리적 방법과 지지적(地誌的) 방법을 별도로 채택만 반면 일본의 경우는 계통지리적 방법과 지지적(地誌的) 방법과의 상호보완 관계로 채택함으로서 취급된 지역에 대해서는 다면적으로 고찰시키도록 하고 있다. 따라서 한국 세계지리 교과서는 다양한 지역을 이해시키기 위한 구성 및 내용체계를 보이는 반면 일본 세계지리 교과서는 소수의 지역이지만 계통적 주제별로 자세하게 그 지역을 이해시키기 위한 구성 및 내용체계를 보이고 있음을 알 수 있다. 결론적으로, 국제이해교육을 위한 향후 양국의 지리 교과서는 본 연구자가 제시한 바 있는 국제이해교육의 기본적 틀에 맞추어 구성해 가는 것과 내용면에 있어서도 한국의 경우는 단편 지식위주의 서술에서 탈피해야 할 것이며, 일본의 경우는 6차 개정에서 많은 진전을 엿볼 수 있지만 자국위주 및 자국우월주의적 서술로부터의 탈피가 필요하다고 생각한다.

  • PDF

빅데이터와 사회연결망 기법을 이용한 '노인 이미지' 분석 ('Elderly image' Analysis Using Big Data and Social Networking Techniques)

  • 한선보;이현심
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.253-263
    • /
    • 2016
  • 빅데이터와 사회연결망 분석기법을 이용하여 사회적 이슈인 '노인 이미지'를 분석 하였다. '노인' 키워드를 입력하여 텍스트마이닝 기법으로 추출된 단어를 분석한 결과 대중의 트렌드를 대표하는 카페, 블로그 등의 매체를 통해 본 노인 이미지는 '어르신'이라는 단어를 가장 많이 사용하고 있었다. 상위 10위 빈도수를 보인 단어를 이용하여 노인의 이미지를 표현하면, "노인은 사회의 존경을 받는 어르신이며 돈을 벌기위해 자격증을 따려고 하고 건강을 챙기며 고령에도 불구하고 100세까지 건강하게 일을 하기를 원하는 어르신"으로 정리되었다. 본 연구는 방대한 양의 데이터를 수집하여 이를 사회연결망 기법으로 분석함으로써 사회적 담론을 포함한 거시적 수준의 '노인 이미지' 분석을 통해 기존의 분석방법과 차별화하고자 하였다. 대중이 느끼는 노인에 대한 이미지가 '어르신'으로 긍정적으로 표현되는 것을 볼 때, 현재 추진하는 노인정책의 방향이 바람직한 방향으로 평가 받고 있다고 할 수 있으며, 한편으로는 그렇게 평가받기를 원하는 대중의 '욕구'를 느낄 수 있었다. 따라서 향후에 적용할 노인 정책 방향은, 노인들이 사회적 역할을 감당하여 사회에서 '필요한 존재'로 인식될 수 있도록 하는 정책이 우선되어야 한다. 또한 건강을 유지하고 활동할 수 있는 일자리 창출과 복지, 소외에 대한 대책 등의 우선순위가 반영된 노인 정책을 추진할 것을 제언하였다.

텍스트 마이닝에 기반한 U-City 서비스 이슈 및 동향분석 - 네트워크분석 및 정보량계측기법을 활용하여 - (Study on U-City Service Issue and Trends based Text Mining - Using the Network Analysis and Information Measure Method -)

  • 정다운;유지송;이미숙;신동빈
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.35-44
    • /
    • 2015
  • 최근 정부는 U-City 활성화를 위한 발전전략을 통해 시민들이 체감하는 서비스를 발굴 및 제공하는 것을 목표로 하고 있다. 이에 본 연구는 신문기사 중 U-City 서비스관련 기사를 대상으로 시사분석을 통해 서비스 이슈와 동향을 분석하여 시민체감형 서비스 추진방향을 모색하는데 목적이 있다. 분석을 위해 2009년부터 2014년까지 수집된 723개 신문기사는 전처리과정을 거쳐 키워드 빈도분석을 실시했으며, 빈도분석 결과를 바탕으로 네트워크 분석과 정보계측기법을 활용했다. 네트워크 분석결과 연결 중심성, 매개 중심성, 근접 중심성이 높은 키워드는 정보, IT, 환경, 기술, 센터 순으로 나타났다. 5개의 키워드는 지난 6년 동안 U-City를 추진하는데 있어 중요한 요소였다는 것을 알 수 있다. 정보계측기법결과 기존에 추진된 U-City는 인프라 구축에 중심을 뒀으며, 공공중심의 서비스를 제공했다는 동향을 파악할 수 있었다. 2009년은 관광, 2010년은 방범 방재, 2011년은 시설물 관리, 2012년은 행정, 2013년 2014년은 시설물 관리 분야를 중심적으로 서비스를 개발했다. 이에 기존에 구축된 인프라를 기반으로 시민체감도가 높은 서비스분야의 발굴 및 제공이 필요하다는 시사점을 도출하였다. 본 연구는 추후 U-City를 추진하는 지자체의 계획수립에 참고적인 역할을 할 수 있을 것으로 기대된다.

'정원'의 시대적 정의에 관한 연구 - 문헌연구와 빅데이터를 활용한 키워드 분석을 중심으로- (A Study on the Contemporary Definition of 'GARDEN' - Keyword Analysis used Literature Research and Big Data -)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제44권5호
    • /
    • pp.1-11
    • /
    • 2016
  • 최근 정원과 정원설계에 대한 사회적 관심이 급증하고 있다. 하지만 '정원'이라는 용어의 사용범위가 엄청나게 넓고 복잡하며, 그에 따른 정원에 관한 개념 정립에 대한 연구는 거의 이루어지지 않고 있다. 따라서, 본 연구에서는 광범위한 문헌연구와 빅데이터 분석을 통해 정원의 시대적 의미를 파악하고, 그 변화 패턴을 설명하고자 하였다. 과거 정원은 내 집 마당과 뜰과 같이 사적인 영역부터 집 밖의 들까지 광범위하였지만, 경제개발 이후 주거환경이 변하여 주로 사적인 영역에 정원이 조성되면서 범위가 축소되었다. 또, 자연과 사람의 상호작용을 위한 공간으로서 역할을 하는, 정원과 성격이 비슷한 도시공원의 도입으로 인해 정원과 공원의 경계가 모호해지고, 정원의 개념에 혼란이 시작되었다. 결국 정원은 인간을 대상으로 하고, 정원의 정의는 자연과학, 사회학 및 문화학 등 여러 분야의 총합으로 다양하게 이해될 수밖에 없다. 정원의 시대적 정의에 대해 논의하는 것은 정원의 개념적 범위를 파악하여 정원과 관련된 연구에 시사점을 줄 수 있으며, 이 연구에 사용된 빅데이터를 활용한 연구는 다른 유사한 연구, 특히 조경분야의 의미론 연구의 방법으로 기여할 수 있다.

미 연준 통화정책방향 의결문의 시그널링 효과 분석 (An analysis of the signaling effect of FOMC statements)

  • 우신욱;장영재
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.321-334
    • /
    • 2020
  • 최근 미 연준이 정책금리 인하를 결정하면서 향후 통화정책 운용방향에 관해 관심이 고조되고 있다. 과거 금리동결 시점이나 동결기간 중, 그리고 인상이나 인하 시점이 다가왔을 때 통화정책 의결문의 표현을 살펴보면 단어 선택의 변화 등을 통해 시장과 꾸준하게 커뮤니케이션해 왔었다는 것을 알 수 있다. 하지만 이렇게 의결문의 표현을 문맥을 통해 분석하는 방법이 다소 주관적이고 정성적인 분석에 그칠 수 있다는 비판이 있다. 이런 점을 고려하여 Woo와 Chang (2016)에서는 데이터마이닝 기법 중 하나인 텍스트마이닝 방법을 통해 의결문 분석 과정을 보완할 수 있는 방법을 제안한 바 있다. 본 논문에서는 선행 연구 결과를 토대로 미 연준의 통화정책 의결문의 정책 시그널링 효과를 평가해 보았다. 의결문의 특성을 텍스트마이닝 관점에서 분석하고 의결문 간 표현의 변화를 포착하여 향후 정책 기조 변화를 예측하고자 하였다. 이를 위해 대표적인 데이터마이닝 기법인 의사결정나무모형과 신경망모형을 사용하였다. 분석 결과, 대체로 의결문 간 비유사성의 변화가 향후 정책 변화를 효과적으로 예측할 수 있는 것으로 평가되었으며, 그동안 미 연준이 의결문을 통해 체계적으로 정책 시그널링을 실시해 온 결과로 판단할 수 있다.

토픽모델링을 활용한 국내외 수학교육 연구 동향 비교 연구 (A comparative study of domestic and international research trends of mathematics education through topic modeling)

  • 신동조
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제59권1호
    • /
    • pp.63-80
    • /
    • 2020
  • 본 연구는 2000년부터 2019년까지 7종의 KCI 등재지에 게재된 3,114편의 수학교육 논문와 5종의 SSCI 등재지에 게재된 1,636편의 수학교육 논문의 연구 동향을 텍스트 마이닝 기술의 하나인 토픽모델링을 사용하여 비교·분석하였다. 연구 결과, 국내외 수학교육 연구는 16개의 유사한 주제와 7개의 상이한 주제로 분류할 수 있었다. 연구 결과, 예비교사와 관련된 주제는 국내와 해외 수학교육 연구에서 모두 높은 비중을 차지하고 있는 연구주제였다. 현직교사 재교육에 관한 연구주제는 국내 연구에서는 하나의 독립된 주제로 나타나지 않았지만, 해외 연구에서 많은 관심을 받는 주제로 나타났다. 해외 수학교육 연구에 비해 국내에서는 수학적 역량에 관한 연구의 관심이 높았지만, 이는 문제해결역량과 창의·융합역량에 치중되는 경향이 있었다. 반면, 해외 수학교육에서는 정체성과 공정성에 관한 연구가 강조되었다.

토핑 모델링을 활용한 동해안 관광의 변화 분석 (The Analysis of Changes in East Coast Tourism using Topic Modeling)

  • 정은희
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권6호
    • /
    • pp.489-495
    • /
    • 2020
  • 4차혁명이 진행되고 있는 초연결사회에선 다양한 IT기기를 통해 데이터량이 증가하고 있고, 이렇게 생산된 데이터를 분석하여 새로운 가치를 창출 할 수 있다. 본 연구에서는 빅카인즈에서 2017년부터 2019년까지 중앙지, 경제지, 지역조합지, 주요방송사 등에서 "(동해안 관광 또는 동해안 여행) 그리고 강원도"라는 키워드로 기사를 총 1,526건을 수집하였다. 수집된 1,526건의 기사를 분석하기 위해 R언어로 구현된 LDA 알고리즘을 이용하여 토픽 모델링을 수행하였다. 2017년부터 2019년까지 각각의 년도별 키워드를 추출하고, 각 년도별로 빈도수가 높은 키워드를 분류하여 비교하였다. Log Likelihood와 Perplexity를 이용하여 최적의 토픽 수를 8로 설정한 후, 깁스 샘플링 방법으로 8가지의 토픽을 추론하였다. 추론된 토픽들은 강릉과 해변, 고성과 금강산, KTX와 동해북부선, 주말바다여행, 속초와 통일전망대, 양양과 서핑, 체험관광, 교통망 인프라이다. 추론된 8개의 토픽의 비중을 이용해 동해안 관광에 대한 기사들의 변화를 분석하였다. 그 결과, 통일전망대와 금강산의 비중은 큰 변화가 없는 것으로 나타났고, KTX와 체험관광의 비중은 증가하였고, 그 외의 토픽들의 비중은 2017년에 비해 2018년에 감소하였다. 2019년에는 KTX와 체험관광의 비중은 감소하였으나, 나머지 토픽들의 비중은 큰 변화가 없는 것으로 나타났다.

국가핵심기술 관계망 구축을 통한 연관정보 분석연구: 디스플레이 기술을 중심으로 (A Study on the Analysis of Related Information through the Establishment of the National Core Technology Network: Focused on Display Technology)

  • 박세희;윤원석;장항배
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.123-141
    • /
    • 2021
  • 경제 구조의 기술 의존성이 강해져 국가핵심기술의 중요성은 더욱 대두되고 있다. 하지만 기술 자체적 특성으로 인해 연관 범위가 추상적이고 국가핵심기술 고유의 특성상 정보공개가 제한적이기 때문에 보호대상이 될 기술의 범위를 정하는 것에 어려움이 있다. 이를 해결하기 위해 국가핵심기술과 연관성이 높은 중요 기술을 판별하는 데에 최적화 된 문헌 종류와 분석 기법을 제안하였다. 디스플레이 분야 국가핵심기술 키워드로 수집한 네 개 문헌종류(뉴스, 논문, 보고서, 특허) 데이터에 빅데이터 분석의 텍스트 마이닝 분석기법인 TF-IDF와 LDA 토픽 모델링을 적용하는 파일럿 테스트를 진행하였다. 그 결과로 특허 데이터에 LDA 토픽 모델링을 적용한 결과가 국가핵심기술과 연관성이 높은 중요기술을 추출하였다. OLED, 마이크로LED를 포함하여 디스플레이 전후방산업에 관련된 중요 기술을 판별 할 수 있었으며 이 결과를 관계망으로 시각화하여 국가핵심기술과 연관된 중요 기술의 범위를 명확히 하였다. 본 연구를 통해 기술이 가지는 연관범위의 모호성을 보다 명확히 하였으며, 국가핵심기술이 가지는 제한적인 정보공개 특성을 극복할 수 있다.