• 제목/요약/키워드: 시간 마이닝

검색결과 401건 처리시간 0.024초

항공산업 미래유망분야 선정을 위한 텍스트 마이닝 기반의 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for the Aviation Industry)

  • 김현정;조남옥;신경식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.65-82
    • /
    • 2015
  • 최근 경제적 사회적 부가가치를 창출할 수 있는 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위해 미래 핵심 이슈를 발견하고 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 기존에는 미래의 핵심 기술이나 이슈를 발견하고 트렌드 분석을 통해 미래유망분야를 선정하는 연구를 위해 문헌 조사 또는 전문가 평가와 같은 정성적 연구방법이 사용되어 왔다. 그러나 이 연구방법은 대량의 정보로부터 결과를 도출하는데 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 가치가 반영될 가능성이 존재한다. 이와 같은 한계점을 보완하고자 최근 국토교통, 안전, 정보통신기술 등 다양한 분야에서 미래유망분야를 선정하기 위하여 정성적 연구방법에 텍스트 마이닝과 같은 정량적 연구방법을 상호 보완적으로 활용하는 방식으로 트렌드 분석을 수행하는 연구 방법론의 패러다임 변화가 시도되고 있다. 본 연구는 항공산업 전반적인 분야에 빅데이터 분석 방법인 텍스트 마이닝 기법을 적용하여 항공 분야의 연구동향을 파악하고 미래유망분야를 전망하였다. 텍스트 마이닝 기법 중하나인 토픽 분석을 이용하여 항공산업 전반적인 분야의 문서 집합 내 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 분석 결과 항공산업의 미래유망분야로 항공안전정책, 항공운임(저가항공), 그리고 친환경 고연비 연료가 도출되었다. 본 연구결과는 분석 대상을 논문에 한정하여 수행하였다는 한계점이 존재하나, 항공산업 분야의 핵심 이슈를 도출하기 위하여 텍스트 마이닝 기반의 트렌드 분석에 대한 활용가능성을 제시하고, 미래유망분야를 선정하기 위한 정량적인 분석 방법론의 전형을 마련하였다는 점에서 의의가 있다.

빅데이터 마이닝에 의한 공시지가 민원의 시공간적 분석모델 제시 (A Suggestion for Spatiotemporal Analysis Model of Complaints on Officially Assessed Land Price by Big Data Mining)

  • 조태인;최병길;나영우;문영섭;김세훈
    • 지적과 국토정보
    • /
    • 제48권2호
    • /
    • pp.79-98
    • /
    • 2018
  • 이 연구는 빅데이터 마이닝에 기초하여 공시지가 민원에 대한 시공간적 특성을 분석하는 모델을 제시하는 데 목적이 있다. 특히 이 연구는 행정 민원이 제기되는 원인을 학술적 요인보다는 시공간적 측면에서 찾았고, 그러한 민원 발생의 경향을 시공간적으로 모니터링하는 모델을 제시하였다. 2006년부터 2015년까지 인천광역시 중구의 공시지가에 대한 6,481개의 민원정보가 시간 및 공간적 특성을 고려해 수집되었고 분석을 위해 사용되었다. 텍스트 마이닝 기법을 이용해 주요 키워드의 빈도수를 도출했으며, 소셜 네트워크 분석을 통해 주요 키워드 간의 관계를 분석하였다. 키워드의 가중치와 연관되는 TF(term frequency)와 TF-IDF(term frequency-inverse document frequency)를 산출함으로써, 공시지가의 민원 발생에 대한 주요 키워드를 식별하였다. 마지막으로 Getis-Ord의 $Gi^*$의 통계량에 기초한 핫스팟 분석을 통해 공시지가 민원의 시공간적 특성을 분석하였다. 연구 결과, 공시지가 민원의 특성은 시공간적으로 연계된 군집 형태를 형성하면서 변화하고 있음을 알 수 있었다. 텍스트 마이닝과 소셜 네트워크 분석 방법을 이용하여 자연어 기반의 공시지가 민원에 대한 발생 원인을 정량적으로 규명할 수 있음을 알 수 있었으며, 키워드 가중치인 단어 빈도(TF) 및 단어 빈도와 역문서 빈도의 조합값(TF-IDF)의 상대적인 차이가 있어 시공간적인 민원 특성을 분석하기 위한 주요 설명변수로 활용될 수 있음을 알 수 있었다.

프로세스 마이닝을 이용한 군수품 계약업무 분석 : 공군 군수사 계약업무를 중심으로 (Analysis of Munitions Contract Work Using Process Mining)

  • 주용선;김수환
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.41-59
    • /
    • 2022
  • 군수물자의 적기 조달은 군의 작전능력 유지를 위해서 필수적이며, 계약업무는 적기 조달을 위한 첫 단추라고 할 수 있다. 또한 신속한 계약체결은 수요자의 여유로운 납기설정을 가능케 하며, 예산 집행의 가능성을 높여주기 때문에 예산의 조기집행과 이·불용 방지를 위해서도 계약 프로세스 개선이 필수적이다. 최근 빅데이터를 이용한 연구가 여러 분야에서 활발히 진행되고 있으며, 빅데이터를 이용한 프로세스 분석 및 개선 기법인 프로세스 마이닝 역시 민간에서 널리 활용되고 있다. 하지만 군 내 계약업무에 대한 분석은 업무 담당자의 경험과 단편적인 정보를 활용한 이·불용 문제사례별 원인 파악 및 대응적 모색과 같은 개별적 분석수준에 그치고 있다. 본 연구는 계약 프로세스 개선을 위해 공군 군수사령부 재정처가 2019년 11월부터 약 1년간 직접 계약한 총 560건의 계약업무에 관한 데이터를 가지고 프로세스 마이닝 기법을 이용하여 분석하였다. 분산된 데이터를 종합하여 프로세스 맵을 도출하고, 프로세스의 흐름, 수행시간 분석, 병목 분석 및 추가 세부분석을 실시했다. 분석결과 다수 계약 건에서 의뢰 후 재검토/수정이 반복 발생하고 있음을 발견할 수 있었다. 반복적인 재검토/수정은 원가계산 완료까지의 소요일수 지연에 크게 영향을 미치고 있으며, 이는 병목 지점 시각화를 통해서도 명확하게 드러났다. 재검토/수정은 계약의뢰가 많은 상위 5개 부서에서 60% 이상 발생하고, 의뢰가 집중되는 상반기에 주로 발생하는데 이는 소요부서의 계약의뢰 전 면밀한 사전검토가 필요함을 의미한다. 그리고 재정처의 계약업무는 법령에 따른 절차대로 수행되고 있었으나, 일부 업무의 순서조정이 필요함을 알 수 있었다. 본 연구는 군 내 계약업무 분석에 프로세스 마이닝을 이용한 첫 사례이다. 이를 기반으로 프로세스 마이닝을 군대 내 다양한 업무에 적용하기 위한 연구가 더욱 수행된다면, 각종 업무의 효율화를 이끌어 낼 수 있을 것으로 기대한다.

시뮬레이션을 이용한 외래프로세스 개선방안에 관한 연구 (A Study on the Improvement of Outpatient Process Using Simulation)

  • 최현숙;지은희;강성홍
    • 디지털융복합연구
    • /
    • 제12권8호
    • /
    • pp.377-387
    • /
    • 2014
  • 본 연구는 시뮬레이션을 이용하여 외래프로세스를 개선하여 기관 운영의 효율성을 높이고자 수행되었다. 3가지의 시나리오를 설정하여 시뮬레이션 분석을 수행하였으며 외래환자 전체 체류시간, 대기시간, 이동시간, 진료시간, 직원 활용도 지표를 비교하여 시나리오에 따른 외래프로세스의 효율성을 평가하였다. 병원의 진료자료를 수집하여 통계도구와 프로세스 마이닝 도구를 이용하여 분석하였다. 그리고 시뮬레이션 툴인 PIOS를 이용하여 모형의 타당성은 t-test로 검증하였다. 시뮬레이션 분석 결과, 센터제로 운영하는 경우의 외래프로세스가 가장 효율성이 높은 것으로 나타났다. 이를 볼 때 외래환자에 대해서는 센터제 형태로 운영되는 것이 기관의 효율성을 높이는 방안이라는 것을 확인할 수 있었다. 본 연구를 통하여 시뮬레이션이 최적의 외래프로세스를 선정하는데 활용될 수 있는 방법이라는 것을 확인할 수 있었다. 시뮬레이션을 이용하면 과거 경험, 감정, 직관에 의존하는 기존의 보건의료 관리 기법에 비해 효율적인 의사 결정을 지원하는 방법이라는 것을 알 수 있다. 따라서 본 연구에서 제시한 연구 모델은 보건 의료 시스템 상에 다양한 활용이 가능할 것으로 보인다.

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석 (Outdoor Healing Places Perception Analysis Using Named Entity Recognition of Social Media Big Data)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획·설계·디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상·형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.

액티비티별 특징 정규화를 적용한 LSTM 기반 비즈니스 프로세스 잔여시간 예측 모델 (LSTM-based Business Process Remaining Time Prediction Model Featured in Activity-centric Normalization Techniques)

  • 함성훈;안현;김광훈
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.83-92
    • /
    • 2020
  • 최근에 많은 기업 및 조직들이 비즈니스 프로세스 모델의 효율적 운용을 위해 예측적 프로세스 모니터링에 관심이 높아지고 있다. 기존의 프로세스 모니터링은 특정 프로세스 인스턴스의 경과된 실행상태에 초점을 두었다. 반면, 예측적 프로세스 모니터링은 특정 프로세스 인스턴스의 미래의 실행상태에 대한 예측에 초점을 둔다. 본 논문에서는 예측적 프로세스 모니터링 기능 중 하나인 비즈니스 프로세스 인스턴스 실행 잔여시간 예측기능을 구현한다. 잔여시간을 효과적으로 모델링하기 위해 액티비티별 속성에 따른 시간특징 값 분포 차이를 고려하여 액티비티별 특징 정규화를 제안하고 예측모델에 적용한다. 본 논문에서 제안된 모델의 예측성능 우수성을 입증하기 위해서 4TU.Centre for Research Data에서 제공하는 실제 기업의 이벤트 로그 데이터를 통해 선행연구들과 비교평가 한다.

생의학 학술 문헌의 불확실성 기반 지식 동향 분석에 관한 연구 (Knowledge Trend Analysis of Uncertainty in Biomedical Scientific Literature)

  • 허고은;송민
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.175-199
    • /
    • 2019
  • 불확실성이란 정보의 합의나 현존하는 지식 부족으로 인해 명제의 지식이 불완전한 상태를 의미한다. 과학적 지식의 불확실성을 연구하는 학술문헌의 양은 시간이 흐름에 따라 기하급수적으로 증가하고 있으며, 이에 따라 새로운 지식이 발견되고 연구가 발전하고 있다. 이처럼 시간의 흐름은 지식의 불확실성의 패턴을 발견하는데 중요한 요인이 될 수 있음에도 불구하고 기존의 연구들은 불확실성 단어의 단순 출현 빈도를 기반으로 특정 학문 영역에서 불확실성의 특성을 파악해왔다. 따라서, 본 연구에서는 구축한 불확실성 단어를 생의학 영역의 불확실성 연구에 적용하여 시간의 흐름에 따른 불확실성의 변화와 패턴을 파악하고자 한다. 시간의 흐름에 따른 생의학 지식의 패턴을 분석하기 위해 대표 개체 페어, 동사 유형, 대표 개체의 패턴을 살펴보았으며 선형회귀 분석을 통해 유의성 검증을 수행했다. 개체 페어 분석에서는 17건 중 7건의 개체 페어가 유의하게 감소하는 패턴을 보였다. 10개의 대표적인 동사 유형은 모두 시간이 흐름에 따라 유의하게 감소했다. 대표 개체의 연도별 상대적 중요도 분석에서는 유의하게 상승과 하강 패턴을 보이는 개체들의 불확실성 증감을 분석했다.

IoT와 Wearables 기술융합을 위한 특허동향분석 (A Patent Trend Analysis for Technological Convergence of IoT and Wearables)

  • 강지호;김종찬;이준혁;박상성;장동식
    • 한국지능시스템학회논문지
    • /
    • 제25권3호
    • /
    • pp.306-311
    • /
    • 2015
  • 본 연구는 협력적특허분류(CPC)를 활용한 '사물인터넷(IoT)' 과 '웨어러블(wearables)' 의 기술융합동향 분석에 관한 것이다. 국내 도입 분야가 점차 확대되고 있는 CPC는 기존의 국제특허분류(IPC)보다 세분화된 분류를 제공해 기술 특성을 더 세밀하고 정확하게 반영할 수 있어 특허정보 분석 시 활용도를 배가시킬 것으로 기대된다. 아직까지 CPC를 특허정보 분석에 활용한 연구가 드물며, 특허분류코드를 활용해 기술융합현상을 분석한 선행연구들 대부분이 IPC코드를 활용하였다. 본 연구에서는 CPC를 활용하여 wearable IoT 영역의 기술융합동향분석을 실시하였고, 이를 위한 사전분석으로서 각 특허에 할당된 CPC와 IPC를 비교분석하였다. 연관규칙 마이닝 기법을 활용한 CPC 코드분석을 통해 융합이 활발하게 발생하는 기술영역들을 도출하고 시간에 따른 추세변화를 파악하였다.

실시간 검색어 연관 분석을 통한 핵심 이슈 선정 (Selecting a key issue through association analysis of realtime search words)

  • 정민영
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.161-169
    • /
    • 2015
  • 포털 사이트의 실시간 검색어는 현재 관심이 급상승하고 있는 이슈를 보여주기 위해 주로 검색횟수가 많은 순서에 따라 몇 초 간격으로 제공되고 있다. 그렇지만 너무 짧은 시간 내에 순위가 바뀌는 실시간 검색어의 특성 때문에 하루의 핵심 이슈를 비켜가는 문제가 발생한다. 본 논문에서 이러한 문제를 보완하기 위해 검색어들 사이의 연관 분석을 통하여 검색어들이 관련된 핵심 이슈를 도출하는 방법을 제안하고자 한다. 이를 위해 먼저 실시간 검색어를 순위와 상대적 관심도를 기반으로 점수화하여 집단별 기술통계를 통해 최상위 10개의 검색어를 도출한다. 그 다음으로 지지도와 신뢰도를 기반으로 연관 규칙을 추출하고 이를 가시화하는 그래프 결과를 바탕으로 핵심 이슈를 선정한다. 실험 결과는 단일 최상위 실시간 검색어보다 연관분석을 통해 높은 점수로 선정된 핵심 이슈가 더 큰 의미를 갖는다는 것을 보여준다.

상관계수의 안전한 다자간 계산 (Secure Multi-Party Computation of Correlation Coefficients)

  • 홍선경;김상필;임효상;문양세
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.799-809
    • /
    • 2014
  • 본 논문에서는 분산 컴퓨팅 환경에서 데이터 제공자들이 각자 소유한 데이터의 프라이버시는 보호하면서도 피어슨(Pearson) 상관계수와 스피어만(Spearman)의 순위상관계수를 안전하게 계산하는 해결책을 각각 제안한다. 분산 컴퓨팅 환경에서 마이닝(또는 데이터 분석)을 수행하기 위해서는 원본 데이터를 상대방에게 제공해야 한다. 그러나, 원본 데이터는 민감한 정보를 포함하는 경우가 많고, 이때 데이터 제공자(소유자)는 프라이버시 보호를 이유로 정확한 값을 직접 노출하기를 원하지 않는다. 본 논문에서는 분산 컴퓨팅 환경의 데이터 제공자들이 각자 소유한 데이터는 상대방에게 공개하지 않으면서 상관관계를 계산하는 문제, 즉 안전한 상관관계 계산(SCC: Secure Correlation Computation) 문제를 정형적으로 정의한다. 그리고, 임의 행렬 기반 안전한 스칼라 곱을 사용하여 피어슨 상관계수와 순위상관계수에 대한 SCC 문제를 해결하는 방법을 각각 제안한다. 제안한 해결책이 바르게 수행함을 보이기 위해, 정확성과 안전성을 정리로 제시하고 증명한다. 또한, 실험을 통해 제안한 기법이 수행 시간 측면에서도 실용적인 방법임을 보인다.