• 제목/요약/키워드: administration information dataset

검색결과 83건 처리시간 0.021초

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

효과적 이모션마이닝을 위한 속성선택 방법에 관한 연구 (Exploring Feature Selection Methods for Effective Emotion Mining)

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권3호
    • /
    • pp.107-117
    • /
    • 2019
  • 블로그, 소셜 미디어 등의 발달로 인해 점점 더 많은 사람들이 본인의 의견이나 감정을 표현하기 위해 온라인상에서 텍스트 문장을 작성한다. 그리고 이같은 온라인 텍스트 문장속에 숨겨져 있는 긍정 또는 부정등의 감성을 찾아내는 연구분야를 감성분석 이라고 한다. 그중에서도 이모션 마이닝은 사람들의 구체적인 이모션을 찾아내는데 초점을 맞춘 연구분야이다. 본 연구에서는 속성선택 방법과 단일 및 앙상블 분류기를 조합하여 효과적인 이모션 마이닝 예측모델을 제시하고자 한다. 이를 위해 두가지 대표적인 오픈 데이터인 Tweet와 SemEval2007 데이터를 이용하여 TF-IDF를 계산하고 백 오브 워즈(BOW: bag-of-words) 형태로 속성 셋을 구성하였다. 그리고 효과적인 이모션 마이닝이 될 수 있는 최적의 속성을 선택하기 위하여 상관관계 기반 속성선택(CFS), 정보획득 속성선택 (IG), 그리고 ReliefF 등 세가지 속성선택 방법을 적용하였다. 선택된 속성을 이용하여 아홉가지 분류기 모델로 이모션 마이닝의 정확도를 비교하였다. 실험 결과, Tweet 데이터는 의사결정나무(DT)가 CFS, IG, ReliefF에 의한 속성을 이용할 경우 정확도가 상승했고, 랜덤서브스페이스(RS)는 CFS, IG에 선택된 속성을 사용할 경우 정확도가 상승했다. SemEval2007 데이터는 ReliefF에 의해 선택된 속성으로 로지스틱 회귀분석(LR)을 적용하였을 때 정확도가 상승했고, 나이브 베이지안 네트워크(NBN)은 CFS, IG에 의한 속성을 사용할 경우 정확도가 상승하였다.

기상레이더 강수 합성데이터를 활용한 심층신경망 기반 초단기 강수예측 기술 연구 (Short-Term Precipitation Forecasting based on Deep Neural Network with Synthetic Weather Radar Data)

  • 안소정;최윤;손명재;김광호;정성화;박영연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.43-45
    • /
    • 2021
  • 초단기 강수예측 시스템은 단시간 발생하는 집중호우와 같은 위험기상에 대응하기 위해 사회·경제적으로 중요하다. 최근 국내·외에서 심층신경망을 활용한 초단기 강수예측 연구가 활발히 진행되고 있다. 심층신경망을 이용한 강수예측 모델은 훈련 데이터를 만들 때 기상데이터의 구조와 종류가 복잡하고 방대하므로 기상학적 이해를 바탕으로 복잡한 전처리 과정이 필요하다. 또한, 비선형적인 패턴의 강수 현상을 예측하기 위하여 기상의 상호작용에 대한 이해를 바탕으로 입력 데이터를 구성해야 한다. 따라서 본 연구에서는 다음과 같은 접근법을 제안하고자 한다. i) 기상레이더 합성 강수장과 강수발달에 영향을 줄 수 있는 주요 인자(레이더, 지형, 온도, 등)를 훈련 데이터 구축을 위해 패턴 분석에 적합한 형태로 정제하고 이를 구조화하여 통합한다. ii) 합성곱 신경망과 합성곱 장단기 기억 신경망을 접목하여 초단기 예측 강수장을 산출한다. 2020년 강수 사례를 이용하여 제안한 모델의 정확성을 검증하였다. 제안한 모델은 비선형적인 패턴의 강수 현상을 잘 모의하였고, 강수의 규모 및 강도에 대한 예측성능이 향상되었다. 이는 강수를 동반한 초단기 위험기상의 방재에 활용할 수 있을 것으로 기대된다.

  • PDF

유전자 알고리즘을 이용한 서울시 군집화 최적 변수 선정 (Selection of Optimal Variables for Clustering of Seoul using Genetic Algorithm)

  • 김형진;정재훈;이정빈;김상민;허준
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.175-181
    • /
    • 2014
  • 정부 3.0이라는 새로운 정부운영 계획과 함께 다양한 공공정보를 민간이 활용할 수 있게 되었으며, 특히 서울은 이러한 행정정보 공개 및 활용을 선도하고 있다. 공개된 행정정보를 통해 각 지역을 특징짓는 행정요소를 발견할 경우, 각종 행정정책을 위한 의사결정 수단에 반영할 수 있을 뿐만 아니라 특정 지역의 고객 특성을 파악하여 특화된 서비스나 상품을 판매하는 마케팅 수단으로도 사용할 수 있을 것으로 사료된다. 하지만, 방대한 양의 행정자료로부터 각 군집의 특성을 명확히 구분할 수 있는 최적의 조합을 찾는 과정은 조합최적화 문제로서 상당한 연산량을 요구한다. 본 연구에서는 서울시에서 제공하는 다차원 행정자료로부터 서울시를 대표하는 문화 산업의 중심인 서초구, 강남구, 송파구 등의 강남 3구를 다른 지역과 효과적으로 구분하는 행정요인를 찾고자 하였다. 방대한 양의 행정정보로부터 두 군집간의 차이점을 극대화하는 요인을 선별하기 위한 최적화 방법으로 유전자 알고리즘을 이용하였으며, 군집간 차이를 계산하는 척도로는 Dunn 지수를 이용하였다. 또한 유전자 알고리즘의 연산속도의 향상을 위해 Microsoft Azure에서 제공하는 cloud computing을 이용한 분산처리를 수행하였다. 자료로는 통계청으로 부터 취득한 총 718개의 행정자료를 이용하였으며, 그 중 28개가 최적 변수로 선정되었다. 검증을 위해 선정된 28개의 변수를 입력값으로 Ward의 최소분산법 및 K-means 알고리즘을 통한 군집화를 수행한 결과 두 경우 모두 강남 3구가 다른 지역으로부터 효과적으로 분류됨을 확인하였다.

ID3 알고리즘 기반의 귀납적 추론을 활용한 모바일 OS의 성공과 실패에 대한 연구 (Research on Success and Failure of Mobile operating system using inductive learning based on ID3 algorithm)

  • 진동수
    • 한국정보통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.258-264
    • /
    • 2015
  • 본 연구에서는 최초로 출현한 모바일 운영시스템인 Palm OS을 시작으로 주요 모바일 운영 시스템의 성공과 실패에 영향을 미치는 요인들이 무엇인지 제시하였다. 이를 위하여 성공한 사례와 실패한 사례에 대한 분석을 실시하고, 성공과 실패에 영향을 미치는 주요 변수를 도출한 후 이를 기반으로 ID 3 알고리즘 기반의 귀납적 분석을 실시하였다. 이를 통하여 모바일 운영 시스템의 성공과 실패에 있어서의 규칙들을 도출하여, 모바일 운영 시스템이 상업적으로 성공하는데 혁신성과 글로벌화 관점에서 전략적 시사점으로 제시하였다.

Deep Learning for Weeds' Growth Point Detection based on U-Net

  • Arsa, Dewa Made Sri;Lee, Jonghoon;Won, Okjae;Kim, Hyongsuk
    • 스마트미디어저널
    • /
    • 제11권7호
    • /
    • pp.94-103
    • /
    • 2022
  • Weeds bring disadvantages to crops since they can damage them, and a clean treatment with less pollution and contamination should be developed. Artificial intelligence gives new hope to agriculture to achieve smart farming. This study delivers an automated weeds growth point detection using deep learning. This study proposes a combination of semantic graphics for generating data annotation and U-Net with pre-trained deep learning as a backbone for locating the growth point of the weeds on the given field scene. The dataset was collected from an actual field. We measured the intersection over union, f1-score, precision, and recall to evaluate our method. Moreover, Mobilenet V2 was chosen as the backbone and compared with Resnet 34. The results showed that the proposed method was accurate enough to detect the growth point and handle the brightness variation. The best performance was achieved by Mobilenet V2 as a backbone with IoU 96.81%, precision 97.77%, recall 98.97%, and f1-score 97.30%.

The Impact of Autonomous Virtual Work Environments on Job Satisfaction and Organizational Effectiveness

  • Eun Seo Park;Sung-Byung Yang;Arum Park
    • Asia pacific journal of information systems
    • /
    • 제33권4호
    • /
    • pp.1043-1057
    • /
    • 2023
  • The objective of this study is to explore the perceptions of justice regarding the implementation of flexible work arrangements, as well as to analyze the effects of such arrangements on job satisfaction and organizational effectiveness. The present study posits three key aspects, namely distributive justice, procedural justice, and interactional justice, which are hypothesized to influence individuals' impression of justice in relation to flexible work systems. To investigate the influence of job types on an R&D organization, specifically comparing R&D employees and office management employees, a dataset of 190 R&D employees and 50 office management employees was collected. The findings of the investigation provide empirical evidence that distributive justice has a significant impact on the level of job satisfaction among employees in both research and development (R&D) and office administration roles. Moreover, the influence of work satisfaction on organizational performance is noteworthy, particularly with regard to factors such as job dedication, organizational citizenship behavior, and knowledge sharing. The aforementioned findings offer significant insights for research and development (R&D) firms that have incorporated flexible work arrangements. These insights underscore the significance of emphasizing specific justice perceptions in order to augment job satisfaction and overall performance within the organization.

고객센터 상담내용 분석을 통한 이탈 요인에 관한 실증 연구 (An Empirical Study on Key Factors Affecting Churn Behavior with the Voices of Contact Center Customers)

  • 장문경;유병준;이재환
    • 한국전자거래학회지
    • /
    • 제22권4호
    • /
    • pp.141-158
    • /
    • 2017
  • 최근 고객들은 다양한 IT 채널을 이용해 의견을 자유롭게 표현할 수 있게 되었다. 이에 따라 기업은 고객들의 의견 중 특히 부정적인 의견을 효율적으로 관리하기 위해 큰 노력을 기울이고 있다. 기존의 연구들은 주로 고객의 불만 제기 횟수나 상담시간 등의 양적 데이터를 이용하여 고객 이탈 방지에 관해 연구하였으나, 고객이 실제로 언급한 불만 내용을 분석한 연구는 한정적이다. 따라서 본 연구는 고객 불만 데이터를 중심으로 고객 이탈에 영향을 주는 요인들을 알아보기 위해 이탈-항의 이론(Exit-voice theory)을 바탕으로 보안업체의 고객센터로 접수된 46,235명 고객의 268,364건의 상담내용을 양적인 측면뿐이 아니라 질적인 측면에서도 실증 분석하였다. 감성 분석 방법을 활용하여 상담내용의 감성값을 도출하고, 도출된 감성 사전을 이용해 고객의 만족 여부를 명시적으로 알기 어려운 상담내용의 고객 만족도를 예측하였다. 마지막으로 이 감성 값이 고객의 이탈에 미치는 영향을 로지스틱 회귀분석을 통해 분석하였다. 분석 결과 고객이 만족 여부를 명확히 응답하지 않은 경우에도 감성 분석을 이용해 계산된 각 감성값이 고객 이탈에 서로 다른 영향을 준다는 것을 알 수 있었다. 향후 본 연구에서 제시한 감성 분석을 통한 만족도 예측방법으로 고객의 숨은 의도를 효과적으로 파악하여 고객 불만 관리에 실무적으로 활용될 수 있을 것으로 기대한다.

Empirical Study for Causal Relationship between Weather and e-Commerce Purchase Behavior

  • Hyun-Jin Yeo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.155-160
    • /
    • 2024
  • 기온, 습도, 풍속, 기압과 같은 기상정보는 식중독, 불편함과 같은 생활 요소들에 영향을 미치는 것으로 연구되었다. 이에 따라 한국 기상청은 '생활 산업 기상정보서비스'나 '위기탈출 안전 날씨', '피크닉 지수'와 같은 일상과 날씨가 연관된 정보를 제공하고 있다. 이러한 날씨-생활 영향력은 오프라인 쇼핑행위에서도 나타나는데, 특히 대형마트의 경우 여가생활 장소 요소 역시 가지고 있어 날씨에 따른 영향을 보이고 있다. 하지만 온라인 쇼핑은 오프라인 쇼핑과 같은 물리적 요소가 없기에 다른 모습을 보일 것이다. 기존 연구들은 대부분 온라인 커머스에 미치는 기존 마케팅 요소들의 심리적 요인들을 사용했지만, 본 연구는 심리적 요소들에 영향을 미치는 날씨 요소들을 기상청 데이터 셋을 사용하여 연관성을 분석하였다. 본 연구는 A온라인 쇼핑몰 고객에 대한 1,033개의 유효 설문과 구조공분산 분석을 통해 날씨 요소가 온라인 구매 의도에 미치는 영향에 대해 살펴본다. 결과적으로 온라인 쇼핑 구매 의도는 기온, 습도에 인과 관계를 보였다.

특허의 기술이전 활성화를 위한 소셜 태깅기반 지적재산권 추천플랫폼 (Social Tagging-based Recommendation Platform for Patented Technology Transfer)

  • 박윤주
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내에서 출원되는 특허건수는 매년 증가하고 있으나, 이러한 특허들 중 상당수는 활용되지 못하고 사장되고 있다. 2012년 국정감사 자료에 따르면, 우리나라 대학 및 공공연구기관이 보유한 특허의 약 73%가 사회적 가치창출로 연결되지 못하는 휴면특허라고 한다. 즉, 대학/연구소 또는 사업화가 어려운 개인이 소유하고 있는 특허가, 이를 필요로 하는 수요기업에 성공적으로 기술 이전되지 못하는 것을 휴면특허 증가의 주요 문제점으로 생각할 수 있다. 본 연구는 급격히 축적되는 방대한 특허 자원들 속에서, 기업의 관심분야에 적합한 지식재산을, 보다 쉽고, 효과적으로 선별할 수 있도록 하는 소셜태깅 기반의 특허 추천플랫폼을 제안한다. 제안된 시스템은 기존 특허들로부터 핵심적인 내용 및 기술 분야를 추출하여 초기 추천을 수행하고, 이후 사용자들의 태그정보가 축적되면, 사회적 지식 (social knowledge)을 추천에 함께 반영하게 된다. 이러한 연구에는 특허청에서 운영하고 있는 KIPRIS(Korea Industrial Property Rights Information Service) 시스템에서 실제 특허자료 총 1638건을 수집한 후, 현재 특허 데이터에는 존재하지 않는 가상의 태그 정보를 추가한 반가상(semi-virtual) 데이터를 구성하여 활용하였다. 제안된 시스템은 프로그래밍 언어 JAVA를 활용하여 핵심 알고리즘을 구현하였으며, 그래픽사용자 인터페이스(Graphic User Interface)에 대한 프로토타입의 설계를 수행하였다. 또한, 시나리오테스트 방식으로 시스템의 운영타당성 및 추천 효과성을 확인하였다.