• 제목/요약/키워드: 비정형자료

검색결과 104건 처리시간 0.033초

기업근로자 경력성공 인식의 다차원성과 차이: 토픽모델링의 적용 (Differences and Multi-dimensionality of the Perception of Career Success among Korean Employees: A Topic Modeling Approach)

  • 이재은;채충일
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.58-71
    • /
    • 2019
  • 이 연구는 우리나라 기업근로자가 인식하는 경력성공의 다차원성과 개인특성에 따른 차이를 토픽모델링 방법을 적용하여 탐색하고자 하는 목적으로 수행되었다. 연구목적을 달성하기 위해 경력성공에 대한 인식을 개방형 설문을 통해 수집하였으며 126명의 기업근로자들의 응답자료를 바탕으로 R 프로그램을 활용하여 분석하였다. 분석결과 한국 근로자의 경력성공 인식에 대한 5가지 토픽이 도출되었다. 구체적으로, 토픽1은 사회적으로 인정받는 직장에 다니는 것(사회적 인정), 토픽 2는 조직 내에서 자신의 업무에 충실하며 견디는 것(조직 내 근속), 토픽 3은 자기 분야에 지식과 노하우를 갖고 전문성을 갖는 것(전문성), 토픽 4는 일한 만큼 경제적 보상과 성과를 얻는 것(경제적 보상), 토픽 5는 일을 통해 보람과 성취감 같은 개인적 의미를 추구하는 것(개인적 의미 추구)으로 나타났다. 또한, 성별, 연령, 학력에 따른 각 토픽별 발현비율 차이가 확인되었다. 이 연구를 통해 경력성공 인식의 다차원성과 개인특성에 따른 경력성공 인식 차이를 확인하였으며, 개방형 설문자료와 같은 비정형 데이터 분석에서 토픽모델링 방법을 활용가능성을 제시하였다.

뉴스 데이터 기반 농업 가뭄 전조 감지 및 확산 분석 (Detection and spread of agricultural drought warning based on news data)

  • 김민진;남원호;양미혜;이지완;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.339-339
    • /
    • 2023
  • 2018년도 연강수량은 1,386.9 mm로 평년 수준의 비가 내렸으나, 7-8월에 발생한 폭염 및 가뭄으로 인해 강원, 전남, 경북, 충남 지역에서 밭작물 중심으로 22,767 ha 피해가 발생하였다. 2019년도 연강수량은 1,171.9 mm로 평년보다 약 10% 적은 수준의 비가 내렸으며, 동일시기에 인천, 강원, 충남 지역에서 논·밭작물 중심으로 3,112 ha 피해가 발생하였다. 기후변화로 인해 강수량이 지역별로 편중되어 국지적 가뭄이 빈발하여 지역별로 가뭄의 영향, 피해, 체감 정도가 상이한 양상을 보이고 있다. 가뭄을 사전에 방지하기 위해서는 가뭄 모니터링과 선제적 대응이 중요하며, 현재 가뭄의 특징, 상황 등의 목적에 따라 다양한 형태의 가뭄 모니터링 시스템이 개발되고 있다. 가뭄의 피해와 영향 정도는 지역 간의 차이가 나타나 지역별로 가뭄을 체감하는 정도가 다르기 때문에 하나의 결과로 나타내기에는 어려움이 있다. 따라서, 가뭄의 발생 시기와 확산 정도를 분석하여 특보 발효 시점과 가뭄 대응 방안에 대한 기준 마련이 중요하다. 본 연구는 현대 사회에서 가장 중요한 요소로써 활용되고 있는 빅데이터 중 비정형 데이터로 분류되는 뉴스데이터와 논·밭의 가뭄을 나타내는 농업 가뭄과 관련된 데이터를 활용하여 농업 가뭄의 전조를 파악해보고자 한다. 2018년부터 2019년까지 전국을 대상으로 농업 가뭄에 관한 키워드 선정 후, 웹 크롤링을 통해 뉴스데이터를 수집해 논 가뭄과 밭 가뭄을 구별하여 각 지역에서 최초로 가뭄 기사가 발행된 시기와 지역별 기사의 빈도를 산출하였다. 뉴스데이터의 농업 가뭄 전조 감지 가능성을 파악하기 위해 국가가뭄정보통계집에서 논 물마름 시기와 밭 시듦 시기 자료를 활용하였다. 가뭄 피해 발생시기와 관련 기사 발행 시기 비교, 농업용수 대상 비상용수 지원 자료를 활용하여 실제 농업 가뭄확산 감지 여부를 분석하여 농업 가뭄 관련 뉴스데이터 간의 상관성을 분석하였다.

  • PDF

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

소집단 문제해결 학습에서 수학 문제 유형에 따른 의사소통의 패턴 분석 (An Analysis of the Communication Patterns according to the Mathematical Problem Types in Small Group)

  • 최지영;이대현
    • 한국학교수학회논문집
    • /
    • 제12권3호
    • /
    • pp.247-265
    • /
    • 2009
  • 수학 교실에서 학생들은 교사나 동료 학생과의 의사소통을 통하여 수학적 지식을 구성하고, 서로의 지식을 타인과 교환하게 된다. 그런데 수학 학습의 주요 과정이 문제해결 활동임을 고려할 때, 학교 수학에서 다루어지는 어떤 문제 유형이 수학적 의사소통을 촉진시키는가를 알아보는 것은 중요하다. 이를 위해 본 연구에서는 수학 문제유형을 정형-개념형 문제, 정형-절차형 문제, 비정형 문제, 실생활 문제로 구분하여 소집단 문제해결 과정에서 구성원들의 의사소통 패턴을 분석하였다. 연구 대상자로 초등학교 4학년 8명의 학생을 선정하여 2개의 소집단으로 구성하였고, 2개의 소집단이 각각 5시간에 걸쳐 4가지 문제 유형으로 구성된 5세트의 문제를 해결하였다. 결과 분석을 위해 소집단 문제해결 과정을 비디오로 녹화하여 전사한 자료와 관찰일지, 문서자료를 이용하였다. 그 결과, 비정형 문제와 같은 문제해결 방법이 다양한 문제일수록 소집단 구성원들의 수학적 의사소통 참여도가 높았다. 또한 비정형 문제에서 다양한 풀이 방법에 대한 논의 및 새로운 풀이 전략에 대한 아이디어 공유와 같은 다수 참여의 의사소통 패턴이 나타났고, 수용적 합의, 논쟁적 합의, 정교화된 합의 등 다양한 합의 패턴이 나타났다.

  • PDF

텍스트마이닝 기반 고정밀 검색시스템

  • 안태성;서형국;이경일
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.88-97
    • /
    • 2004
  • 지난 10년 동안 인터넷의 대중화 덕분으로 World Wide Web과 e-mail은 이미 정보 전달의 일반적인 수단으로 자리를 잡았다. 인터넷과 이에 기반한 e-Busine器는 기존 산업의 전 부분에 걸쳐 효율성과 생산성 증대를 위한 전략적인 도구로 그 중요성이 지속적으로 증대되고 있으며. 지식 노동자들은 업무 시간의 대부분을 문서로 대표되는 정보와 지식을 생산하고 검색하는데 보내고 있다. 새로운 기업정보 자료들이 끊임없이 등록되고, 지난 자료들이 수정, 갱신되는 등 전 세계에 있는 수 많은 기업에서 다양한 지식 자산(Knowledge Asset)들이 지속적으로 생성, 재활용되고 있다. 그러나 이렇게 기업이 생성, 저장, 재 사용하는 정보 중 20% 만이 활용성이 높은 정형 데이터로 구성되어 있고, 나머지 80%는 워드프로세서, e-mail, 프리젠테이션, 스프레드시트, PDF와 같은 복합문서와 인터넷 페이지 등의 비정형 텍스트 형태로 구성되어 있다[1].(중략)

  • PDF

자연하천에 적용 가능한 2차원 유한체적 모형의 개발 (Development of 2D Finite Volume Model for Applying Natural Channels)

  • 김병현;한건연;김태형;김영주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.575-578
    • /
    • 2009
  • 자연하천에 적용가능한 수치모형은 지형의 변화를 합리적으로 계산할 뿐 아니라, 하도의 초기상태가 마름상태이거나 혹은 계산과정 중에 마름상태가 나타나더라도 충분히 계산할 수 있을 만큼 안정적이어야 한다. 본 연구에서는 비정형 및 비구조적 격자를 사용하여 지형변화를 고려한 흐름해석의 정확성과 효율성을 높이기 위해 보존변수의 재구성을 수면경사법과 MUSCL 기법을 연계하였으며, 하상경사항은 발산정리를 이용하여 이산화 하였다. 개발 모형의 정확성, 적용성 그리고 보존특성 등을 검증하기 위하여 해석해가 존재하는 불규칙 하상이 존재하는 하도 및 실험자료가 존재하는 실험하도에서의 댐 및 제방 붕괴와 같은 다양한 조건의 흐름에 적용하였다. 그리고 자연하천에 대한 적용 및 검증을 위해 Malpasset 댐 붕괴 모의를 수행하여 계산결과를 관측자료와 비교하였다.

  • PDF

지식관리시스템의 단계별 분석 및 구축방안에 관한 연구 (A Study on the Process Analysis and Implementation of Knowledge Management System)

  • 김성희
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.165-182
    • /
    • 1999
  • 본 논문에서는 최근 들어 많은 연구가 진행되고 있는 지식의 정의 및 지식관리에 대해 살펴보고 지식관리시스템의 단계적 절차를 분석함으로써 효율적인 지식관리 방안을 제시하고 있다. 또한, 본 논문은 효율적인 지식관리를 위해 이용자, 지식관리자, 지식관리 기술전문가가 하나의 파트너쉽을 구축해야 한다고 제시하고 있으며 특히, 지식관리자로써 사서의 역할변화에 대해 기술하고 있다. 이러한 연구는 미래의 기존문서, 웹문서 및 각종 멀티미디어 자료등 비정형정보를 지식시스템으로 축적, 유통시킬 수 있는 지식관리시스템 구현을 기초자료로 활용할 수 있을 것이다.

  • PDF

빅데이터 기반 농촌유역 이수안전도 산정 (Assessment of Water Supply Reliability in Agricultural Watershed based on Big Data)

  • 남원호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.30-30
    • /
    • 2021
  • 우리나라 수리시설물 중 30년 이상 경과된 수리시설물은 전체의 61%를 차지하며, 특히 저수지의 경우 저수지의 약 84% 정도는 50년 이상 된 노후 저수지로 분류되고 있어 지속적인 보수·보강 필요하며 향후 기후변화에 취약할 것으로 예상된다. 이수측면에서 설계기준이 되는 설계한발빈도는 농업용 저수지의 내한능력을 나타내는 것으로 수리시설의 규모를 결정하는 기준이 된다. 국내의 경우 1982년 농지개량사업계획 설계기준 댐편에 한발빈도 10년 기준을 채택하여 사용되고 있으며, 현재 농업용 저수지의 이수안전도는 한발빈도 설계기준을 대신하여 사용하고 있다. 농업용 저수지의 이수안전도는 기존 설계기준에 의한 물수지법에 따른 저수지의 설계빈도로 산정되어 기후 및 영농변화, 용수수요의 변화, 농법의 변화 등 현장의 물관리 여건을 반영하는데 한계가 있다. 실제 저수지의 이수능력은 한발빈도 설계기준으로 대변되는 공급가능량 및 평야부 용배수로의 형상에 따라 농업용수 공급역량이 상이하므로, 평야부를 포함하는 농촌유역, 농촌공간의 이수안전도 개념이 도입되어야 한다. 또한 국가의 유관기관들은 특성 및 용도에 맞는 용수공급 정보를 생산하여 모니터링 자료를 제공하고 있지만, 실제 현장에서 체감하는 물 부족 및 이수관련 문제 해결을 위해 현장기반 데이터 활용이 필요하다. 본 연구에서는 기존 경험에 의한 관행적인 물관리 자료, 저수지 관련 계측 자료, 위성영상 자료, 비정형 미디어 데이터 등 이수 관련 분야의 빅데이터를 통합 구축하여 농촌유역 이수안전도의 개념을 정의하고자 한다.

  • PDF

비정형격자의 적용을 위한 MUSCL 기법의 수정 (Modification of MUSCL Scheme for Application of Non-uniform Grid)

  • 김병현;한건연
    • 한국수자원학회논문집
    • /
    • 제43권1호
    • /
    • pp.105-117
    • /
    • 2010
  • 본 논문은 2차원 천수방정식을 해석하기 위해 새롭고 간단한 MUSCL 재구성법을 제안하였다. 수정 MUSCL 기법은 보존변수의 재구성을 위해 계산격자와 인접격자의 보존변수 차에 대해 각 경계면에 균일하게 분배하는 기존 방법 대신 면적가중비를 사용하였으며, 이 방법은 정형격자 뿐만 아니라 비정형 격자의 사용에도 보존변수의 물리적 재구성이 가능하다. 또한, 본 연구에서는 비구조적 격자의 적용이 가능한 차원비분리 기법을 적용하였으며, 수정 MUSCL 기법의 사용으로 발생할 수 있는 수치진동을 제어하기 위해 TVD 기법의 경사제한자를 사용하였다. 하상경사항의 정확하고 효율적인 수치 처리를 위해 수정 MUSCL 기법을 수면경사법과 연계하였다. 제안한 기법을 적용한 유한체적모형을 건물의 영향을 고려한 댐 붕괴 해석 및 Bellos의 댐 붕괴 실험에 적용하고, 적용결과를 실험실 자료 및 기존 연구자의 계산결과와 비교하여 개발모형을 검증하였다.

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.