• 제목/요약/키워드: K-means clustering 기법

검색결과 267건 처리시간 0.025초

기술과학 분야 학술문헌에 대한 학습집합 반자동 구축 및 자동 분류 통합 연구 (Semi-automatic Construction of Learning Set and Integration of Automatic Classification for Academic Literature in Technical Sciences)

  • 김선우;고건우;최원준;정희석;윤화묵;최성필
    • 정보관리학회지
    • /
    • 제35권4호
    • /
    • pp.141-164
    • /
    • 2018
  • 최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

유아교육 박람회에서 데이터마이닝 기법을 이용한 전시 관람 행동 패턴 분석 (The Behavior Analysis of Exhibition Visitors using Data Mining Technique at the KIDS & EDU EXPO for Children)

  • 정민규;김혜경;최일영;이경전;김재경
    • 지능정보연구
    • /
    • 제17권2호
    • /
    • pp.77-96
    • /
    • 2011
  • 전시회는 전시업체가 새로운 상품이나 서비스를 관람객에게 알리기 위해 개최되는 것으로 효과적인 마케팅 수단으로 중요한 역할을 수행한다. 이처럼 전시회의 중요성이 점점 커짐에 따라, 국내 전시 산업은 많은 양적 성장을 이뤄왔다. 그러나, 양적 성장에 비해 전시 산업의 질적 성장은 이에 미치지 못하는 실정이다. 따라서 전시회의 질정 성장을 이루기 위해서는 관람객의 행동 패턴을 이해하여 관람객들의 전시 관람 수준과 만족도를 높일 필요성이 있다. 본 연구에서는 관람객들의 전시 관람 행동 패턴을 분석하기 위해 다음과 같은 연구 프레임워크를 사용한다. 첫 번째 단계는 본 연구의 방법론을 적용하기 적합한 전시회를 선정하는 단계이다. 두 번째 단계는 관찰 조사 방법을 수행하는 단계이다. 마지막 세 번째 단계는 수집된 자료들을 분석하는 단계이다. 분석 단계에서는 부스들의 개별 특성을 파악하였고, 더 나아가 관람객들의 전시 관람 행동 패턴을 분석하기 위해 데이터마이닝 기법을 사용하였다. 본 연구의 결과는 전시 기획자에게 유용한 정보를 제공할 뿐만 아니라 참관객들이 원하는 정보를 원하는 방식으로 제공하는 개인화서비스를 가능하게 하여 궁극적으로 전시회 관람의 질과 만족도를 크게 향상시킬 수 있을 것이라고 기대한다.

문헌정보학과 학생의 직장으로서의 도서관·정보센터 이미지 분석 (Study about Library and Information Center's Image of Library and Information Science Students as Workplace)

  • 조재인;이지원
    • 한국문헌정보학회지
    • /
    • 제50권3호
    • /
    • pp.113-132
    • /
    • 2016
  • 소비자에게 형성된 심상 분석을 통해 마케팅 전략을 수립하는데 주로 활용되고 있는 포지셔닝(Positioning) 기법은 공공시설, 기업, 대학이 공중에게 주는 이미지 분석을 비롯해 다양한 영역에서 활용되고 있다. 본 연구는 문헌정보학과 학생이 직장으로서 도서관 정보센터에 대하여 가지고 있는 이미지를 포지셔닝 기법을 통하여 분석하였다. 분석 결과, 학생들은 공공, 대학, 학교, 국가도서관을 유사한 이미지의 직장으로 인식하는 반면, 포털과 전문도서관은 이들과는 이질적인 진출처로 인식하고 있었으며, 직무에 있어서는 이용자봉사업무와 기술업무, 문화프로그램 업무를 각각 상이한 직무 군집으로 인식하고 있는 것으로 나타났다. 한편, 만족스러운 업무와 고용안정성이라는 이미지는 국가도서관과 공공도서관이 가장 크게 나타났으며, 보수가 가장 높을 것으로 기대되는 곳은 포털 업체, 성장가능성이 가장 높을 것으로 기대되는 곳은 전문도서관으로 포지셔닝되었다. 한편, 학생들이 가장 중요하게 생각하는 직장선택준거는 고용안정성으로 나타났으며, 가장 선호하는 직장으로는 공공도서관이 선택되었는데, 이러한 공공도서관 선호 집중 현상은 수도권대학보다는 지방대학 학생들에게 더욱 강하게 나타났다.

직원경험 요인 파악 및 직무 만족도에 끼치는 영향력 분석 (Identification of Employee Experience Factors and Their Influence on Job Satisfaction)

  • 이주현;이소현;김희웅
    • 경영정보학연구
    • /
    • 제25권2호
    • /
    • pp.181-203
    • /
    • 2023
  • 기존에 우수한 인재를 유치하기 위한 기업들의 경쟁이 심화됨에 따라, 직원들의 직무 만족도 관리가 중요해지고 있다. 이에 많은 기업의 관리자들은 직원들의 일상적인 경험과 고충을 파악하여 직무만족도를 개선하기 위해 투자하고 있다. 그러나 직원 경험에 대한 충분한 이해의 부족으로 관리자들의 투자는 효과를 보지 못하고 있다. 본 논문은 전 세계적으로 가장 큰 직장인 커뮤니티인 글래스도어의 직원 리뷰와 기업 평점을 활용하여 직원 경험의 세부 요인들과 직무 만족도 간 관계를 조사한다. 이때 K-평균 군집화, Sentiment LDA Topic Modeling 등 텍스트 마이닝 기법을 활용하여 직급에 따른 주요 경험을 추출하고, DistilBERT 감성 분석을 통해 각 직원경험 요인의 감성점수를 측정한다. 이후 도출된 직원 경험 요인과 감성 점수를 계량적으로 분석하여 각 직원 경험 요인과 직무 만족도 간의 관계를 파악한다. 그 결과, 조직 관리자와 일반 직원의 직장 내 경험에는 상당한 차이가 있는 것으로 발견되었다. 또한 고객관계, 자율성 등은 관리자의 만족도에 영향을 미치지 않는 등, 직무 만족도에 영향을 미치는 직원경험 역시 직급 간 상이했다. 본 연구는 직업적응이론을 기반으로 텍스트 마이닝과 계량 모델링 방법을 이용하여 직원경험의 주요 요인을 확인하고 이를 검증함으로써 관련 연구분야의 문헌을 확장한다. 더불어, 본 연구결과는 직원들의 직무 만족도 개선을 위한 인사관리 전략에 활용될 수 있으며, 궁극적으로는 기업의 생산성을 개선할 것으로 기대한다.

동학농민혁명 기념공원 설계공모에 나타난 메모리얼 설계 경향 (A Study on the Design of Memorial in the Design Competition for Donghak Peasant Revolution Memorial Park)

  • 이진욱;성종상;손용훈
    • 한국조경학회지
    • /
    • 제45권3호
    • /
    • pp.66-79
    • /
    • 2017
  • 기념성을 구현하기 위한 형태와 기법들이 다양하게 나타나는 가운데 지난 2014년 동학농민혁명 기념공원 설계 공모가 진행되었다. 이는 집단의 기억을 강요하던 기념(記念) 사업에 대한 재고의 과정이며, 현재 우리나라에서 계획하고 있는 메모리얼 설계에 대한 동시대 설계가들의 인식을 고찰할 수 있는 의미 있는 소재이다. 본 연구는 동일한 대상지에서 이뤄졌던 동학기념사업들에 대해 시계열적으로 그 형성 배경을 살펴보고, 기존의 문헌 연구 등을 통해 설계공모를 분석하는 과정을 거쳤다. 이를 통해, 과거 정치적 목적의 수단으로써 조성되던 기념물이 공개공모를 통해 다양한 의견 수렴과 형태를 모색하는 방향으로 변하였음을 알 수 있었다. 다층적 분석을 통해 마련된 분석의 틀은 일상성, 상호작용 및 자발성, 추상성, 임시성, 장소성, 통합성 그리고 조화성이다. 이를 통해 본 결과는 다음과 같다. 첫째, 일상 속에서 기념성을 전달하기 위해 기존의 특수성을 갖는 산재한 기념공간들을 일상적 활동 프로그램과 연계하였다. 둘째, 기념물과의 상호작용을 위하여 직접적인 참여와 감성적인 체험 방법을 사용하였다. 셋째, 추상적 재현을 위해 색상, 수직요소, 군집화, 공원의 틀 조작 등의 기법을 사용하였다. 넷째, 임시성과 변화성을 추구하기 위하여 식물을 이용한 애도의 방식과 물리적 변화가 가능한 건축물과 구조물들을 도입하였다. 다섯째, 대상지를 장소성이 있는 공간으로 만들기 위하여 과거 지형을 복원하고, 현장의 모습을 재현하였다. 여섯째, 기존 기념물들과의 연계성을 증진시키기 위하여 순환동선과 축선 조작 기법을 사용하였다. 일곱째, 주변과의 조화를 위하여 지형에 순응하는 동선과 건물을 배치하였다.

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.