• 제목/요약/키워드: association mining

검색결과 1,061건 처리시간 0.021초

한국자료분석학회지에 대한 토픽분석 (A Topic Analysis of Abstracts in Journal of Korean Data Analysis Society)

  • 강창완;김규곤;최승배
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2907-2915
    • /
    • 2018
  • 1998년에 창립한 한국자료분석 학회지는 자료분석에 기반한 다양한 전공분야를 위해 현재까지 응용학회지로서 역할을 해오고 있다. 본 연구에서는 이러한 한국자료분석 학회지의 본연의 목적을 잘 수행해오고 있는지 최근 10년간 학회지 요약문을 통해 분석하였다. 분석은 한국연구재단에서 제공한 온라인 저널 홈페이지를 통해 2006년부터 2016년까지의 영문 요약문 2680개를 웹크롤링하여 토픽모델을 적용하였다. 분석결과로 18개의 토픽이 선정되었으며 이에 대한 토픽을 해석한 결과 자료분석학회지는 간호학, 경영학(마케팅), 경제학 등 여러 분야를 다루고 있으며 분석방법으로 회귀분석, 가설검정, 데이터마이닝(연관성분석), 요인분석 등이 많이 이용되고 있음을 볼 수 있었다. 그리고 단어들의 연관성(association rule)분석을 통하여 통계적으로 유의한 연관성 규칙 10개를 제시하였다. 여기서 연관성규칙의 통계적 유의성검정은 피셔의 정확검정(Fisher's exact test)을 사용하였다. 또한 연구주제(토픽)의 변화를 살펴본 결과 전반기에는 조사연구가, 후반기에는 대조 연구가 많아졌음을 볼 수 있고 또한 회귀분석과 요인분석은 전, 후반기 구분 없이 자료분석에서 공통적으로 많이 사용하는 통계적 방법임을 알 수 있었다.

복합지반 EPB TBM 커터교체를 위한 그라우팅 수행 사례 (Pre-grouting for CHI of EPB shield TBM in difficult grounds: a case study of Daegok-Sosa railway tunnel)

  • 강성욱;장재훈;이재원;김대영;신영진
    • 한국터널지하공간학회 논문집
    • /
    • 제23권5호
    • /
    • pp.281-302
    • /
    • 2021
  • 철도망 구축이 확대되는 추세 속에 도심지나 한강을 통과하기 위해 TBM 굴착공법 적용사례가 증가하고 있다. 특히, 도심지나 한강하저를 통과하는 경우 불량한 지반 및 지하수조건을 조우하게 되며 안정적인 굴진 및 커터교체(Cutter Head Intervention, CHI)를 위해서 그라우팅을 적용하고 있다. 본 논문에서는 TBM 굴착공법을 적용한 철도 터널 시공 시 적용한 그라우팅에 대하여 소개하고자 한다. 특히, CHI를 위해 그라우팅을 수행한 사례에 대한 소개나 분석이 많지 않은 것으로 판단하여 CHI를 위한 그라우팅 범위산정, 수행결과, 고찰 및 제언(Lessons Learned)을 기술하고자 한다. 그라우팅은 막장안정성을 확보하는 목적이 있으며, 작업위치에 따라 지상(수직)그라우팅과 TBM 장비 내에서 수행하는 갱내 그라우팅으로 나눌 수 있다. 갱내그라우팅을 수행한 결과 공기 및 보강효과 측면에서 지상(수직) 그라우팅에 비해 비효율적이라고 판단되어 지상그라우팅으로 계획을 변경하였다. 한강하저 구간의 경우 슬러지 발생으로 인한 환경오염, 주입재 유실 등이 우려되어 고압분사그라우팅을 적용할 수 없었으며 대안으로 수중불분리 주입재를 적용한 저압그라우팅을 적용하였다. 육상구간은 지상 작업부지를 확보할 수 있어 고압분사그라우팅을 적용하였다. 실제 그라우팅을 수행한 결과를 소개함으로써 향후 쉴드 TBM을 적용한 터널 시공 중 CHI 시 지반조건에 따른 적합한 그라우팅 공법 및 방법을 결정하는데 기초자료로 활용될 수 있을 것으로 기대된다.

국내외 단행본 분석을 통한 국제연구협력 동향 연구 (Research on Trends in International Research Cooperation through Analysis of International Research Cooperation Books)

  • 노영희;곽우정
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.35-44
    • /
    • 2022
  • 본 연구에서는 국제협력을 주제로 발행된 단행본이 어떠한 특징을 가지고 있는지, 이 단행본을 통해 어떠한 국제협력 관련 연구가 수행되고 있으며, 주요한 국제협력 내용은 무엇인지를 확인하고자 하였다. 이러한 연구목적을 달성하기 위하여 국내외의 국제연구협력 단행본 데이터 구축, 통계분석, 텍스톰을 기반으로 한 텍스트 마이닝 수행 등을 수행하였다. 연구 결과, 2010년대 이후부터 국제연구 및 국제협력에 대한 특히 높은 관심을 보이고 있는 것으로 알 수 있었으며, 국내외 연구자, 저자, 국공립기관, 사립기관 등 다양한 개인 및 단체에서 국제연구협력 단행본 발간을 통해 국제협력을 통해 개발, 경제, 기술, 발전, 지역, 관계 등을 중심으로 관심을 가지고 있으며 발전을 도모하고자 함을 알 수 있었다. 뿐만 아니라 환경, 무역, 교육, 사회 등의 주제 등도 나타나 환경이나 무역, 교육 등을 중심으로 한 국제연구협력의 관심도도 높아 국제화와 국제적인 협력에 대하여 경제나 지역 관계, 발전을 넘어서 환경, 무역, 교육, 사회 전반에 영향력이 높은 것으로 파악되었다. 본 연구를 통해 국제연구협력을 주제로 출판된 일부 단행본의 특징을 확인하는 기초 연구가 될 수 있다는 점, 국가별, 연도별 국제연구협력의 주제 및 특징에 관한 동향을 확인했다는 점에서 그 연구적 의의를 찾아볼 수 있다.

코로나 19에 따른 프로야구 무관중 시청품질요인의 중요도, 만족도 분석 (Analysis of the Importance and Satisfaction of Viewing Quality Factors among Non-Audience in Professional Baseball According to Corona 19)

  • 백승헌;김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권2호
    • /
    • pp.123-135
    • /
    • 2021
  • 본 연구의 자료처리는 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중'과 관련된 키워드를 중심으로 텍스톰(textom)프로그램의 텍스트마이닝과 소셜네트워크 분석을 활용해 문제점 도출 및 시청품질의 변인을 설정하는데 활용하였다. 정량적 분석을 위해 시청품질에 관한 설문지를 구성하였으며, 270부의 설문응답자 중 250부의 설문을 최종연구에 사용하였다. 설문지의 타당도와 신뢰도를 확보하기 위한 도구로 탐색적 요인 분석과 신뢰도 분석을 실시하였으며, 타당도와 신뢰도가 확보된 설문을 바탕으로 IPA분석(중요도-만족도)을 실시하여 결과 및 전략을 제시하였다. IPA분석을 실시한 결과 1사분면에 영상과 관련된 요인(영상구성, 영상배색, 영상 선명도, 영상 확대 및 구도, 고음질 영상)이 나타났고 2사분면은 경기상황(응원 팀 경기수준, 응원 선수 경기수준, 스타선수 발굴, 라이벌 팀과의 경기)과 경기정보(경기일정 안내, 선수정보 확인, 팀 성적 및 선수성적, 경기정보), 상호작용(응원팀과의 공감대) 일부의 요인이 나타났으며, 3사분면은 해설자(야구관련 지식, 의사전달 능력, 발음과 목소리, 표준어 사용, 경기관련 정보 소개)와 상호작용(프런트와 실시간 소통, 시청자와의 공감대, 채팅 등의 정보교환)의 요인이 나타났다.

토픽모델링을 활용한 조세순응 연구 동향 분석 (Analysis of Research Trends in Tax Compliance using Topic Modeling)

  • 강민조;백평구
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.99-115
    • /
    • 2022
  • 본 연구의 목적은 사회과학 전반에 걸쳐서 수행되고 있는 조세 분야의 대표적인 연구주제로서 조세순응, 납세의식, 성실납세(이하 "조세순응")에 관한 연구의 흐름을 정리함으로써 융합학문으로서 세무학의 지평을 확장하는 것이다. 이에 조세순응에 관한 국내 학술지 논문을 학제적 관점에서 종합적으로 분석하기 위하여 텍스트마이닝의 일환으로 토픽모델링 기법을 적용하였다. 데이터 수집-키워드 전처리-토픽모델 분석의 흐름으로 총 347편의 논문에 연구자가 등록한 조세순응 관련 키워드들로부터 잠재적인 연구주제를 제시하고자 하였다. 본 연구의 분석 결과로 첫째, 키워드 분석에서는 세무조사, 조세회피, 성실신고확인제도 등의 키워드가 단순 빈도 기준으로 상위 5개 키워드에 포함되었고, 키워드의 상대적 중요도를 감안한 TF-IDF 값에서도 상위 5개 키워드에 포함되었다. 한편 탈세라는 키워드는 단순빈도에서 부각되지 않은 것에 비해 TF-IDF 값 기준으로 상위 키워드에 포함되었다. 둘째, 토픽모델링을 통해 잠재적인 8개의 연구주제를 도출하였다. 해당 주제는 (1) 조세공정성과 조세범칙행위의 억제, (2) 조세법의 이념과 조세정책의 타당성, (3) 실질과세원칙과 조세채권의 담보 (4) 납세협력비용과 세무행정 서비스, (5) 신고납세제도와 세무전문가, (6) 조세풍토와 전략적 조세행동, (7) 조세행동의 다면성과 차별적 순응의도, (8) 과세정보시스템과 효율적 세원관리와 같다. 본 연구는 학문 간의 경계를 넘어 조세순응이라는 주제어를 바라보는 다양한 관점을 포괄적으로 조망함으로써 학제간 소통의 기회를 마련하고 합리적인 조세제도를 구축하는데 실천적 시사점을 제시하고자 하였다.

공유자전거 데이터 분석 및 활용방안 연구 세종특별자치시 공유자전거 어울링의 데이터를 적용하여 (A Study on Analysis and Utilization of Public Sharing Bike Data - By applying the data of Ouling, Public Sharing Bike System in Sejong City)

  • 안세윤;주한나;김소연;조민준;김성환
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.259-270
    • /
    • 2021
  • 최근 친환경 교통수단에 대한 관심과 바이러스로부터의 안전성을 고려하여 도시 공간 내 공유자전거 활용에 대한 관심이 높아지고 있다. 정보통신기술의 발달로 데이터를 수집하고 저장하는 기술이 향상되면서, 시민들의 공유자전거 사용에 따라 수집·저장되는 데이터를 활용한 도시 공간 내 이동성(Mobility)에 대한 연구도 활발히 진행되고 있다. 따라서, 본 논문은 문헌고찰을 통해 도시 공간 내 공유자전거 시스템을 통해 수집되는 데이터의 속성과 활용사례를 분석하여, 고찰·분석한 결과를 바탕으로 국내 공유자전거 시스템 중 하나인 세종특별자치시 어울링의 데이터 분석에 적용함으로써, 공유자전거 데이터 활용방안을 모색하였다. 분석대상으로 선정한 문헌은 GIS데이터, O-D데이터, 대여 및 반납 이력, 대여소 위치정보 및 주변정보, 날씨정보 등을 활용하여 GIS 네트워크 분석기법, 방정식 및 비율 분석, 소셜 네트워크 분석, 통계 및 네트워크 분석 등의 방법을 사용하였다. 데이터 분석을 통해 공유자전거 시스템의 현황 및 문제점을 파악하여 해결방안을 제안, 공유자전거 사용의 확장 및 활성화 방안 도출, 효율적인 공유자전거 관리 및 운영방안 도출을 위한 기초자료를 마련하였다. 궁극적으로, 데이터 분석을 통해 공유자전거를 활용하여 도시 공간 내 이동성(Mobility)을 향상시킬 수 있는 방안을 모색할 수 있을 것이다.

텍스트 마이닝을 활용한 코로나 19 전후 온라인 동영상 서비스(OTT) 리뷰 비교분석 연구 - 정서 중심 대처와 노스탤지어를 중심으로 (A Comparative Analysis of OTT Service Reviews Before and After the Onset of the Pandemic Using Text Mining Technique: Focusing on the Emotion-Focused Coping and Nostalgia)

  • 고민정;이상원
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.375-388
    • /
    • 2021
  • 본 연구에서는 팬데믹 전후로 온라인 동영상 서비스(OTT) 이용자들의 리뷰를 비교분석 함으로써 코로나 19 시대를 살아가는 소비자에 대한 이해에 기여하고자 하였다. 코로나 19 이후 통제감 상실이 회피 동기의 발현으로 이어져 정서 중심 대처 수단으로써의 OTT 서비스 이용과 노스탤지어를 해소해주는 콘텐츠에 대한 관심이 증가할 것으로 보고 이를 텍스트 분석을 통해 검증하였다. 먼저 블로그 제목 분석결과, 코로나 19 이후 넷플릭스 경쟁사에 대한 언급이 줄었으며, 국내 콘텐츠에 대한 소개와 회피-거부 전략으로써의 OTT 서비스 이용이 증가하였다. 이어 블로그 본문 분석결과, OTT 서비스의 실용적인 장점을 중요시한 코로나 19 전과는 달리 코로나 19 이후 콘텐츠의 분위기, 감정, 대사에 초점을 두었으며 코미디와 로맨스 장르에 대한 관심이 증가했다. 또한, 코로나 19 이전의 현실을 잘 표현한 일상 콘텐츠에 대한 선호가 증가하였다. 본 연구는 코로나 19가 온라인 동영상 서비스 이용에 미치는 영향을 처음으로 살펴본 연구로써 코로나 시대의 OTT 서비스 이용자들에 대한 이해를 넓히고 OTT 서비스 시장에 실무적 제언을 제시함으로써 도움을 줄 수 있을 것으로 기대한다.

K-평균 군집분석을 활용한 중학생의 군집화 및 특성 분석 (Analysis of Characteristics of Clusters of Middle School Students Using K-Means Cluster Analysis)

  • 이재봉
    • 한국과학교육학회지
    • /
    • 제42권6호
    • /
    • pp.611-619
    • /
    • 2022
  • 최근 교육에서 교육 데이터마이닝에 관한 관심이 높아지고 있는 시점에 과학교육에서 평가 결과를 활용하여 학생들에게 적합한 피드백을 제공하기 위해 빅데이터 분석의 적용 가능성을 탐색해 보고자 하였다. 연구에서는 국가수준 학업성취도 평가의 24문항에 응시한 2,576명의 평가 자료를 활용하여 비지도 기계학습의 한 가지 방법인 K-평균 군집분석을 이용하여 학생들을 군집화하였다. 학업성취도 평가 자료를 활용한 군집화 결과, 학생들을 6개의 군집으로 나누어 볼수 있었다. 상위권이나 하위권에 비해 중위권 학생들이 다양하게 다른 군집으로 구분됨을 알 수 있다. 군집분석의 결과를 보면, 군집화에서 가장 중요하게 영향을 주는 요인은 학업 성취였으며, 군집별로는 교육과정의 내용 영역별, 교과 역량별, 정의적 특성 면에서 서로 다른 특성을 보이고 있었다. 하위 군집에서는 정의적 영역 중에서 학습의욕이 중요하게 영향을 주고, 교과 역량 면에서는 과학적 탐구 및 문제 해결력과 과학적 의사소통 능력이 중요하게 영향을 주고 있었다. 내용 영역 면에서는 운동과 에너지와 물질 영역에 대한 성취가 군집의 특성을 구분하는 중요한 요인으로 작용하고 있었다. 따라서 평가 자료를 활용해 학생을 군집화한 후, 이러한 군집별 특성을 바탕으로 학생들에게 학습을 위한 맞춤형 피드백을 제공할 수 있을 것으로 판단된다. 본 연구에서는 이러한 연구 결과를 바탕으로 군집분석 연구 결과 활용의 가능성, 내용 영역별 균형 있는 학습, 교과 역량 증진, 과학적 태도의 향상 등 과학교육의 시사점을 제안하였다.

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.

국내 스마트 항만 도입 우선순위 도출 연구 (A Study on Determining the Priority of Introducing Smart Ports in Korea)

  • 류원형;남형식
    • 한국항만경제학회지
    • /
    • 제40권1호
    • /
    • pp.31-59
    • /
    • 2024
  • 2016년 6월 세계경제포럼인 다보스 포럼에서 4차산업혁명이라는 용어가 처음 사용되어 전 세계적으로 이슈화되었고, 이에 따라 항만산업도 다양한 4차산업혁명 기술을 도입하면서 스마트 항만의 중요성이 증대되고 있다. 현재 세계 주요국들은 해운·항만산업에서 디지털 전환을 실현하기 위해 종합적인 스마트 항만을 구축하고 있지만, 국내 항만의 스마트화는 현재 부산과 인천, 광양 등 일부 지역에 항만 자동화로 국한되어 추진하고 있다. 이에 따라 본 연구는 국내 스마트 항만 도입의 우선순위를 도출하기 위해 키워드 분석을 수행하여 스마트 항만의 주요 항목들을 도출하고, 이를 바탕으로 이해관계자별 AHP 분석을 수행하였다. 분석 결과, 주요 항목의 경우 대학은 자동화, 지능화, 정보화, 친환경화 순으로 나타났고, 연구소(원)는 정보화, 지능화, 자동화, 친환경화 순으로 나타났다. 정부 기관은 정보화, 자동화, 지능화, 친환경화 순으로 나타났고, 민간기업은 자동화, 지능화, 정보화, 친환경화 순으로 나타났다. 다음으로 세부 항목의 경우 대학은 야드 무인 및 자동화, 안벽 무인 및 자동화, 통합 운영 시스템 개발 등의 순으로, 연구소(원)는 통합 운영시스템 개발, 장비/기기 간 상호연계, 야드 무인 및 자동화 등의 순으로, 정부 기관은 사고방지 및 안전성 강화, 친환경 에너지 체제 전환, 통합 운영시스템 개발 등의 순으로, 민간기업은 안벽 무인 및 자동화, 야드 무인 및 자동화, 사고방지 및 안전성 강화 등의 순으로 나타났다.