• 제목/요약/키워드: big data mining

검색결과 679건 처리시간 0.032초

VCDF 방식을 통한 효율적인 VTS 통신 데이터 분석에 관한 연구 - 부산항을 대상으로 - (A Study on the Effective VTS Communications Analysis by the Method of VCDF in Busan Port)

  • 김봉현;박영수
    • 해양환경안전학회지
    • /
    • 제22권4호
    • /
    • pp.311-318
    • /
    • 2016
  • 세계 주요 항만에서 해상안전관리의 주요한 수단으로 자리잡은 VTS는 향후 E-네비게이션을 비롯하여 해상과 항만의 각종 데이터를 총괄하는 데이터 베이스의 중심이 될 것으로 전망되고 있다. 다양한 정보의 수집과 분석이라는 측면에서 최근에 주목되고 있는 빅 데이터 개념을 포함한다면 VTS를 통해 수집할 수 있는 데이터의 범위와 정보 분석 능력 및 활용범위를 향상시키기 위한 연구가 필요하다. 본 연구에서는 통신 빈도와 같이 정량적 분석 위주로 접근했던 기존 연구와는 달리 VTS 통신의 목적이나 유형과 같은 분석을 포함하여 관제대상 선박에 대한 정보와 각 통신의 소요시간까지 수집하였다. 이렇게 수집된 정보의 여러 항목을 교차하여 비교하고 분석할 수 있는 데이터 수집 모델을 본 연구에서 제시하여 관제통신 건수, 방식, 관제 유형방법, 선종별 통신량 및 법령 위반건수 등을 분석하는 것을 목적으로 한다. 이 연구 결과 (1) 부산항 북항의 경우에는 정보전달 형태의 관제가 빈번하고, 특정한 선종의 선박과 통신이 편중되어 있으며 (2) 관제 채널 청취 불이행, 항로 준수 위반의 법령 위반 사항이 자주 발생하고 있으나 통신량의 혼잡으로 인하여 소극적인 관제가 수행되고 있다는 사실을 알 수 있었다. 이렇게 수집된 정보는 IALA Guideline에서 작업부하로 지적하고 있는 '상황인지가 가능한 수준의 관제통신량'에 대한 분석 자료로 활용할 수 있으며 향후 e-내비게이션 연구를 위한 데이터베이스로 이용될 수 있을 것이다.

연관 규칙 마이닝에서 비교 기여 순수 신뢰도의 제안 (The proposition of compared and attributably pure confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.523-532
    • /
    • 2013
  • 데이터 마이닝은 빅 데이터에 잠재되어 있는 지식이나 패턴을 찾아내는 기술이며, 대표적인 기법 중의 하나가 연관성 규칙 마이닝이다. 이 기법은 지지도, 신뢰도, 향상도 등의 연관성 평가 기준을 기반으로 하여 각 항목들 간의 관련성을 찾아내는 데 활용되고 있다. 연관성을 평가하기 위한 기준으로 여러 가지 흥미도 측도가 개발되어 있는데, 그 중에서도 신뢰도가 가장 많이 활용되고 있으나 연관성의 방향을 알 수가 없다는 단점을 가지고 있다. 이를 보완하기 위한 측도로 순수 신뢰도가 개발되었으나. 양의 신뢰도과 음의 신뢰도의 값이 동일한 경우에는 이 측도의 값이 같아지므로 정확한 연관성 규칙을 발견할 수 없게 된다. 이러한 단점을 보완하기 위해 기여 순수 신뢰도와 비교 신뢰도가 개발되었는데 이들은 이들 측도들이 취할 수 있는 값의 범위에 대한 문제를 제외하고는 흥미도 측도로서는 매우 바람직하다고 할 수 있으나 값의 범위에 대한 문제점이 존재한다. 이 문제를 해결하기 위해 본 논문에서는 기여 순수 신뢰도와 비교 신뢰도의 크기를 동시에 고려한 비교 기여 순수 신뢰도를 제안하였다. 또한 예제를 통하여 그 유용성을 알아본 결과, 비교 기여 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 파악할 수 있는 동시에 그 값의 범위가 [-1, +1]의 값을 가지므로 행태적 해석이 가능한 것으로 확인되었다.

AI 키즈폰의 소비자리뷰 분석을 통한 제품개선 전략에 대한 연구 (Formulating Strategies from Consumer Opinion Analysis on AI Kids Phone using Text Mining)

  • 김도훈;차경진
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.71-89
    • /
    • 2019
  • 기업은 소비자가 만족하는 제품을 개발하고 개선하기 위하여 설문조사와 같은 전통적인 마케팅리서치 방법을 이용하여, 소비자의 의견을 듣고, 분석하여 반영하는 노력을 한다. 최근에는 인터넷 사이트, 사회관계망(SNS) 등 소비자 커뮤니케이션 플랫폼에서 관련 자료를 수집하고 분석하는 방법이 주목을 받고 있다. 한편, 급속한 정보통신기술의 발달과 함께 이동통신사들이 아동을 위한 디지털상품을 출시하고 있는데, 특히 유해한 콘텐츠로부터 아동을 보호하고, 부모와 아동들에게 필요한 정보와 기능은 보완된 디지털 디바이스들이 등장하고 있다. 이 가운데 키즈폰은 불필요한 기능은 없애고 아동들에게 기본 안전 기능을 담은 웨어러블 디바이스로서 부모가 쉽게 자녀의 위치를 실시간으로 알게 해주는 유용한 도구이다. 키즈폰은 스마트폰에 비해 저렴하고 간편하지만 고장이 잦고, 안전 이외에 유용한 기능을 기대하기 힘들며, 부가적인 기능들 또한 유용하지 못하다는 점이 지적되고 있다. 본 연구는 국내 이동통신사의 키즈폰(Kids Phone)에 대한 리뷰를 분석하여, 제품들의 특성과 장단점을 파악하고, 디바이스와 서비스에 대한 개선방안을 제안함으로써, SNS 소비자 분석을 통한 제품 서비스 개선 전략수립 방법을 제시하고자 한다. 이를 위해 국내 쇼핑몰의 리뷰 섹션에서 자료를 수집하고, TF/IDF, 감성분석, 네트워크분석 등의 텍스트 마이닝 기법을 활용하여 소비자 감성분석을 실시하였다. 고객 리뷰는 온라인 쇼핑몰과 네이버 블로그에서 크롤링하여 수집 하였으며, 통계/데이터 마이닝 및 그래픽은 'R'과 빅데이터 분석 솔루션 'Textom', 그리고 오픈소스 프로그래밍 언어인 'Python'을 함께 사용하여 분석하고 시각화하였다. 본 연구를 통해 각 이동통신사의 현재 제품(키즈폰)에 대한 소비자가 느끼는 주요이슈와 제품의 장단점을 파악할 수 있었으며, 더 나아가 감성분석을 바탕으로 키즈폰 제품의 서비스 개선전략 방향을 제안할 수 있었다.

데이터 마이닝 기반 대학입시를 위한 학교생활기록부 분석시스템 (Analysis System of School Life Records Based on Data Mining for College Entrance)

  • 양진우;김동현;임종태;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.49-58
    • /
    • 2021
  • 대한민국 교육과정과 입시제도는 수많은 변화들을 통해 진화해 왔다. 현재 우리나라 대학진학률이 약 70%에 육박하고 있고, OECD회원국 중 가장 높다. 이러한 환경 속에 대학진학에 관심이 높고 또한 우리나라 교육제도에서 가장 비율이 높은 수시전형 중 학생부종합전형에 필요한 학교생활기록부의 중요성을 높아져가고 있다. 행복은 성적순이 아니지만 적극적인 학교생활을 통해 나의 미래와 행복을 동시에 찾을 수 있다. 학교생활기록부 분석시스템을 통해 자신에게 맞는 흥미와 진로를 찾을 수 있고, 가고자하는 대학, 학과에 맞는 요소들을 분석하고 보완하여 성공적인 진학에 한발 더 나아갈 수 있다. 학교생활기록부의 각 항목을 3가지로 분리시켜 필요 단어와 불필요한 단어들을 구분해 분석한다. 분석한 데이터를 시각화&수치화 하여 학교생활에서 보완할 수 있는 분석시스템을 구축한다. 기존 선행연구로 단어빈도와 유사도 분석을 이용한 다중주제 회의록 요약시스템을 응용하여 다른 요소의 문장을 간결하게 요약하고 단어를 추출함으로써 데이터 마이닝을 통한 분석시스템을 활용할 수 있다.

빅데이터 분석을 통한 무인계산대 사용자 경험에 관한 연구 (A study on the User Experience at Unmanned Checkout Counter Using Big Data Analysis)

  • 김애숙;정선미;류기환;김희영
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.343-348
    • /
    • 2022
  • 본 연구는 SNS 빅데이터를 활용하여 소비자들이 인지하는 무인계산대에 대한 사용자 경험을 분석하고자 한다. 이 연구를 위하여 네이버(NAVER)와 다음(Daum)에서 블로그, 뉴스, 지식인, 카페, 지식인(팁), 웹 문서를 대상으로 분석하였고 자료 검색을 위한 키워드는 '무인계산대'를 사용하였다. 자료 분석 기간을 2020년 1월1일부터 2021년 12월 31일까지 2년으로 선정하였다. 자료수집 및 분석을 위해서는 텍스톰(TEXTOM)을 통하여 빈도 및 매트릭스 데이터를 추출하였고 UCINET 6 프로그램의 NetDraw 기능을 이용해 네트워크 분석과 시각화 분석을 실시하였다. 그 결과 무인계산대는 소비자들의 경험요소 정의에 따라 접근성, 사용성, 지속사용의도, 기타로 군집화하였다. 공급자 측면에서 최저임금 인상과 근로시간 단축에 따른 문제를 해결하기 위해 무인계산대가 무분별하게 확산된다면 사회적 관점에서 더 큰 고용문제가 발생할 것이다. 아울러 무인계산에 익숙하지 않은 노인과 젊은 세대, 어린이, 외국인 등을 위해 쉽고 편리한 무인계산대 보급을 위한 제도화가 필요하다.

컴퓨터관련 대학 수업에서 학습자가 원하는 것 (What Do Students Want In The Classroom?)

  • 안동규;최정웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.155-156
    • /
    • 2016
  • 대학 교육현장에서 수많은 비정형화된 데이터가 생산되고 있는데 그중 관심 있게 볼 부분은 학생들의 서술적 강의평가이며, 본 논문에서는 대학에서 시행하는 서술적 강의평가를 활용하여 컴퓨터를 활용하는 수업에서 학생들이 원하는 상호작용을 분석하였다. 분석을 위해 빅데이터에서 활용하는 텍스트 마이닝 기법을 활용하였으며 분석결과 컴퓨터관련 관련 수업에서 필요한 학습자 상호작용은 주로 흥미, 기회, 열정, 재미, 참여, 유익, 친절 등으로 나타났다. 현재 5점 척도로 보여 지는 강의평가 점수는 진정 학습자가 원하는 것이 무엇인지 파악이 어렵기 때문에 관련 연구가 지속적으로 필요하다. 또한 향후 컴퓨터를 활용하지 않은 수업과 비교함으로써 대학 컴퓨터 관련 수업의 특징을 구분할 필요가 있을 것으로 여겨진다.

  • PDF

온라인 구매 행태를 고려한 토픽 모델링 기반 도서 추천 (Topic Modeling-based Book Recommendations Considering Online Purchase Behavior)

  • 정영진;조윤호
    • 지식경영연구
    • /
    • 제18권4호
    • /
    • pp.97-118
    • /
    • 2017
  • Thanks to the development of social media, general users become information and knowledge providers. But customers also feel difficulty to decide their purchases due to numerous information. Although recommender systems are trying to solve these information/knowledge overload problem, it may be asked whether they can honestly reflect customers' preferences. Especially, customers in book market consider contents of a book, recency, and price when they make a purchase. Therefore, in this study, we propose a methodology which can reflect these characteristics based on topic modeling and provide proper recommendations to customers in book market. Through experiments, our methodology shows higher performance than traditional collaborative filtering systems. Therefore, we expect that our book recommender system contributes the development of recommender systems studies and positively affect the customer satisfaction and management.

전국 대학의 학과 명칭 분석 (Analysis of University Department Name)

  • 반재훈;김동현;하종수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.145-148
    • /
    • 2018
  • IT 기술의 발전에 따라 미래를 예측할 수 있는 빅데이터 의 중요성이 강조되고 있으며, 다양한 산업에서 이를 활용하고 있다. 이러한 빅 데이터를 분석할 수 있는 도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 대학은 최고의 학문기관으로서 시대의 발전과 요구에 따라 그에 대응하는 학과를 개설하고 유지해 왔다. 따라서 대학의 학과명을 분석하면 현 시대의 요구와 기술의 발전에 대하여 알 수 있다. 본 논문에서는 빅데이터 분석도구인 R을 이용하여 전국에 2 4년제 대학, 대학원의 학과를 분석한다. 학과 명칭을 수집하고 각 데이터를 분석하여 학과 명칭의 빈도를 조사하며 대학에 어떤 학과 명칭이 자주 사용되는지를 파악한다.

  • PDF

빅데이터 마이닝을 위한 점진적 학습 기반 콘텐츠 큐레이션 시스템 설계 (Design of Contents Curation System Based on Incremental Learning Technology for Big Data Mining)

  • 민병원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.421-422
    • /
    • 2017
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 큐레이션 서비스에서는 개인비서, 금융 분야의 투자, 자율주행, 저널리즘, 효율적인 업무 지시/감독, 제조업의 자동화 공정, 교육, 콘텐츠 유통, 학술정보 등에서 컴퓨터가 방대한 양의 데이터로 부터 학습하여 사람의 일을 대신 처리하거나 의사결정에 도움을 줌으로써 업무의 효율을 높여주는 서비스 산업에 활용이 가능하다.

  • PDF

빅데이터 분석 기반의 제품 평판 마이닝 알고리즘 (An algorithm for mining the reputation of a product based on big data analytics)

  • 박상민;박새빛;온병원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.420-423
    • /
    • 2016
  • 최근 여론조사 분야에서 빅데이터 분석 기법이 널리 활용되고 있다. 기업에서는 최근 출시된 제품에 대한 선호도를 조사하기 위해 기존의 설문조사나 전문가의 의견을 단순 취합하는 것이 아니라, 온라인상에 존재하는 다양한 종류의 데이터를 수집하고 분석하여 제품에 대한 대중의 기호를 정확히 파악할 수 있는 방안이 필요하다. 본 연구에서는 빅데이터로부터 제품의 평판을 자동으로 찾아내는 텍스트 마이닝 방안을 제안하고, 소나타 자동차를 중심으로 제안 방안의 효율성을 평가하고 실험 결과를 자세히 분석한다.