• 제목/요약/키워드: 빅데이터플랫폼

검색결과 483건 처리시간 0.03초

평점 예측 모델 개발을 위한 관광지 만족도 정량 지수 구축: 제주도 관광지 리뷰를 중심으로 (Development of a Tourist Satisfaction Quantitative Index for Building a Rating Prediction Model: Focusing on Jeju Island Tourist Spot Reviews)

  • 윤동규;박기태;최상현
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.185-205
    • /
    • 2023
  • 코로나19 팬데믹 이후 관광 산업이 회복되면서 많은 관광객들이 다양한 플랫폼을 활용하고 리뷰를 남기고 있지만, 대량의 데이터 속에서 유용한 정보를 찾기 어려워 아직도 여행지 선정 과정에서 많은 시간과 비용이 낭비되고 있다. 이에 따라 많은 연구들이 진행되고 있지만, 평점이 없거나 플랫폼별로 다른 형태의 평점 제공으로 인해 연구에 한계를 가지고 있으며, 평점과 리뷰 내용이 일치하지 않는 경우도 있어 추천 모델 구축에 어려움을 주고 있다. 본 연구에서는 이러한 문제를 해결하기 위해 7,104개의 제주도 지역 관광지 리뷰를 활용하여 제주도에 특화된 관광지 만족도 정량 지수를 개발하고 이를 활용하여 '평점 예측 모델'을 구축하였다. 모델의 성능을 확인하기 위해 실험 데이터 700건의 평점을 본 연구에서 개발된 모델과 LSTM을 활용하여 예측 하였으며, 제안된 모델이 LSTM 보다 약 4.67% 높은 73.87%의 가중 정확도로 성능이 더 우수한 것을 확인하였다. 본 연구의 결과를 통해 평점과 리뷰 내용 사이의 불일치 문제를 해결하고, 평점이 없는 리뷰나 다양한 형태의 평점을 정형할 수 있으며, 다른 도메인에 적용하여 여행의 모든 분야에서 신뢰할 수 있는 평점 지표를 제공할 수 있을 것으로 기대된다.

스트림-리즈닝을 위한 실시간 사물인터넷 빅-데이터 처리 (Real-Time IoT Big-data Processing for Stream Reasoning)

  • 윤창호;박종원;정혜선;이용우
    • 인터넷정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.1-9
    • /
    • 2017
  • 스마트-시티는 스마트-시티의 사물인터넷(Internet of Things: IoT) 디바이스를 비롯한 수많은 인프라를 지능적으로 관리하고, 다양한 스마트 어플리케이션을 도시민에게 제공한다. 스마트-시티에서는 스마트-시티 어플리케이션에서 필요한 다양한 정보를 제공하기 위하여 수많은 사물인터넷 기기들로부터 끊임없이 발생하는 대규모의 스트림 빅-데이터를 지능적으로 처리하는 기능이 필요하다. 하지만, 스마트-시티에서 대규모의 스트림 빅-데이터를 처리하는 것에는 실시간 처리와 관련된 제약들이 존재한다. 본 스마트-시티-사업단에서는 선행 연구에서 스마트-시티미들웨어와 이를 이용한 스트림-리즈닝 방법론 및 시스템을 개발하였다. 스마트-시티에서 스마트 서비스를 제공하기 위하여, 스마트-시티-사업단에서는 스트림-리즈닝을 사용하는 방법론을 사용한다. 이 스트림-리즈닝은 대용량 데이터의 실시간 처리를 필요로 한다. 따라서, 후속연구로서 스마트-시티미들웨어의 클라우드-컴퓨팅 플랫폼을 이용하여 스트림-리즈닝을 위한 실시간 분산병렬처리 클라우드-컴퓨팅 방법론과 시스템을 개발하였다. 본 논문에서는 스마트-시티에서 발생하는 사물인터넷 빅-데이터를 스트림-리즈닝에 사용하기 위하여 이 후속연구에서 개발된 클라우드 기반 실시간 분산병렬처리 연구결과를 소개한다. 스마트-시티의 각종 센서들로부터 전송되어지는 사물인터넷 빅-데이터를 사용하여 스트림-리즈닝하는 데 필요한 클라우드-컴퓨팅 기반의 실시간 분산처리 방법론과 시스템을 소개하고 있으며, 이 방법론을 선행연구에서 개발한 스마트-시티 미들웨어에 구현하여 실시간 분산처리 성능을 평가한 것을 소개한다.

중소기업의 자동화 생산 정보 플랫폼 구축 모델 설계 (Designing an Automated Production Information Platform for Small and Medium-sized Businesses)

  • 정윤수;김용태;박길철
    • 융합정보논문지
    • /
    • 제9권1호
    • /
    • pp.116-122
    • /
    • 2019
  • 최근 중소기업은 세계적인 경쟁력을 갖추기 위해서 공정/품질/에너지 데이터 집계가 자동 또는 실시간으로 처리할 수 있는 산업 구조로 급격하게 변화하고 있다. 특히, 중소기업 생산 공정에서 생산되는 실시간 정보 분석은 중소기업의 유의미한 성과들을 분석, 예측, 처방 및 이행하는 새로운 공정 프로세스 형태로 진화해 가고 있다. 본 논문에서는 중소기업에서 생상되는 데이터를 고도화할 수 있도록 중소기업의 자동화 생산 정보 시스템을 빅데이터화 할 수 있는 플랫폼 구축 모델을 제안한다. 제안 모델은 스마트한 중소기업의 데이터 수집을 위해 중소기업에서 생산되는 제품의 기본 정보에 대한 다양한 데이터를 활용해 중소기업의 운영 효율화(컨설팅 및 교육 등) 및 전략적 의사결정을 지원할 수 있는 기능이 있다. 또한, 제안 모델은 종소기업의 정보 공유 및 시스템 연계가 원활하게 서로 다른 지역적 특성 및 분야를 가지는 중소기업들간에 긴밀한 협조가 가능한 것이 특징이다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

아파치 스쿱을 사용한 하둡의 데이터 적재 성능 영향 요인 분석 (Analysis of the Influence Factors of Data Loading Performance Using Apache Sqoop)

  • ;고정현;여정모
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권2호
    • /
    • pp.77-82
    • /
    • 2015
  • 빅데이터 기술은 데이터 처리 속도가 빠르다는 면에서 주목을 받고 있다. 그리고 관계형 데이터베이스(Relational Database: RDB)에 저장되어있는 대용량 정형 데이터를 더 빠르게 처리하기 위해서 빅데이터 기술을 활용하는 연구도 진행되고 있다. 다양한 분산 처리 도구들을 사용하여 분석 성능을 측정하는 연구는 많지만 분석하기 전 단계인 정형 데이터 적재의 성능에 관한 연구는 미미하다. 때문에 본 연구에서는 RDB 안에 저장되어있는 정형 데이터를 아파치 스쿱(Apache Sqoop)을 사용하여 분산 처리 플랫폼 하둡(Hadoop)으로 적재하는 성능을 측정하였다. 그리고 적재에 영향을 미치는 요인을 분석하기 위해 여러 가지 영향 요소를 변경해가면서 반복적으로 실험을 수행하였고 RDB 기반으로 구성된 서버 간의 적재 성능과 비교하였다. 실험 환경에서 아파치 스쿱의 적재 속도가 낮았지만 실제 운영하고 있는 대규모 하둡 클러스터 환경에서는 더 많은 하드웨어 자원이 확보되기 때문에 훨씬 더 좋은 성능을 기대할 수 있다. 이는 향후 진행할 적재 성능 개선 및 하둡 환경에서 정형 데이터를 분석하는 전체적인 단계의 성능을 향상시킬 수 있는 방법에 대한 연구의 기반이 될 것으로 예상한다.

하둡과 맵리듀스 (Hadoop and MapReduce)

  • 박정혁;이상열;강다현;원중호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1013-1027
    • /
    • 2013
  • 대용량 데이터 분석의 필요성이 급격히 증대되면서 이를 가능케 해 주는 플랫폼인 하둡과 그 내부적인 계산 모형인 맵리듀스에 대한 관심 또한 늘고 있다. 본고에서는 R 등의 통계 프로그래밍에 익숙한 데이터 분석가가 하둡을 사용하고자 할 때 알아야 할 기본 개념들을 R과 하둡을 결합하는 몇가지 예제와 함께 소개한다.

감염병 위기 대응을 위한 소셜 데이터 수집 및 적재 엔진 기반 신뢰도 분석 시스템 개발 (Development of Social Data Collection and Loading Engine-based Reliability analysis System Against Infectious Disease Pandemic)

  • 정두영;이상준;민경일;정석송;한현욱
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.103-111
    • /
    • 2022
  • 감염병 대응과 관련된 기관, 조직, 사이트 등의 다수 운영되고 있으나 코로나-19와 같은 팬더믹 상황이 수년간 지속됨에 따라 초기양상과 현재 양상의 수많은 변화가 있으며 이에 따른 정책과 대응체계도 진화하고 있다. 이에 따른 지역별 격차가 발생하고 정책에 대한 신뢰와 불신, 이행도에 따른 여러 가지 문제들이 산재해 있다. 따라서 본 연구에서는 정보전염이 포함된 소셜 데이터를 분석하는 과정에서 루머가 포함된 데이터를 수집하는 과정에서 팩트 체크가 되는 언론 매체와 다르게 정확한 출처를 알 수 없는 부정확한 정보들이 포함되는 주요 소셜 미디어 플랫폼 중의 하나인 트위터 데이터를 수집하여 사실과 무관한 내용을 사전 차단하는 시스템을 개발했다. 비정형데이터인 소셜데이터를 기반으로 감염병 위협을 자동 감지할 수 있는 알고리즘을 개발하여 감염병 위기 대응과 관련된 객관적인 근거를 창출함으로써 관련 분야 국제경쟁력을 공고히 하고자 한다.

사례 연구를 통한 스마트 시티 플랫폼의 서비스를 위한 참조 모델 (Reference Model for the Service of Smart City Platform through Case Study)

  • 김영수;문형진
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.241-247
    • /
    • 2021
  • 도시 발전에 따른 부작용들을 해결하기 위한 한 방안으로 도시에 정보 통신 기술이 융합된 스마트 시티를 구축하고 있다. 스마트 시티 플랫폼은 스마트 시티 서비스의 개발 및 통합을 지원해야 한다. 따라서 스마트 플랫폼이 지원해야 하는 기반 기술과 기능적 및 비 기능적 요구 사항을 분석하였다. 스마트 시티 플랫폼이 지원하는 기반 기술로 사물 인터넷, 클라우드 컴퓨팅, 빅 데이터 및 사이버-물리 시스템의 4가지 범주로 분류하고 구현 가능한 기능적 및 비 기능적 요구 사항과 스마트 시티 플랫폼의 참조 모델을 도출했다. 스마트 시티 플랫폼의 참조 모델은 도시관리자에게 특정 도시 문제를 해결하기 위한 기능적 또는 비 기능적 요구 사항에 따른 기반 기술의 투자와 서비스 개발 범위에 대한 의사 결정에 활용하고. 플랫폼 개발자에게 스마트 시티 구축을 위한 소프트웨어 플랫폼의 기능적 및 비 기능적 요구 사항과 구현 기술을 식별하고 결정하는 가이드라인을 제공한다.

쉐어 지수를 이용한 쉐어하우스 플랫폼 신뢰성 문제 해결을 위한 방안 (A Solution for The Reliability Problem of Share House Platform Using Share Index)

  • 김현국;박진태;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.733-735
    • /
    • 2017
  • 공유경제의 필요성이 높아짐에 따라 자동차 공유, 자전거 공유, 주택 공유, 도서 공유 등 공유를 기반으로 한 수많은 상용 플랫폼이 늘어나고 있다. 그리고 그 중, 무엇보다도 주거 문제를 겨냥한 공동 주택, 다른 경제 모델보다 가장 큰 성장을 보여주고 있다. 그러나 이러한 급속한 성장 속에서 공유경제에 대한 공평성과 상호 플랫폼상의 신뢰성 문제 등 몇몇 예기치 못한 문제점들이 드러났다. 하지만 현재 이 상황을 해결할 방법에 대하여 실제 나와 있는 사례들은 많지 않다. 따라서 본 논문에서는 현재의 쉐어하우스 플랫폼의 상기 서술한 바와 같은 기존 문제를 해결할 수 있는 몇 가지 방법을 논하고자 한다.

  • PDF

디지털 경제의 긴꼬리 효과에 관한 실증 연구

  • 안용길;이철성
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2024년도 춘계학술대회
    • /
    • pp.17-20
    • /
    • 2024
  • 우리는 대표적인 디지털 플랫폼인 온라인 음식 주문 배달 산업을 대상으로 디지털 경제의 긴꼬리 효과를 계량화한다. 특히, 코로나19 시기를 거치면서 음식배달플랫폼 입점으로 인한 긴꼬리 효과의 변화 양상을 고찰한다. 배달의민족에 입점한 음식점 15,000곳을 무작위로 선별하고 이들 매장의 2019년부터 2021년까지 전체 주문 정보를 취합(aggregation)하여 선형로그변환 후 기울기를 추정하여 디지털 경제의 긴꼬리 효과를 실증 분석하였다. 2019년부터 2021년까지 관찰기간 동안 음식 배달 플랫폼 활용 음식점 주비모수 분포의 긴꼬리 효과는 강건하게 관찰되었다. 이는 코로나19 이후 음식배달 플랫폼을 통한 음식점의 디지털 전환이 틈새시장 확장에 일정 부분 기여하였음을 의미한다. 또한, 긴꼬리 효과는 객단가가 높을수록 매출액 상위 집단일수록 더 커지는 반면, 비황금 시간대 매출비중이 높은 경우 긴꼬리 효과가 통계적으로 유의하게 증가하지 않았다. 이 결과는 피자, 족발 등 단가가 높고 비교적 배달서비스가 활발한 카테고리에서 음식 주문 및 배달 산업의 디지털 전환 효과가 증가한다는 업계 실무자들의 관찰과 부합한다. 타 업종에서도 상대적으로 경쟁이 치열한 시장 구분에서 디지털 경제의 긴꼬리 효과가 보다 강건하게 관찰될 것이라고 여겨진다. 음식점 간 경쟁강도가 상대적으로 약한 비황금시간대 매출비중이 긴꼬리 효과에 통계학적으로 유의한 영향을 주지 않는다는 실증결과 또한 동일한 함의가 있다.

  • PDF