• 제목/요약/키워드: bigdata

검색결과 601건 처리시간 0.021초

빅데이터 분석을 통한 트렌드 파악 및 사용자 맞춤 도서 추천 (A Trend Analysis and Book Recommendation through Bigdata Analysis)

  • 윤경서;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.363-364
    • /
    • 2023
  • 카테고리별 베스트셀러를 통해 트렌드 파악 및 사용자 맞춤형 도서 추천을 위해 카테고리별로 도서 데이터를 수집하고, 대용량 데이터인 위키피디어 데이터를 이용하여 워드임베딩 모델을 구축한다. 도서 데이터에 대한 키워드 분석 및 LDA 주제분석 기법에 의해 카테고리별 핵심 단어 분석을 통해 도서 트렌드를 파악하고, 사용자 맞춤형 도서 정보 제공 및 도서를 추천하는 기능을 구현한다.

Visual Cell : 바이오세포 이미지 빅데이터를 위한 이미지 분석 및 시각적 검색 시스템 (Visual Cell : Image Analysis and Visual Retrieval System for Biology Cell Image Bigdata)

  • 박범준;조선화;이수안;신지운;유혁상;김진호
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.53-61
    • /
    • 2019
  • 주변 세포의 구조적, 생화학적 지지체를 제공하는 세포 외 기질은 세포의 분열과 분화 등을 좌우하는 세포생리 조절인자이다. 바이오 분야에서는 3차원 조직공학 지지체인 스캐폴드를 제작하고, 제작한 스캐폴드에 줄기세포를 배양해 동물에 이식해 조직 재생력을 평가한다. 이는 조직 내 콜라겐과 같은 구성성분에 좌우된다. 따라서 조직 내 구성성분의 포함율 및 분포를 파악하는 것이 매우 중요한데, 이에 관한 데이터를 염색된 조직 이미지의 색상을 분석함으로써 얻어낸다. 이때 이미지 수집부터 분석까지의 과정이 적지 않은 비용이 소모되고 있고, 수집되고 분석된 데이터를 연구 기관마다 상이한 포맷으로 관리하고 있다. 따라서 데이터 통합관리 및 분석결과 검색 등이 이루어지지 않고 있다. 본 논문에서는 관련 빅데이터를 통합적으로 관리할 수 있는 데이터베이스를 구축하고, 이 연구 분야에서 중요한 분석 척도인 색상을 기준으로 검색할 수 있는 바이오 이미지 통합 관리 및 검색 시스템을 제안한다.

  • PDF

소셜 빅데이터 분석과 기계학습을 이용한 영화흥행예측 기법의 실험적 평가 (An Experimental Evaluation of Box office Revenue Prediction through Social Bigdata Analysis and Machine Learning)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.167-173
    • /
    • 2017
  • 인공지능으로 대표되는 4차 산업혁명에 대한 관심이 증가함에 따라 사회 전반에 빅데이터 및 머신러닝 활용하려는 움직임이 활발해지고 있다. 이러한 움직임은 다양한 분야에서의 예측 시스템 개발로 현실화되고 있다. 특히 영화 산업에서는 투자, 마케팅 등에 활용을 위해 흥행 여부를 사전에 예측하고자하는 여러 가지 시도가 있어왔다. 예전에는 영화에 대한 정적 데이터만을 고려한 예측이 주류를 이뤘으나, 최근에는 실시간으로 생성되는 소셜 데이터를 활용하여 예측하고자하는 노력이 진행되고 있다. 본 논문에서는 영화의 정적 데이터와 더불어 기사, 블로그, 영화평 등 다양한 피드백 정보를 활용한 예측 기법을 제안한다. 또한 제안한 기법을 활용하여 상대적으로 흥행에 성공한 영화만을 대상으로 이들의 흥행정도를 정량적으로 추정할 수 있는지의 여부를 실험적으로 평가하였다.

시민 데이터과학자를 위한 빅데이터 예측 지원 서비스 (Bigdata Prediction Support Service for Citizen Data Scientists)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.151-159
    • /
    • 2019
  • 4차 산업의 근간이 되는 빅데이터 시대가 도래하면서 대부분의 관련 업계에서는 데이터에 대한 저장, 통계분석 및 시각화 기술 중심으로 관련 솔루션들이 개발되고 있다. 하지만 빅데이터 기술의 근본적인 발전을 위해서는 인공지능을 이용한 예측 분석기술의 발전이 필요하다. 하지만 이러한 고급기술은 현재 데이터과학자라고 불리는 일부 전문가에 의해서만 가능한 수준이다. 이를 극복하기 위해서는 데이터에 대한 통찰력을 지닌 비전문가(시민 데이터과학자)가 빅데이터 분석 과정을 저비용으로 쉽게 접근할 수 있는 기반이 마련되어야한다. 본 논문에서는 고수준의 데이터과학 지식 없이 사용하기 쉬운 빅데이터 도구 및 기술의 도움으로 데이터를 분석하기 위한 서비스 과정을 제안한다. 이를 위해 필요한 예측 분석 시스템에 필요한 구성 요소와 환경을 정의하고 전반적인 서비스 설계 방안을 제시한다.

게임데이터를 이용한 승패예측 및 세분화된 변수 중요도 도출 기법 (Predicting win-loss using game data and deriving the importance of subdivided variables)

  • 오민지;최은선;;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.231-240
    • /
    • 2020
  • 정보통신기술의 발달과 더불어 게임 산업이 성장하면서 유저의 게임데이터는 다양한 플레이 및 옵션에 따라 초 단위로 기록되며 방대한 양의 게임데이터를 빅데이터 기반으로 분석할 수 있게 되었다. 비즈니스와 결합하여 다양한 분야에서 수익창출을 위한 새로운 가치를 발견하는 것에 빅데이터를 활용하고 있지만, 게임 산업에서의 빅데이터 활용은 미흡한 실정이다. 본 연구에서는 리그오브레전드의 게임데이터를 이용하여 라인 별 승패예측모형을 구축한 뒤 세분화 된 라인의 특성을 반영한 변수 중요도를 도출하여 일반 게임유저가 승률을 올리기 위해 전적검색사이트를 이용하여 사전에 팀 구성원에 대한 정보를 제공받을 수 있도록 한다.

Analysis of Social Network Service Data to Estimate Tourist Interests in Green Tour Activities

  • Rah, HyungChul;Park, Sungho;Kim, Miok;Cho, Youngbeen;Yoo, Kwan-Hee
    • International Journal of Contents
    • /
    • 제14권3호
    • /
    • pp.27-31
    • /
    • 2018
  • Social network service (SNS) data related to green tourism were used to estimate preferred tour sites and users' interests. Keywords related with green tour activities were employed to search the SNS data. SNS data were collected from Korean blogs such as Naver and Daum from June $1^{st}$ to August $31^{st}$ between 2015 and 2017 using text-mining solution. During the study period, seven hundred and five posts were analyzed. Associated words that frequently co-occurred with keywords were classified into different categories depending on the nature of associated words. Associated words included swimming pools and camping sites (location); experience and swimming pools (attribute); and water play and culture (culture/leisure). Our data suggest that SNS users with experience of green tourism in Korea exhibited interest in green tourism with swimming pools, camping sites, experience, water play and/or culture rather than particular popular sites. Based on the findings, it is recommended that preferred facilities such as swimming pools should be provided at green tourism sites to meet the users' needs and to facilitate green tourism.

엔지니어링 서비스 지원을 위한 클라우드 기반 빅데이터 플랫폼 개발 연구 (A Study of Bigdata Platform for Supporting Engineering Services)

  • 서동우;김명일;박상진;김재성;정석찬
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.119-127
    • /
    • 2019
  • 본 연구는 엔지니어링 분야에서 생성되는 대용량의 빅데이터를 효율적으로 저장, 관리, 분석하는 클라우드 기반 빅데이터 플랫폼을 제안하고자 한다. 클라우드 기반 빅데이터 플랫폼은 HPC 클라우드 환경, 엔지니어링 빅데이터 분석 플랫폼, 데이터 수집 및 처리 모듈, 인공지능 기반 분석 라이브러리, 응용서비스로 구성된다. 이를 통해 데이터 분석에 대한 전문지식이 없는 엔지니어링 전문가가 IoT 빅데이터를 수집 및 분석함으로써 산업적으로 활용이 가능하다. 마지막으로 응용서비스에서는 빅데이터 플랫폼 적용 사례를 제시하기 위해 하수처리플랜트 데이터를 이용하여 서비스를 구현하였다.

  • PDF

Comprehensive Knowledge Archive Network harvester improvement for efficient open-data collection and management

  • Kim, Dasol;Gil, Myeong-Seon;Nguyen, Minh Chau;Won, Heesun;Moon, Yang-Sae
    • ETRI Journal
    • /
    • 제43권5호
    • /
    • pp.835-855
    • /
    • 2021
  • With the recent increase in data disclosure, the Comprehensive Knowledge Archive Network (CKAN), which is an open-source data distribution platform, is drawing much attention. CKAN is used together with additional extensions, such as Datastore and Datapusher for data management and Harvest and DCAT for data collection. This study derives the problems of CKAN itself and Harvest Extension. First, CKAN causes two problems of data inconsistency and storage space waste for data deletion. Second, Harvest Extension causes three additional problems, namely source deletion that deletes only sources without deleting data themselves, job stop that cannot delete job during data collection, and service interruption that cannot provide service, even if data exist. Based on these observations, we propose herein an improved CKAN that provides a new deletion function solving data inconsistency and storage space waste problems. In addition, we present an improved Harvest Extension solving three problems of the legacy Harvest Extension. We verify the correctness and the usefulness of the improved CKAN and Harvest Extension functions through actual implementation and extensive experiments.

News Article Identification Methods with Fact-Checking Guideline on Artificial Intelligence & Bigdata

  • Kang, Jangmook;Lee, Sangwon
    • International Journal of Advanced Culture Technology
    • /
    • 제9권3호
    • /
    • pp.352-359
    • /
    • 2021
  • The purpose of this study is to design and build fake news discrimination systems and methods using fact-checking guidelines. In other words, the main content of this study is the system for identifying fake news using Artificial Intelligence -based Fact-checking guidelines. Specifically planned guidelines are needed to determine fake news that is prevalent these days, and the purpose of these guidelines is fact-checking. Identifying fake news immediately after seeing a huge amount of news is inefficient in handling and ineffective in handling. For this reason, we would like to design a fake news identification system using the fact-checking guidelines to create guidelines based on pattern analysis against fake news and real news data. The model will monitor the fact-checking guideline model modeled to determine the Fact-checking target within the news article and news articles shared on social networking service sites. Through this, the model is reflected in the fact-checking guideline model by analyzing news monitoring devices that select suspicious news articles based on their user responses. The core of this research model is a fake news identification device that determines the authenticity of this suspected news article. So, we propose news article identification methods with fact-checking guideline on Artificial Intelligence & Bigdata. This study will help news subscribers determine news that is unclear in its authenticity.

O2O 서비스 이용자의 동기가 기대충족과 만족을 통해 충성도에 미치는 영향 (An Effect of O2O Service Users' Motivation on Loyalty through Expectation-Confirmation and Satisfaction)

  • 안기훈;이신복;이새봄;서영호
    • 품질경영학회지
    • /
    • 제46권4호
    • /
    • pp.923-938
    • /
    • 2018
  • Purpose: O2O service are becoming popular in various industries such as food delivery and taxi. This research explores how users' motivation of O2O service influence customer loyalty through expectation-confirmation and satisfaction. this study attempts to explore the motivation factor (i.e. pricing, enjoyment, immediately, social influence) and to empirically examine the relationships between those and users' loyalty to O2O service. Methods: To test the proposed research model, a survey research methodology was used. Paper survey was distributed to O2O service users in Korea. A total of 198 data were used for the analysis. Structural equation modeling was used to test hypotheses. Results: According to our findings, this study found that satisfaction was positively influenced by users' motivation factors. all hypotheses about the effect of motivation on expectation-confirmation were statistically not significant. Conclusion: O2O service providers should consider the results of this study to satisfy users' expectations and satisfaction for building a better O2O market.