• 제목/요약/키워드: 빈도분석

검색결과 9,556건 처리시간 0.045초

로지스틱 회귀 알고리즘을 활용한 상품 기획 예측 모형 개발에 관한 연구 (A Study on the Development of Product Planning Prediction Model Using Logistic Regression Algorithm)

  • 안영휘;박구락;김동현;김도연
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.39-47
    • /
    • 2021
  • 본 연구에서는 계절적인 요인과 급변하는 상품의 트렌드를 사전예측하기 위해 로지스틱 회귀 알고리즘을 이용한 상품기획 예측 모형을 제안하고자 수행되었다. 먼저 웹크롤링을 이용하여 포털 사이트 및 온라인 마켓의 소비자의 비정형 데이터를 수집하고 정형 데이터 변환을 위한 전처리 작업을 통해 상품에 대한 의미 있는 정보를 분석하였다. 최종 수집된 11,200개의 데이터셋은 Logistic Regression을 이용하여 상품에 대한 소비자의 만족도, 빈도분석, 상품에 대한 장점과 단점을 분석할 수 있었다. 분석 결과 소비자의 만족도는 92%이었으며, 빈도분석을 통해 상품에 대한 불량이슈를 확인할 수 있었다. 또한, 개발된 상품 기획 예측 프로그램에 대한 사용 만족도, 시스템 효율성, 시스템 효과성 항목에 대한 분석결과에서도 만족도가 높게 나타났다. 특히, 불량이슈는 상품에 대한 현 문제를 신속히 인지하고 개선 전략을 수립하는데 필요한 정보를 제공한다는 점에서 매우 의미 있는 자료가 된다.

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

결혼 후 배우자 유무와 음주 행태의 관련성 연구 (A Study on the Relationship between married existence of spouse and drinking behavior)

  • 임종민;나백주;이무식;홍지영;노형수;정계림;황혜정
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.479-483
    • /
    • 2009
  • 서론: 최근 음주가 사회적 문제로 더욱 심각하게 인식되고 있는 가운데 우리나라의 음주 소비량은 점점 증가하고 있는 추세이다. 또한 빠른 사회경제적 변화는 새로운 도덕과 가치의 변화를 가져왔으며 알코올 소비량의 증가와 관계가 있다.(양정남, 1998) 특히 결혼 및 배우자 유무는 음주에 중요한 관련 요인이라는 주장이 있음에도(김태수 등, 2003) 실증적인 연구는 미흡한 실정이다. 따라서 본 연구는 결혼 후 배우자 유무와 음주 형태의 관련성을 파악하고 음주 관련 교육 자료로 활용하고자 한다. 연구방법: 연구 대상자는 2005년 국민건강영양조사에서 40대 이상의 남녀 중 결혼 경험이 있는 14,970명 중 음주행태에 관한 설문에 응답한 3,190명이었으며, 결혼 후 배우자의 유무에 따른 고위험 음주 경험 및 다빈도 음주, 음주자제빈도, 고위험음주빈도와의 관련성을 통계 분석하였다. 연구결과: 결혼 후 배우자 유무에 따른 음주 행태의 연구 결과는 다음과 같다. 연구대상자의 일반적 특성은 남자 1,678명(52.6%)이며, 여자 1,512명(47.4%)였다. 연령별로는 65세 미만 2,359명(73.9%), 65세 이상 831명(26.1%)이었다. 결혼상태는 유배우 2,621명(82.2%), 사별 344명(10.8%), 이혼 및 별거 225명(7.1%)이었다. 고위험 음주경험은 한달에 한번 미만 1,883명(59.0%), 한달에 한번 정도 379명(11.9%), 일주일에 한번 이상 928명(29.1%)으로 한달에 한번 미만 고위험 음주를 경험한다가 가장 많았으며, 일주일에 한번이상. 일주일에 한번정도 순으로 고위험 음주를 한다고 응답하였다. 월평균 음주 횟 수에 있어서는 5회 이하 1,149명(36.0), 6회-10회 395명(12.4%), 11회이상 593명(27.7%)이었다. 고위험 음주 경험을 종속변수로 한 로지스틱 회귀분석에서 여자보다 남자가 고위험 음주 경험을 많아 하며, 연령이 증가하면 고위험 음주음 경험이 낮아지며, 교육수준이 높아지면 고위험 음주 경험은 낮아지는 것으로 나타났다. 음주자제 경험 종속변수로 한 로지스틱 회귀분석에서 여자보다 남자가 음주자제 경험을 많아 하며, 연령이 증가하면 음주자제 경험이 낮아지며, 교육수준이 높아지면 음주자제 경험은 낮아지는 것으로 나타났다. 다빈도 음주 경험 종속변수로 한 로지스틱 회귀분석에서 여자보다 남자가 다빈도음주 경험을 많아 하며, 연령이 증가하면 다빈도 음주 경험 높아지며, 가구 평균 소득이 증가 하거나, 교육수준이 높아지면 다빈도 음주 경험은 낮아지는 것으로 나타났다. 논의 및 결론: 결혼 후 배우자 유무와 고위험 음주는 남녀를 합친 전체와 남자에게서 통계적으로 유의하였으며, 음주자제빈도에서는 남녀를 합친 전체에서 통계적으로 유의하였다. 또한 다빈도 음주에서 여자에게서 통계적으로 유의하였다. 이러한 결과는 절주사업 기초자료로 활용될 수 있는 가능성을 확인하였으며, 추가적인 연구의 필요성을 시사하였다.

  • PDF

지역빈도해석을 통한 건조지역의 미계측 지점 확률홍수량 추정을 위한 연구 (Analysis for Flood Quantile Estimates at Ungauged Sites in Arid and Semi-arid Regions Based on Regional Frequency Analysis)

  • 정기철;강부식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.51-51
    • /
    • 2017
  • 지역빈도해석은 짧은 기간의 자료를 보유하고 있는 계측 지점이나 자료가 없는 미계측 지점에서의 확률수문량을 산정하기 위하여 많이 쓰여 진다. 지역빈도해석을 실시하기 위한 조건으로는 우선 수집된 하천유역들을 대상으로 수문학적 동질 지역을 구분하는 것이 중요하다. 그리고 구분되어진 지역에 포함되는 모든 지점들의 자료를 빈도해석 함으로써 관심 지점의 신뢰할 만한 확률수문량을 산정하는 것이다. 그동안의 지역빈도해석은 주로 비건조지역을 중심으로 홍수와 같은 재난재해 대비 그리고 수자원 관리를 위한 연구들을 실시해왔다. 본 연구의 주 목적은 건조지역의 수자원 관리를 위해 건조지역 하천유역을 중심으로 지역빈도해석을 실시하여 신뢰할만한 확률수문량을 산정하는 것이다. 확률수문량 산정값의 정확도를 향상시키기 위해 지역빈도해석 모델에 쓰여 지는 새로운 지형학적 변수들을 제공하였고 수문학적 동질 지역을 구분 위해 수집된 각 하천유역의 형상들을 확인하여 동질 지역을 정의하였다. 예를 들면, 수지형 유역, 부채형 유역, 격자형 유역과 같은 다른 형상들을 구분하여 각 유역 형상 종류별로 동질 지역을 만들었다. 건조지역의 지역빈도해석을 위해 미국 건조지역의 105개 하천유역 유량자료들을 수집 및 이용하였다. 확률수문량 산정을 위하여 앙상블 인경신경망 (Ensemble Artificial Neural Network)과 정준 상관 계수(Canonical Correlation Analysis)를 이용한 지역빈도해석 모델을 만들었다. 제안된 모델의 수행평가와 정확성 평가를 위해 리샘플링 기법인 10-겹 교차 검증 (10-fold cross-validation), 잭나이프 (Jackknife) 기법들을 이용하였고 모델로부터 산정된 확률수문량값을 편향 (Bias), 상대 편향(rBias), 평균 제곱근 오차 (RMSE), 상대 평균 제곱근 오차 (rRMSE)를 통하여 산정 값과 실제 관측 값의 차이를 분석하였다. 그 결과 건조지역의 지역빈도해석을 위해 새롭게 제시된 지형학적 변수들을 사용하였을 때 모델의 수행능력이 향상되었음을 확인하였다. 또한 하천유역 형상에 따라 동질 지역을 구분하였을 때 향상된 확률수문량이 산정되었다. 향상된 지역빈도해석 모델을 통해 건조지역의 신뢰할만한 확률수문량을 산정함으로써 건조지역의 효과적인 수자원 관리를 위한 수공시설물 설계에 중요한 정보들을 제공할 것이다.

  • PDF

공공도서관의 사용빈도별 서지 데이터 필드 분석 (Analysis of bibliographic data fields by frequency of use in public libraries)

  • 김주용;신판섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.245-246
    • /
    • 2021
  • 본 논문에서는 차세대 서지 기술 방법인 BIBFRAME의 적용성을 향상하기 위한 사전 연구로, 공공도서관의 서지 데이터 필드를 분석하여 사용빈도가 높은 주요 필드를 선정하고 각 필드별 태그의 의미를 제시한다. 주요 필드 선정은 실제 사용 중인 최신 서지 데이터를 대상으로 분석을 진행하며, 이를 통해 공공도서관의 다양한 KORMARC 서지 데이터 필드 중 BIBFRAME 변환을 위한 주요 데이터 필드를 추출한다.

  • PDF

HEC-GeoRAS를 이용한 홍수범람 지역 결정 (Determination of Flood Inundation Area using HEC-GeoRAS)

  • 김기석;안상진;전계원;서정우
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1131-1134
    • /
    • 2006
  • 우리나라는 최근 기상변동에 따른 집중호우와 태풍의 영향으로 풍수해 피해지역 및 재산피해액이 증가하고 있다. 이러한 풍수해 피해를 경감시키기 위해 많은 연구와 노력이 계속되고 있다. 최근에는 지리정보시스템을 이용하여 시간적, 공간적 분석을 통해 홍수범람지도 등을 작성하여 홍수 피해를 최소화 하려고 노력을 하고 있다. 본 연구에서는 지리정보시스템을 이용한 홍수범람 수심의 분포 및 범람면적 등을 산정하기 위해 HEC-GeoRAS와 HEC-RAS를 연계하여 IHP 대표시험유역으로 운영중인 금강수계 보청천유역내 삼가천 지류인 적암천에 적용하였다. 유역의 유출분석 후 ArcView와 HEC-GeoRAS를 통하여 지형학적인 인자와 요소들을 추출하고 실측자료와 비교하였으며, 빈도별 홍수량에 대한 하천의 빈도분석 후 홍수위 및 빈도별 홍수 위에 따른 피해 면적 산정 후 GIS System을 이용하여 홍수범람위험 지역을 결정하였으며 산정된 기본자료는 유역의 홍수발생시 인명과 재산 피해에 대비한 홍수범람 지도 및 홍수재해 지도 제작에 도움이 될 것으로 판단된다.

  • PDF

TV 포털 미디어 사례 연구 -하나 TV의 콘텐츠 이용 실태를 중심으로- (Case Study of Hana TV as TV Portal)

  • 이문행
    • 한국콘텐츠학회논문지
    • /
    • 제7권10호
    • /
    • pp.135-145
    • /
    • 2007
  • 하나 TV로 대표될 수 있는 TV 포털은 인터넷 종합 포털 미디어와 유사한 기능을 가지고 있을 뿐만아니라, 다운로드 파일 소비의 특성을 지니고 있다고 할 수 있다. 따라서, 이 연구에서는 하나 TV가 지니고 있는 TV포털로서의 특징이 콘텐츠 구성 및 실제 이용에 있어서 어떻게 전개되는지 살펴보고자 했다. 연구 대상은 하나 TV의 월간 접속률과 콘텐츠 요청 건수 등이며, 연구 방법으로는 기존 자료에 대한 2차 분석과 월간 시청 빈도와 콘텐츠 요청 건수에 대한 빈도 분석을 실시했다. 하나 TV의 콘텐츠 유형별 시청 빈도와 콘텐츠 요청 건수를 분석한 결과, 하나 TV시청자들이 현재 가장 많이 시청하고 있으며 향후에도 보기를 희망하는 콘텐츠 유형은 지상파 방송 프로그램인 것으로 나타났다. 이는 하나 TV가 지상파 방송의 보완 매체로 기능할 가능성이 높다는 것을 의미한다. 이에 따라 향후 케이블 TV 및 인터넷 '다시보기' 서비스와의 직접적인 경쟁이 예상된다.

남방진동지수가 강우특성과 빈도분석에 미치는 영향 분석 (Assessment of the ENSO influences on rainfall Characteristics and Frequency analysis)

  • 김병식;오제승;김치영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1619-1624
    • /
    • 2007
  • The rainfall frequency estimations are critical in the design of hydraulic structures (such as bridges and culverts) to ensure that they are built economically and safely. In other words, they are not over designed or under designed. However one of the main assumptions in the creation of these analysis is that the rainfall data for a site is stationary. That is, climatic trends and variability in a region have negligible effects on the curves. But as has been proved in recent history, climatic variability and trends do exist and their effects on precipitation have not been negligible. Increasing occurrences of the El Nino phenomenon have lead to droughts and floods around the world, and long term trends in rainfall, both increases and decreases, have been seen in all regions across Korea. The purpose of this paper is to investigate and evaluate impacts of ENSO on rainfall characteries and rainfall frequency estimations in Korea. In this paper, The available rainfall data were categorized into Warm(EL Nino), Cold(La Nina), Normal episodes based on the Cold & Warm Episodes by Season then 50 years of daily rainfall data were generated for each episodic events(EL Nino, La Nina)

  • PDF

과학기술분야 해외 학술지의 비용대 효과 분석 (A Cost-Effectiveness Analysis on the Usage of Foreign Scientific and Technical Journals)

  • 김석영;황혜경
    • 한국문헌정보학회지
    • /
    • 제35권1호
    • /
    • pp.249-264
    • /
    • 2001
  • 이 연구는 과학기술분야 해외 학술지의 비용대 효과를 파악하기 위하여 학술지의 이용당 비용(CPU)을 분석한 것이다. 대상 데이터는 한국과학기술정보연구원이 구독하고 있는 과학기술분야 학술지의 복사이용 빈도와 연간 구독비용이다. 학술지 구독비용과 복사이용빈도 분포, 학술지별 CPU, 주제분야별 CPU 등이 분석되었다. 학술지 총 구독비용의 40%가 전체 복사이용량의 80%를 제공하였으며, 학술지 구독비용은 복사이용빈도와 높은 상관관계가 있었으나 CPU와는 관련이 없는 것으로 나타났다.

  • PDF

불광천 유역의 제방취약성 분석 및 홍수규모별 침수위험지역 산정 (Analysis of Bank Weakness and Estimation of Expected Inundation Area by Flood Scales in Bulgwang River)

  • 이경지;안정환;조원철
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1841-1845
    • /
    • 2010
  • 최근 짧은 시간 내에 많은 양의 비가 내리는 게릴라성 집중호우가 도시하천유역의 침수피해사례를 증가시키고 있다. 이러한 집중호우로 인한 도시하천의 침수피해를 방지하기 위해 하천의 1차적인 홍수방지책인 제방의 안전성 검토를 통해 외수침수에 대한 위험성을 점검하며 제내지의 우수관로의 월류로 인한 내수침수에 대한 홍수방지대책확립을 위한 연구들이 진행 중에 있다. 본 연구에서는 한강의 제1지류인 홍제천 수계 중 하나인 불광천을 대상으로 제방취약성 분석 및 홍수규모별로 내수침수위험지역을 산정하여 치수 안전성을 검토하였다. 불광천은 마포구, 서대문구 및 은평구 3개의 행정구역에 포함되는 도시하천으로 하수관로, 우수관로, 하천횡단교량, 보 등의 수공구조물이 설치되어 있다. 불광천의 계획빈도인 50년 빈도와 극한홍수사상을 고려하기 위한 100년 빈도, 200년 빈도에 대한 확률 홍수량과 홍수위를 산정하여 구간별로 월류 위험도 분석에 적용하였다. 확률홍수량 산정은 SWMM모델을 이용하였고 확률홍수위 산정은 HEC-RAS모델을 활용하였다. 또한 SWMM모델을 이용하여 불광천 중류부인 응암지구를 대상으로 홍수규모별로 우수관로에서 월류되는 유역 모의를 수행하였다. 그 결과 제방 안전도 평가기준에 따라 제방위험구간을 선정하고 침수위험지역을 결정하였다. 이를 통해 빠른 홍수예 경보를 통한 홍수 피해 경감방안을 모색하고 불광천의 홍수방재체계 수립에 활용하고자 한다.

  • PDF