• 제목/요약/키워드: 데이터 요인화

검색결과 572건 처리시간 0.035초

어가의 고용량 결정요인 분석 (An Analysis on the Determinants of Employed Labour Quantity in the Fishing Industry)

  • 김태현;박철형;남종오
    • 자원ㆍ환경경제연구
    • /
    • 제27권3호
    • /
    • pp.545-567
    • /
    • 2018
  • 본 연구는 포아송모형, 음이항모형, 영과잉 포아송모형, 영과잉 음이항모형을 이용하여 어가의 고용량 결정요인을 분석하고, 개별모형 간 고용량 결정요인을 비교 분석한다. 이들 모형의 추정에 사용된 자료는 통계청에서 제공하는 2010년과 2015년의 농림어업총조사 마이크로 데이터이며, 이들 자료를 풀링(Pooling)하여 고용량 결정요인과 그 변화분에 대해 추정한다. 분석모형의 선정 결과, 과대 산포 경향을 갖고 있으면서 자가 노동 및 가족 경영으로 고용을 대체하고 있는 수산업의 특성을 모형에 동시에 반영하고 있는 영과잉 음이항모형이 선정되었다. 또한 2010년 대비 2015년 고용량 결정요인의 변화분을 분석해 본 결과, 어선을 보유한 어가와 판매금액이 많은 어가는 고용량 감소에 유의한 영향을 미치는 것으로 나타난 반면, 어가의 종사경력은 길수록 고용량 증가에 유의한 영향을 미치는 것으로 나타났다. 결론적으로 자본화된 어가와 고령화의 가속화가 수산업의 어가 고용량 수 변화에 유의한 영향을 미친 것으로 나타났다.

실버산업의 영향요인 탐색을 통한 시니어창업 활성화: 빅데이터(BIgData) 분석 (A Study on Exploring Factors Having Influenced on Silver Industry to Activate Senior Start-up : Using Big-Data)

  • 박상규;강만수;손희영;조성현
    • 벤처창업연구
    • /
    • 제11권6호
    • /
    • pp.185-194
    • /
    • 2016
  • 최근 인터넷, 모바일 등의 보급이 보편화됨에 따라, 많은 정보를 담고 있는 방대한 양의 데이터를 활용한 빅데이터(BigData) 기술의 필요성이 대두되고 있다. 빅데이터 기술은 다양한 분야에서 활용되고 있는 반면, 공공분야에서의 활용은 아직 미흡한 실정으로 본 연구에서 이를 적용하고자 한다. 다양한 공공분야 중 현재 뿐 아니라 미래사회에 큰 영향을 미치게 될 고령화를 키워드(Key-Word)로 실버산업에 영향을 미치는 요인을 탐색하였다. 분석결과, 실버산업, 독거노인, 노화, 출생, 퇴임 의 5개 변수가 탐색되었으며, 서로 상관이 있는 것으로 확인되었다. 이에 실버산업에 대하여 나머지 4개의 변수의 영향력을 분석한 결과, 통계적으로 유의한 영향을 미치는 것으로 확인되었다. 또한, 실버산업 발전의 대안으로써 독거노인 주거 공간 마련, 출산장려, 시니어 기술인 실버창업 활성화 지원의 필요성을 제안하였다. 본 연구는 빅데이터를 활용한 계량적 접근을 통해 요인을 탐색하였다는 측면에서 이론적 시사점을 제공하였으며, 그 대안을 제시함으로써 실무적 시사점을 제공하고자 하였다.

  • PDF

기계학습을 활용한 고령운전자 교통사고 분석 및 교통사고 데이터 정책 제언 (Elderly Driver-involved Crash Analysis and Crash Data Policy)

  • 김승훈
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 우리나라가 고령화시대에 진입하면서 고령운전자를 위한 교통 안전성 정책에 대한 관심이 높아지고 있다. 이를 위해서는 고령자 관련 교통사고의 영향요인을 분석하는 연구가 활성화될 필요가 있지만, 국내의 사고 데이터는 효과적인 사고분석 연구를 수행하기에는 한계가 있다. 이에 본 연구는 미국의 사고 데이터를 살펴보고 기계학습 알고리즘을 활용하여 고령운전자 사고심각도 예측 모형을 개발하고, 주요 사고 영향요인을 도출하여, 향후 국내 사고 데이터의 보완 방향을 제시하고자 한다. 분석 결과에 따르면, 주행속도, 제한속도, 사고 시 근접 주행 여부 등이 고령운전자 사고 심각도에 영향을 주는 요인으로 나타났는데, 한국의 사고 데이터에서 제공하지 않는 것으로 나타났다. 그러므로 이와 같은 정보들이 한국의 사고 데이터에서 제공된다면 고령운전자 교통안전성 제고에 기여할 수 있을 것이다.

빅데이터를 활용한 재난전조감지 방안 (The Plan of Sensing of Disaster Signs Analyzing Big Data)

  • 최선화;최승용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.801-801
    • /
    • 2012
  • 최근 과학 IT 패러다임은 기존 하드웨어, 소프트웨어 중심에서 폭발적으로 증가하는 데이터를 활용하여 정치 사회 경제 등 제반 이슈와 연계된 분석 예측으로 진화하고 있으며, 모바일 인터넷과 소셜 미디어 등장으로 데이터가 경제적 자산이 되는 빅데이터 시대가 도래하였다. 급속히 변화하고 복잡해진 사회구조와 재난환경으로 인해 인력에만 의존한 재난관리의 사각지대가 대형재난으로 이어질 우려가 크므로 다양한 재난전조(前兆)를 체계적으로 관리하여 선제적으로 예방하는 체계가 필요하다. 본 연구는 인터넷에 존재하는 재난관련 언론보도, 민원, 제보, 소셜 미디어 등의 비정형 데이터와 재난관련 정형 데이터(DB)를 융합 분석하여 재난전조를 사전에 감지하고 위험요소를 신속히 제거하는 빅데이터 기반 재난전조감지 체계를 제안한다. 최근 피해가 급증하고 있는 도시내수침수 피해 위험 예방을 위해 제안한 재난전조감지 체계를 적용하여 피해발생 위험요소 및 전조, 긴급 이슈 등을 감지하는데 활용하는 방안을 제안한다. 이는 전조를 감지하고 사전 침수 피해를 예측하여 피해 최소화 및 복구비용 절감, 저감능력 강화의 효과뿐만 아니라 위험요인 사전 차단 및 확산방지가 가능할 것으로 기대된다.

  • PDF

데이터 균형을 위한 Chat-GPT와 Diffusion Model 기반 폐기물 생성모델 설계 (Design of a Waste Generation Model based on the Chat-GPT and Diffusion Model for data balance)

  • 김시웅;고준혁;박정현;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.667-669
    • /
    • 2023
  • 데이터의 균형은 객체 인식 분야에서 영향을 미치는 요인 중 하나이다. 본 논문에서는 폐기물 데이터 균형을 위해 Chat-GPT와 Diffusion model 기반 데이터 생성 모델을 제안한다. Chat-GPT를 사용하여 폐기물의 속성에 해당하는 단어를 생성하도록 질문하고, 생성된 단어는 인코더를 통해 벡터화시킨다. 이 중 폐기물과 관련 없는 단어를 삭제 후, 남은 단어들을 결합하는 전처리 과정을 거친다. 결합한 벡터는 디코더를 통해 텍스트 데이터로 변환 후, Stable Diffusion model에 입력되어 텍스트와 상응하는 폐기물 데이터를 생성한다. 이 데이터는 AI Hub의 공공 데이터를 활용하며, 객체 인식 모델인 YOLOv5로 학습해 F1-score와 mAP로 평가한다.

실시간 환경데이터를 이용한 3차원 시각화 시스템 (3D Visualization System for Realtime Environmental Data)

  • 김종찬;김경옥;김응곤;김치용
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권4호
    • /
    • pp.707-715
    • /
    • 2008
  • 최근들어 태안에서 발생한 기름유출 사건과 인근연안의 적조 발생이나 수온의 급격한 변화로 인하여 해양생태계 및 양식장 등에 많은 피해가 발생하고 있다. 이들 피해를 줄이기 위해서는 다양한 요소들을 관리하는 기술요인이 필요하다. 본 논문에서는 사용자 인터페이스 분야의 신기술로 부각되고 있는 WPF(window presentation foundation)기술을 활용하여 단순한 숫자의 나열 또는 2차원 그래프로 제공되던 각종 센서 및 측정 장비로부터 받은 실시간 데이터를 2D 및 3D 그래픽, 애니메이션 등의 다양한 형태로 제공할 수 있는 실시간 환경데이터의 3차원 시각화 시스템을 구현한다.

  • PDF

다변량해석기법을 활용한 감성 데이터베이스 구축에 관한 연구

  • 박정호;한성배;양선모;김형범;이순요
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1996년도 춘계학술대회논문집
    • /
    • pp.136-140
    • /
    • 1996
  • 제품개발의 개념이 기능이나 성능중심에서 인간의 감성중심으로전환되고 있다. 그러나 인간의 감 성은 정성적 언어로 표현되며 이것을 물리적 디자인요소로 전환하는 것이 필요하다. 이를 위하여는 우선적으로 인간의 감성을 정량화하는 것이 선결되어야한다. 따라서 본 연구의 목적은 다변량해석기법 을 활용하여 고객의 제품에 대한 정성적 이미지를 정량적 데이터로 변환하여 이를 감성 데이터베이스로 구축하는데 있다. 감성 데이터베이스는 감성어휘와 이의 제품에 대한 정량적 수치 데이터로 구성되고, 이를 위해서는 감성어휘 선정, 디자인 요소에 의한 제품의 분류, 감성어휘와 디자인요소간의 상관도 도출 등이 필요하다. 감성어휘는 요인분석에 의해 선정하고, 제품은 아이템/카테고리에 의해 분류하며, 감성어휘와 디자인요소간의 상관성에 대해서는 다변량해석기법 특히, 수량화이론 1류를 사용해서 정량화 한다. 이렇게 구축된 감성 데이터베이스는 감성공학적 디자인 요소변환 지원시스템의 감성데이터 처리 서브시스템의 핵심 역활을 한다.

  • PDF

토픽모델링과 군집분석을 통한 지방 소멸 위험지역과 요인의 탐색 (Exploring Regional Decline Risk Areas and Factors Using Topic Modeling and Cluster Analysis)

  • 김지민;조희련
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.349-350
    • /
    • 2023
  • 우리나라는 지속적인 저출산과 고령화로 인해 지방 소멸 위험지역이 점차 늘어나고 있다. 본 연구는 지방 소멸과 관련된 다양한 요인을 '인구 소멸'이라는 키워드를 포함하는 신문 기사에 대한 토픽모델링을 통해 발견하고, 추출된 토픽과 관련된 공공 데이터를 수집하여 비슷한 특징을 가지는 지역을 묶는 군집분석을 수행한다. 그리고 지방소멸위험지수로 분류된 소멸 위험지역과 군집분석 결과를 비교한다.

Emoticon by Emotions: 소비자 감성 기반 이모티콘 추천 시스템 개발 (Emoticon by Emotions: The Development of an Emoticon Recommendation System Based on Consumer Emotions)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.227-252
    • /
    • 2018
  • 인터넷의 발달을 통해 지속적으로 인스턴트 커뮤니케이션이 발달해왔다. 인스턴트 커뮤니케이션에서 가장 대표적인 것이 메신저 애플리케이션이다. 메신저 애플리케이션에서 이모티콘은 송신자의 감정 전달을 보완하기 위해 활용됐다. 메신저 애플리케이션 송신자의 감정 전달에 약한 모습을 보이는데 그 이유는 면대면 커뮤니케이션이 아니기 때문이다. 이모티콘은 과거 화자의 기분 상태를 나타내는 기호로만 사용됐다. 그러나 현재는 이모티콘은 감정 전달 뿐만 아니라 개인의 특성과 개성을 나타내고 싶어 하는 소비자의 심리를 반영하는 형태로 발전해가고 있다. 이모티콘의 사용 환경이 개선되었고, 이모티콘 자체가 발전함으로써 이모티콘 자체에 대한 관심도는 증가하였다. 대표적인 예로 카카오톡, 라인, 애플 등에서 서비스를 진행하고 있으며, 관련 컨텐츠 상품의 매출도 지속적으로 증가할 것으로 전망하고 있다. 이모티콘 자체의 관심도 증가와 관련 사업의 성장세에도 불구하고 현재 적절한 이모티콘 추천 시스템이 부재하다. 국내 점유율 90% 이상의 메신저 애플리케이션인 카카오톡조차 단순히 인기 순이나 최근 순, 혹은 간략한 카테고리 별로 분류한 정도이다. 소비자들은 원하는 이모티콘을 찾기 위해서 스크롤을 계속해서 내려야 하는 불편함이 있으며, 본인이 원하는 감성의 이모티콘을 찾기 어렵다. 소비자들이 편의성 향상과 기업의 이모티콘 관련 사업의 판매 매출 증가를 위해 소비자가 원하는 이모티콘을 추천해줄 수 있는 이모티콘 추천 시스템이 필요하다. 적절한 이모티콘을 추천하기 위해서 소비자가 이모티콘을 보고 느낀 감성에 대해 정량화할 필요성이 있다. 정량화를 통해 소비자가 원하는 이모티콘 셋이 가진 특징과 감성에 대해 분석할 수 있으며, 분석 결과를 토대로 소비자에게 이모티콘을 추천할 수 있다. 이모티콘은 메타데이터화의 방법으로 정량화가 가능하다. 메타데이터화 방법은 빅데이터 시대에 비정형, 반정형 데이터에 대해서 의미를 추출하기 위해 데이터를 구조화 혹은 조직화하는 작업이다. 비정형 데이터인 이모티콘을 메타데이터화를 통해 구조화한다면, 쉽게 소비자가 원하는 감성 형태로 분류할 수 있을 것으로 생각한다. 정확한 감성을 추출하기 위해 감정과 관련된 선행 연구를 통해 7개의 공통 감성 형용사와 한국어에서만 나타나는 은유 혹은 표현적 특징들을 반영하기 위해 하위 세부 표현들까지 고려했다. 이모티콘의 가장 큰 특징인 캐릭터를 기반으로 "표상", "형상", "색상"의 범주에서 세부 하위 감성들을 수집했다. 정확도 높은 추천 시스템을 설계하기 위해 감성 지표만이 아니라 객관적 지표도 고려하였다. 메타데이터화 방법을 통해 이모티콘이 갖고 있는 캐릭터의 특징을 객관적 지표로 14개, 감성 지표로 활용하기 위해 감성 형용사를 36개를 추출하였다. 추출된 감성 형용사는 대비되는 형용사로 구성하여 총 18개로 줄였으며, 18개의 감성 형용사는 카카오톡의 이모티콘을 인기 순으로 임의의 40개 셋을 대상으로 측정하였다. 측정을 위해 이모티콘을 평가할 조사 대상자 온라인으로 모집하였고, 277명의 20~30대의 이모티콘을 구매한 경험이 있는 소비자를 대상으로 설문을 진행하였다. 설문응답자에게 서로 다른 5개의 이모티콘 셋을 평가하도록 하였다. 평가 결과 수집된 18개의 감정 형용사는 요인분석을 통해 감성 지표 요인으로 추출하였다. 추출된 소비자 감성 지표의 요인은 "코믹", "부드러움", "모던함", "투명함"이었다. 이모티콘의 객관적 지표와 감성 지표 요인을 활용하여 소비자 만족과의 관계를 분석하였고, 객관적 지표와 감성 지표 간의 관계도 분석하였다. 이 과정에서 객관적 지표가 소비자 태도에 바로 영향을 주는 것이 아니라 감성 지표 요인을 통해 소비자 태도에 영향을 주는 매개 효과가 있음을 확인하였다. 분석 결과는 소비자의 감성 평가 메커니즘을 밝혀냈고, 소비자의 이모티콘 감성 평가 메커니즘은 객관적 지표가 감성 지표 요인에 영향을 미치며, 감성 지표 요인은 소비자 만족에 영향을 미치는 관계였다. 따라서 감성 지표 요인의 네 가지만으로 이모티콘 추천 시스템을 설계하였고, 추천 방법은 각 감성과의 거리를 유클리디안 거리로 측정하여 거리의 차가 0에 가까울수록 비슷한 감성으로 정의하였다. 본 연구에서 제안한 이모티콘 시스템의 검증을 위해 각 감성 지표 요인과 소비자 만족의 평균을 지표 값으로 활용하여 각 이모티콘 셋의 감성 패턴을 그래프로 비교하였고, 추천된 이모티콘들과 선택된 이모티콘이 대체로 비슷한 패턴을 그리는 것을 확인하였다. 정확한 검증을 위해 사전 조사하였던 소비자를 대상으로 이모티콘 추천 시스템이 제시한 결과와 유사하게 평가하였는지 유사 순위를 세 구간으로 나누어 비교하였고, 순위별 예측 정확도는 결과 1순위 81.02%, 2순위 76.64%, 3순위 81.63%였다. 본 연구의 결과는 학문적, 실무적으로 다양한 분야에서 활용 가능한 방법론을 제시하였으며, 기존에 없던 이모티콘 추천 시스템의 설계를 통해 소비자에게는 편의와 이모티콘을 서비스하는 기업에는 매출증대의 효과를 가져올 것으로 예상한다. 그리고 본 연구를 통해 지능형 이모티콘 시스템으로 발전할 수 있는 단초를 제공했다는 점에서 의미가 있다. 본 연구에서 제안한 감성 요인들을 활용하여 감성 라이브러리로 사용함으로써, 새로운 이모티콘 출시 시 감성 평가의 지표로 활용할 수 있다. 축적된 감성 라이브러리와 기업의 판매 데이터, 매출 정보, 소비자 데이터를 결합하여 본 연구에서 제안한 추천 시스템을 복합형 추천 시스템으로 발전시켜 단순 소비자의 편의성이나 매출 증가뿐만 아니라 기업에서 전략적으로 활용 가능한 지적 자산으로 활용할 수 있을 것으로 판단한다.

위치 기반의 UCI Sensor 시계열 데이터 분석 (Location-based UCI Sensor time series data analysis)

  • 장일식;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.7-8
    • /
    • 2021
  • 인공지능 기술과 서비스는 딥러닝을 중심으로 한 기계학습 기술의 급속한 발전에서 원인을 둔다. 딥러닝 발전 요인으로 GPU등 하드웨어 발전, 기술 공유, 대규모 학습데이터 구축 및 공개를 들 수 있다. 데이터 셋에 관련하여 센서를 이용한 데이터셋의 경우 단순히 많은 데이터셋의 확보뿐 아니라 적절한 위치 및 환경에 따른 고려가 필요하다. 본 논문에서는 UCI의 화학 가스의 데이터셋을 이용하여 위치별 시계열 데이터를 딥러닝을 이용하여 분석하고, 위치별 정확도와 손실을 계산한다. 또한 계산된 결과를 히트맵을 통하여 시각화하여 직관적인 이해를 높인다. 또한 위치별 정확도가 높은 상위 5개의 위치에서 앙상블 방법을 통한 성능의 향상을 확인 하였다.

  • PDF