• 제목/요약/키워드: 데이터 편중

검색결과 101건 처리시간 0.031초

시공간 겹침 조인 연산을 위한 선택도 추정 기법 (Selectivity Estimation for Spatio-Temporal a Overlap Join)

  • 이명술;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권1호
    • /
    • pp.54-66
    • /
    • 2008
  • 시공간 데이타베이스에서 조인 연산은 매우 많은 비용이 소요되며, 시공간 조인 연산의 효율적인 질의 실행 계획을 세우기 위해 조인 연산에 대한 정확한 선택도 추정은 질의처리 성능에 결정적이다. 주어진 두 이산 데이타집합 $S_1,\;S_2$의 타임스탬프 $t_q$에서 시공간 조인 연산은 타임스탬프 $t_q$에서 서로 교차하는 모든 객체 쌍을 검색하는 것이다. 시공간 조인 연산의 선택도 추정치는 검색된 객체 쌍의 수를 $|S_1{\times}S_2|$로 나눈 값이다. 이 논문은 공간 조인 연산의 선택도 추정 기법인 기하 히스토그램 기법을 확장하여 시공간 조인 선택도 추정을 위한 시공간 히스토그램을 제안한다. 균일 데이타 집합과 편중 데이타 집합 모두를 사용하여 제안된 히스토그램 기법으로 시공간 조인 연산의 선택도를 정확하게 추정할 수 있다는 것을 증명하였다. 본 논문의 기여도는 먼저 이산 데이타 집합에 대한 시공간 조인 선택도 추정 연구의 첫 시도를 하였으며 다음으로 이산 객체의 유효시간 동안의 공간 통계정보를 압축하여 히스토그램을 재구축하는 효율적인 유지기법을 제안하였다.

센서스 데이터를 활용한 고령인구 분포 특성 (Characteristics for the Distribution of Elderly Population by Utilizing the Census Data)

  • 남광우;권일화
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.464-469
    • /
    • 2013
  • 부산광역시는 2000년 고령화사회에 진입한 이후, 2011년 기준 고령화율이 7대 도시중 가장 높은 11.8%에 이르고 있다. 또한 전체인구 및 평균세대원수가 감소하는 가운데 65세 이상 고령인구는 급격히 증가하고 있어 2020년 이후 고령화율이 20%를 상회하는 초고령사회로의 진입이 예상된다. 이에 본 연구는 그 동안의 고령층의 주거 관련분석이 동단위로 이루어져 보다 미시적인 분석의 필요성 증가에 따라 2000년부터 2010년 사이에 조사된 센서스 집계 구단위의 공간분석을 실시하였다. 이를 활용하여 고령인구의 밀집지역, 급증지역, 고밀지역등과 같은 관심지역을 1차 추출하여 미시적인 위치와 공간상의 분포 패턴을 분석하였다. 분석결과 고령인구는 도심과 그 인접지역인 고지대에 밀집해 있었으며, 특정 집계구의 경우 10년간 증가속도가 30배 이상으로 나타났다. 이러한 지역의 국지적 수준의 분포 특성을 살펴보면, 부산시 원도심에 고령인구의 편중이 심화되고 있고, 2000년부터 2010년까지 부산의 전반적 분포 패턴에서는 고령인구가 점점 분산되고 있는 것을 확인했다. 이는 이전의 관련연구 결과와 대치되는 결과로 향후 초고령사회 진입에 따른 사회적 비용의 경감과 고령층의 삶의 질 개선을 위한 공간적 차원의 대응을 위한 기초자료로의 활용이 기대된다.

Sentinel-1 위성영상을 이용한 수표면 면적 추정 알고리즘에 관한 연구 (A Study on Water Surface Detection Algorithm using Sentinel-1 Satellite Imagery)

  • 이달근;천은지;윤혜원;이미희
    • 대한원격탐사학회지
    • /
    • 제35권5_2호
    • /
    • pp.809-818
    • /
    • 2019
  • 우리나라는 여름철에 편중된 강우현상과 좁은 반도의 지형적인 특성으로 인해 풍수해에 매우 취약한 구조를 가지고 있다. 최근 태풍, 집중호우 등으로 피해는 날로 심화되고 있어 앞으로 발생할 풍수해에 대비하여 정확한 피해정보 생산과 분석이 필요하다. 본 연구에서는 풍수해 분석에 필요한 수표면 면적 파악을 위해 Sentinel-1 위성영상을 이용하여 벽정저수지, 사점저수지, 수부저수지, 보령호의 수표면 면적 변화를 분석하였다. 2015년 5월부터 2019년 8월까지 촬영된 Sentinel-1 위성에 RTC 기법을 적용한 영상 전처리와 Otsu 기법을 이용한 영상 이진화를 통해 수표면 면적을 산출하였다. 산출된 수표면 면적은 국가수자원관리종합정보시스템과 농업기반관리시스템에서 제공하는 저수용량 정보와 비교하여 상관계수를 분석하였다. 그 결과, 수부저수지와 보령호의 상관계수는 각각 0.850, 0.941의 강한 상관성을 보여주었고 벽정저수지와 사점저수지의 상관계수는 0.651, 0.657의 보통의 상관성을 보였다. 이 결과는 위성영상을 이용한 중소규모 저수지의 수표면 면적 모니터링 가능성을 나타냈으며, 수표면 면적 변화는 저수지의 수량변화 모니터링 정보로 객관적 사용이 가능하다고 판단된다. 향후 다양한 데이터와의 융합을 통하여 국가적 재난관리에 크게 기여할 수 있을 것으로 기대한다.

대일 무역분쟁으로 인한 글로벌 가치사슬 변화와 정부 R&D 투자전략 - 자동차산업을 중심으로 - (Global Value Chain Change and Government R&D Investment Strategy due to Trade Dispute with Japan - Focussing on Automobile Industry)

  • 정재웅;원동규;김광훈
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.12-23
    • /
    • 2021
  • 수출 비중이 높은 한국은 다른 국가들에 비해 글로벌 가치사슬(GVC)에 대한 의존도가 높기 때문에 GVC변화에 민감한 구조를 지니고 있다. 이는 과거부터 한국의 수출이 특정국가와 품목에 편중되어 있으며, 수출제품을 만들기 위해 필요한 소재·부품·장비들을 대부분 수입에 의존하는 경향이 있기 때문이다. 현재 우리나라는 일본과의 무역분쟁을 겪고 있으며 소재·부품·장비의 수입 의존도가 높은 일본과의 무역분쟁은 GVC 공급 불균형을 야기해 우리나라 산업 전반에 영향을 미칠 수 있다. 따라서, 일본의 수출규제로 인한 경제피해를 최소화하기 위해서는 대일의존 수입품들의 수입다변화 및 국산화를 통한 대일의존도를 낮추는 형태로의 GVC 체질 개선이 필요하다. 이러한 체질 개선을 이루기 위해서는 우선적으로 대일의존 수입품들을 도출하고 수입다변화와 국산화가 필요한 수입품들을 선별하여 수입다변화와 국산화를 진행해야 할 것이다. 또한 대일의존 제품의 국산화 목표달성을 위한 R&D 투자전략 수립이 반드시 필요할 것이다. 이러한 R&D 투자전략 수립은 기존에는 전문가 중심의 정성적 방식이 많이 이용되어 왔지만, 본 논문은 이와는 차별화된 데이터 기반의 정량적 분석결과를 토대로 한 R&D 투자전략에 대해 논의하고자 한다.

균형 랜덤 포레스트를 이용한 이륜차 보험사기 적발 모형 개발 (Bike Insurance Fraud Detection Model Using Balanced Randomforest Algorithm)

  • 김승훈;이수일;김태호
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.241-250
    • /
    • 2022
  • COVID-19 여파로 인한 비대면 서비스와 가정 재정 불안정성의 증가로 이륜차 보험사기 발생이 예상되고 있다. 이와 함께 보험사기 수법도 갈수록 교묘해지고 있다. 하지만 비대면 배달 수요와 연관된 이륜차 교통사고와 보험사기 적발 모형 관련 연구는 매우 미흡한 실정이다. 이에 본 연구는 보험사기의 표본 편중문제를 해결하기 위해 균형 랜덤포레스트 알고리즘을 이용하고 보험사기 조사 전문가의 정성적인 판단 기준을 반영한 변수를 모델에 포함하여 적용성을 향상시키며 적발력 높은 이륜차 보험사기 모형을 개발하고자 한다. 보험사기 적발 모형 개발 결과, 기존의 비균형 랜덤 포레스트 모형에 비해 균형 랜덤 포레스트가 보험 사기혐의자를 분류하는 데 있어 통계적으로 우수한 점을 확인할 수 있었다. 특히, 총 26개의 변수를 토대로 탐색적 변수 조합을 적용한 모형의 예측 성능이 가장 높았지만 일부 변수만을 사용한 확인적 모형의 예측 성능도 크게 떨어지지 않은 와중에, 정성적인 보험사기 전문가가 선정한 변수만을 사용한 확인적 모형은 예측력이 떨어지는 것을 확인하였다. 또한, 총 26개의 변수 중 운전자 성별, 연령, 운전자 피보험자 일치 여부, 미수선 청구금액, 대인보험금 등이 중요한 변수로 확인되어 이를 활용해 이륜차 보험사기 혐의자 선별을 위한 적극적인 대처가 필요해 보인다.

RAMMS 모형을 이용한 경북 소규모 산지 유역의 토석류 모의 (A Simulation of a Small Mountainous Chachment in Gyeoungbuk Using the RAMMS Model)

  • 장형준;이호진;김성구
    • 한국방재안전학회논문집
    • /
    • 제17권1호
    • /
    • pp.1-8
    • /
    • 2024
  • 산지가 국토의 60%를 차지하는 우리나라는 집중호우, 태풍 등의 토석류가 발생 할 수 있는 요인들이 증가하여, 산사태, 토석류와 같은 재해의 위험성이 큼에도 불구하고 대부분의 지역에서 피해를 예방하기 보다 피해 후 복구에 편중되어왔으며, 토석류 발생지역에 대한 현장조사 및 토석류 수치해석에 관한 연구는 미흡한 실정이다. 따라서, 본 연구에서는 토석류 위험구간 분석을 위해서 실제 토석류가 발생한 지역을 대상으로 현장조사 및 드론측량을 실시하여 정밀도 높은 지형 데이터를 구축하고 수치해석 프로그램 RAMMS 모형을 활용하여 토석류 발생 유역을 대상으로 토석류 흐름 분석을 수행하고 실제 발생한 토셕류 분포를 비교 분석하여 모형의 적용성을 평가하였다. 그 결과 RAMMS 모형으로 산정된 토석류 발생면적은 실제 면적보다 18% 크게, 이동거리는 10% 작게 산정되었으나, 모형으로 계산된 토석류 발생 형상과 발생 이동경로가 실제자료와 유사하게 모의되어 모형을 통한 토석류 이동의 경향성을 파악할 수 있다고 판단하였다. 향후, 국내에 적합한 모형 검증 및 미계측 유역에 대한 토석류 해석을 통한 피해 예상 지역의 선정 등의 추가 연구를 수행하고자 한다.

한반도 중부지역에서의 SAR Sentinel-1 위성강우량 추정에 관한 예비평가 (A preliminary assessment of high-spatial-resolution satellite rainfall estimation from SAR Sentinel-1 over the central region of South Korea)

  • 능엔 호앙 하이;정우성;이달근;신대윤
    • 한국수자원학회논문집
    • /
    • 제55권6호
    • /
    • pp.393-404
    • /
    • 2022
  • 위성에서 보다 미세한 공간 분해능으로 신뢰할 수 있는 지상 강우 관측은 도시 수문학적 및 미시적 농업 수요에 필수적이다. 전통적으로 "톱다운" 접근 방식 기반 위성 강우 산출물이 널리 사용되고 있지만 공간 분해능에 한계가 있다. 본 연구는 C-밴드 SAR Sentinel-1 위성 데이터(SM2RAIN-S1)에 적용되는 매개 변수화된 SM2RAIN 모델인 강우 추정을 위한 새로운 "상향식" 접근 방식의 가능성을 평가하여 중부지방에 대한 높은 공간 분해능 지상 강우 추정치(0.01° 그리드/6일)를 생성하는 것을 목표로 한다. 그것의 성능은 중부지방 두 개의 다른 하위 지역, 즉 혼합 산림 중심, 중간 하위 지역, 그리고 경작 중심, 서해안 하위 지역의 1년 기간 동안 기존의 재분석 프로덕트와 우량계 네트워크의 각각의 강우 데이터를 사용하여 공간 및 시간적 가변성에 대해 평가되었다. 평가결과에 따르면 SM2RAIN-S1 프로덕트는 중부지방의 일반적인 강우 패턴을 포착할 수 있고, 서로 다른 토지 피복으로 지역 규모에서 공간 분해능 강우량 측정 가능성을 보유할 수 있으며, 강우량 관측치에 대한 편중된 강우량 추정치가 제공되었다. 또한 SM2RAIN-S1 강우량은 피어슨의 상관 계수(R = 0.69)를 고려할 때 혼합림에서 더 우수했으며, 이는 혼합림에서 토양 수분과 강우의 시간 역학을 포착하는 데 6일 SM2RAIN-S1 데이터의 적합성을 암시했다. 그러나, RMSE와 바이어스 측면에서, 혼합림보다는 경작지의 SM2RAIN-S1 강우 생성물에서 더 나은 성능을 얻었으며, 이는 높은 증발증산 손실(특히 혼합림)에 의해 유도된 더 큰 오류를 SM2RAIN의 추가 개선에 포함해야 한다는 것을 나타낸다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

협업적 추천 기반의 여행 계획 시스템 (Multi-day Trip Planning System with Collaborative Recommendation)

  • 프리스카;오경진;홍명덕;가명현;조근식
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.159-185
    • /
    • 2016
  • 여행을 계획하는 일은 매우 복잡하고 많은 시간을 필요로 한다. 여행 계획을 정할 때에는 보통 관심 지점(point of interests, POIs)을 선택하고 그에 따른 다양한 제약 조건들을 고려하여 일정을 계획 한다. 관심 지점을 선정할 때 친구들에게 의견을 묻거나 인터넷에서 직접 정보를 찾으며 여행사의 도움을 받기도 한다. 하지만 이러한 방법들은 다음과 같은 어려움이 있다. 친구들에게 의견을 묻는 경우에는 친구들이 방문해 보지 못한 장소에 대한 정보를 얻기 어렵고 인터넷에서 정보를 찾는 경우에는 오히려 너무 많은 여행 정보들 때문에 필요한 정보를 탐색하고 정리하는데 많은 시간이 필요하며 여행사의 도움을 받을 때에는 여행 일정이 여행을 제공해주는 업체들 쪽으로 편중될 우려가 있다. 이러한 문제를 해결하기 위해 본 논문에서는 여행 일정 계획 시스템인 CYTRIP을 제안한다. CYTRIP은 웹 기반의 추천 시스템으로써, 여행 정보를 공유할 수 있는 공간을 제공하고, 이를 통해 참여자들의 집단 지성에 따른 관심 지점을 추천 받는다. 그리고 PDDL3를 통해 추천된 지점들의 시간적, 공간적 제약조건 따라 여행 일정이 자동으로 생성되며 이렇게 생성된 일정은 지도 위에 표시되어 사용자에게 제공된다. 여행을 계획할 때에 정해진 기간 동안 모든 추천 관심지점을 방문할 수 없는 경우가 발생한다. 이러한 문제를 피하기 위해 정해진 시간에 방문 가능한 관심 지점들의 후보 집합을 선택하고 이 후보 집합들에 대한 여행 일정을 생성한다. 제안하는 시스템의 성능평가를 위해 사용자 평가를 실시하였다. 사용자 평가를 위해 한국관광공사에서 제공하는 데이터를 활용하였고 평가 결과 제안하는 시스템이 여러 참여자들의 집단 지성을 통해 여행 일정을 계획하는데 유용하다는 것을 알 수 있었다.

지역웹툰 생태계 조성을 위한 방안 연구 (A Study on Measures to Create Local Webtoon Ecosystem)

  • 최승춘;윤기헌
    • 만화애니메이션 연구
    • /
    • 통권51호
    • /
    • pp.181-201
    • /
    • 2018
  • 한국 만화산업은 출판만화시장의 축소와 만화대여점의 몰락 등으로 꾸준히 쇠퇴를 거듭하다 2000년대 이후 웹툰의 등장으로 급격한 질적 변화와 폭발적인 양적 성장을 가져왔다. 만화라는 단어는 웹툰의 광의적 의미로 해석되고 있으며, 웹툰은 만화의 포괄적인 개념까지 승계 받고 있다. 웹툰은 디지털기기를 사용하고 데이터화된 원고를 생산, 제공함으로서 콘텐츠의 지역적, 공간적, 물리적 한계를 뛰어 넘고 있다. 더구나 지역별 인적인프라가 꾸준히 성장하고 있는 상황 속에서 정부의 만화산업 지원정책과 맞물려 웹툰체험관, 웹툰캠퍼스, 웹툰창작센터 등의 창작인프라가 지역에 구축되어 활발한 움직임과 성과를 보여주고 있으며, 이에 웹툰은 지역 성장론과 지역분권에 맞는 산업적 모델로 인식받기 시작했다. 그럼에도 불구하고 여전히 수도권과 부천 중심으로 만화인프라가 심각하게 편중되어 불균형한 구조로 놓여있는 현실이다. 만화산업을 견인하고 있는 웹툰은 인터넷의 발달과 함께 성장한 짧은 만화역사를 가지고 있다. 지역웹툰 역시 성장의 초기단계에 진입했을 뿐이다. 만화의 인적인프라와 웹툰의 창작인프라로 활성화된 지역웹툰은 창작시설의 구축완료 이후 향후 성장 동력의 연구와 대안이 절실한 상태이며, 지속적 발전을 위해 새로운 패러다임이 필요한 시점이다. 결국, 웹툰이 지역발전의 새로운 방향인 '문화'로 지정되어 이와 더불어 지역 특성에 맞는 만화콘텐츠를 개발, 지역의 관광, 문화, 예술 산업과 연계하는 모델이 꾸준히 개발되어야 연착륙에 성공할 수 있을 것이다. 이로서 지역 웹툰이 지방분권과 지역산업 부흥의 작은 모멘텀으로 작용되길 바란다.