• 제목/요약/키워드: 이종데이터 결합

검색결과 70건 처리시간 0.029초

모빌리티 빅데이터 가상결합 분석방법론 연구 (Development of Virtual Fusion Methodology for Analysis Via Mobility Bigdata)

  • 조범철;권기훈;안덕배
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.75-90
    • /
    • 2022
  • 코로나19 팬데믹에 따른 경제사회 환경 변화와 빅데이터 기술의 발달로 교통분석에 대한 요구가 다양화되고 있다. 특히 데이터 3법 개정에 따라 이종 데이터 간 가명정보 결합이 가능해져 다각적인 분석이 가능해졌다. 그러나 개인정보보호 강화로 모빌리티 빅데이터의 결합분석에는 데이터 협력, 비용대비 효과 등에 한계가 있어 새로운 분석방법론이 필요하다. 본 연구에서 제시하는 "모빌리티 빅데이터 가상결합 방법론"은 법제상의 제약 해소 및 다각적인 교통분석을 위한 것으로, 모바일 통신 기지국 데이터, 교통카드 데이터 등 다양한 모빌리티 관련 빅데이터를 간접적으로 결합하여 상세 분석을 수행하기 위한 방법론이다. 가상결합은 모바일 데이터를 바탕으로 특정 인원의 시간대별 위치를 파악할 수 있는 MCGM(Mobility Comprehensive Genetic Map)을 생성하여 패턴을 분석하고, 이를 교통카드데이터 등 교통관련 빅데이터와 결합시켜 분석하는 방법론으로 본 연구에서는 청주, 수도권 대상으로 가상결합 분석을 수행하여 활용가능성을 검증하였다.

SVM 앙상블을 이용한 심혈관질환 질환단계 예측 (Prediction of Cardiovascular Disease Steps using Support Vector Machine Ensemble)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.76-78
    • /
    • 2006
  • 현재 심혈관 질환은 암 다음으로 높은 사망 원인으로 기록되고 있어 심혈관 질환에 대한 초기 진단은 질환의 치료에 매우 중요한 문제로 대두되고 있다. 본 논문에서는 SVM을 이용하여 심혈관질환 환자의 질환 단계를 예측하였다. 일반적으로 이진분류에 사용되는 SVM을 이용하여 정상 및 질환 $1{\sim}3$기의 총 4가지 분류가 필요한 다분류 분류문제를 처리하기 위해서 논문에서는 독립적 학습된 단일 SVM 분류기들을 결합하여 분류를 수행하는 SVM 앙상블 방법을 사용하였다. 단일 분류기의 결합은 Majority voting, 최소자승에러기반 가중치 부여, 2단계층 결합 등의 방법으로 수행하여 심혈관 질환 분류에 적합한 앙상블의 구성을 시도하였다. 실험 데이터는 (주)제노프라의 압타머 칩 데이터를 사용하였다. 서로 다른 데이터를 이용하여 학습된 이종의 SVM들을 결합한 결과 질환단계 예측에 있어서 단일 SVM을 이용하여 질환 단계를 예측하는 경우 보다 향상된 질환단계 예측 성능을 관찰할 수 있었으며, 심혈관 질환의 예측에 대해서는 단일 SVM 분류기의 2단 계층 결합법이 가장 좋은 성능을 보임을 확인하였다.

  • PDF

서로 다른 특성의 파편화된 데이터 결합 방법 (The way to combine heterogeneous time series data)

  • 문재원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.689-690
    • /
    • 2021
  • 본 논문에서는 다양한 환경에서 수집된 서로 다른 시계열 데이터를 통합하여 분석 활용하기 위해 추가로 생성해야 할 시계열 데이터의 메타 정보를 정의하고 이를 기반하여 새로운 통합 데이터를 생성하는 방법을 소개한다. 시계열 데이터는 표준화된 기술 방법이 없고 다양한 소스에서 생성되기 때문에 이를 통합하고 활용할 경우 그 기준이 없기 때문에 전문적 지식이 없다면 처리에 어려움을 겪는다. 그러므로 서로 다른 특성의 데이터를 새로운 기준에 의거하여 통합하는 것을 목적으로 필요한 메타 정보를 정의하고 이를 기준으로 데이터를 재가공할 수 있도록 하였다.

  • PDF

온톨로지 분석 기반의 UML클래스 모델을 이용한 데이터 통합 (An Integration of Data by using UML Class Models Based on the Ontology Analysis)

  • 서진원;공헌택;임재현;김치수
    • 한국산학기술학회논문지
    • /
    • 제9권2호
    • /
    • pp.422-430
    • /
    • 2008
  • 데이터 통합은 상이한 소스로부터 이종의 데이터를 결합하고, 사용자에게 단일 접근 점을 통해 다중 소스의 모든 데이터에 투명하게 액세스하는 것을 허용하는 기술이다. 데이터 통합의 어려움은 데이터의 이종성 즉, 스키마의 이종성, 시멘틱의 이종성이다. 따라서 데이터의 풍부한 시멘틱이 데이터 소스의 이종성으로 인한 충돌을 해결하기 위한 주요한 요인이다. 그러나 UML 클래스 모델에서는 데이터의 스키마 기반 시멘틱만을 표현하기 때문에 온톨로지와 같은 대안책을 이용해 추가적인 시멘틱을 제공하는 것이 바람직하다. 본 논문에서는 온톨로지 분석을 이용해 UML 클래스 모델로 표현된 두 데이터 소스를 통합하기 위한 방법을 제시한다. 여기서 온톨로지는 각 소스의 데이터에 대한 시멘틱을 표현하는데 적용된다. 온톨로지의 유사성과 차이점을 결정하기 위해 온톨로지를 분석하고 비교한다. 비교 결과는 통합 정보에 대해 질의가 가능한 통합 온톨로지를 구축하는데 사용된다.

데이터통신의 개황과 전망

  • 이종각
    • 전기의세계
    • /
    • 제23권6호
    • /
    • pp.38-40
    • /
    • 1974
  • 전기통신이라고 하면, 우리는 전신과 전화를 생각하게 된다. 그런데 최근 전신, 전화에 대하여 제삼통신이라고 불리우는 데이터통신(data communication)이 전기통신에서 매우 큰 관심거리로 되고 있다. 데이터통신은 전자계산기와 유선 및 무선의 원거리동신(telecommunication)기술이 결합한 것으로 어떤 의미에서는 전신, 전화이상으로 우리의 생활에 큰 영향을 미치게 될 것이 예상되고 있다. 제한된 지면을 빌어서 데이터통신의 전모를 설명한다는 것은 매우 어려운 일이라 생각되지만, 데이터통신에 대한 관심을 높이기 위하여 그 역사, 배경, 통신망, 전송방식 및 전망등에 대하여 개괄적인 소개를 하고자 한다.

  • PDF

확장된 표현을 이용하는 분류 알고리즘 (A Classification Algorithm using Extended Representation)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제8권2호
    • /
    • pp.27-33
    • /
    • 2017
  • 인터넷을 통해 사용자에게 클라우드 컴퓨팅 서비스를 효율적으로 제공하기 위해서는 데이터 센터에 가상화와 분산 컴퓨팅 기술을 기반으로 하여 IT 자원을 구성해야 한다. 본 논문은 폭넓은 분야에서 새로운 훈련 데이터가 언제라도 추가될 수 있고, 또한 언제라도 훈련 데이터에 새로운 속성이 추가될 수 있다는 문제에 특별히 초점을 맞춘다. 이러한 경우, 기존 속성 집합들을 가지는 훈련 데이터로 생성된 규칙은 쓸모없게 된다. 더구나 새롭게 추가된 데이터나 속성을 가지는 새로운 데이터는 기존 규칙과 결합될 수 없다. 본 논문은 이와 같은 경우를 자연스럽게 처리할 수 있는 보다 진보된 새 추론 엔진을 제안한다. 이 방법에서 기존의 데이터로 부터 생성된 규칙은 개선된 규칙을 생성하기 위한 새로운 데이터 집합과 결합될 수 있다.

금융 마이데이터의 전략적 활용에 관한 사례 연구 (A study on strategic use of MyData: Focused in Financial Services)

  • 이주희
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.181-189
    • /
    • 2022
  • 모바일 기기의 확산과 ICT 기술로 핀테크 혁신이 더욱 가속화 될 것으로 전망되는 가운데, 최근 금융의 화두는 '디지털 전환'이며, 여기에는 빅데이터의 활용이 주요 요소라 할 수 있다. 특히 오픈 뱅킹이라는 인프라가 마이데이터와 마이페이먼트 산업과 연계되어 금융정보의 이종결합, 자산 조회 및 이체 기능이 결합되는 오픈 파이낸스 시대가 도래고 있다. 마이데이터는 데이터 활용을 통한 가치 창출에 주목하여 나타난 개념으로, 데이터의 주체가 능동적인 자기결정권을 갖는데 의의가 있는데 현재 국내에서도 마이데이터가 시행 되며 전략적 활용방안을 모색되고 있다. 이에 본 연구는 마이데이터 관련 비즈니스 사례를 분석하여 향후 금융의 디지털 전환을 위한 전략적 활용방안을 제시하는 것을 목적으로 하였다. 해외 주요국가에서 마이데이터 개념을 적용한 PSD2 및 오픈뱅킹 정책을 적극 추진하고 있는 가운데 성공적인 비즈니스 모델(Mint, Information Bank, Strands)의 분석을 통해 데이터 기반 비즈니스의 타당성을 확인하고 공통점을 모색하기 위한 사례 연구를 수행하였다. 거래의 효율성과 다양성을 향상시키는 사업 모델을 제공한다는 관점에서 마이데이터는 기존의 사업 모델을 개선할 수 있는 잠재력이 있음을 확인할 수 있었다. 마이데이터는 본인 중심의 모든 데이터로부터 개별적인 데이터 생태계를 쉽게 구현하고 관리할 수 있어야 하는데 개인이 스스로 이를 관리, 통제, 활용하는 것은 현실적으로 어렵다. 따라서 마이데이터 오퍼레이터 또는 마이데이터 서비스 제공자 역할을 할 수 있는 비즈니스 모델이 적극적으로 모색될 필요가 있겠다.

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족 문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

WiBro PKMv2 EAP-AKA 기반 인증 과정에서의 Redirection Attack 에 대한 보안 취약성 및 개선 방안 (Enhancement of WiBro PKMv2 EAP-AKA Authentication Security Against Rogue BS based Redirection Attacks)

  • 이현철;엄성현;조성재;최형기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.1210-1213
    • /
    • 2007
  • WiBro는 무선랜과 3G 이동통신의 장점을 결합한 휴대 인터넷 기술로 최근 국내에서 상용화 되었다. WiBro의 장점인 이동성과 고속 무선 통신에 기인하여, 향후 지속적인 발전이 기대된다. 이러한 WiBro의 확산에 따라 개인 사용자에 대한 보안문제가 최근 크게 부각되고 있다. 현재 Wibro는 3G 이동통신 및 무선랜과 효율적인 연동을 위해 EAP-AKA 인증기법을 사용하고 있다. 하지만 EAP-AKA는 단말이 기지국을 인증하지 못하는 치명적인 취약점이 있다. 따라서 공격자는 임의로 rogue BS를 설치할 수 있고, 정상 사용자의 데이터를 이종 네트워크로 보내는 Redirection Attack을 시도할 수 있다. Redirection Attack은 전송 속도 저하, Denial-of-Service (DoS) 을 초래하며, 데이터가 redirection 되는 이종 네트워크에 따라 암호화된 데이터가 노출될 수 있다. 본 논문에서는 EAP-AKA와 Redirection Attack에 대해 분석하고, 그 해결책을 제시한다. 논문은 1) 프로토콜을 일부 수정하여 공격을 막는 방법과 2) traffic 분석을 통한 공격 탐지 방식을 다루고 있으며, 이러한 두 가지 방법을 통해 Redirection Attack에 대한 취약점을 근본적으로 제거할 수 있다.