• 제목/요약/키워드: 데이터 영역

검색결과 4,395건 처리시간 0.033초

상권정보와 설문정보의 연계 분석 방법 (A Linked Analysis Method between Commercial district Information and Survey Information)

  • 이원철;강만수;김진호
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.29-42
    • /
    • 2020
  • 소상공인은 우리나라 서민경제의 중요한 부분을 담당하고 있으나, 과다경쟁, 수익성 악화, 생활밀착형 업종편중 등의 어려움에 직면하고 있다. 이를 위해, 정부는 소상공인을 위한 상권분석서비스를 제공하고 있다. 그러나 다양한 기관에서 제공받은 데이터는 표준화되지 않고, 제한된 데이터로 서비스의 구성에 한계가 있다. 본 논문에서는 데이터의 정합성 문제를 해결하고, 데이터 분석서비스 확장을 위해 설문정보와 상권정보를 연계하여 분석하는 방법을 제안한다. 제안하는 연계 방법은 상권정보와 설문정보를 업종과 영역을 기준으로 동일 영역 연계, 설문 정보의 개별업체 중심 연계, 설문정보의 작은 영역과 상권의 큰 영역 연계의 세 가지 방법이다. 연계된 상권정보와 설문정보는 다양한 방법으로 활용되거나 분석서비스를 확대할 수 있다. 본 논문은 기존 상권분석 서비스의 한계 를 설문정보로 극복할 수 있는 방법을 제안하여 소상공인에게 필요한 상권분석 서비스를 확대할 수 있는 기반을 마련하였다.

결정트리를 이용하는 불완전한 데이터 처리기법 (Incomplete data handling technique using decision trees)

  • 이종찬
    • 한국융합학회논문지
    • /
    • 제12권8호
    • /
    • pp.39-45
    • /
    • 2021
  • 본 논문은 손실값을 포함하는 불완전한 데이터를 처리하는 방법에 대해 논한다. 손실값을 최적으로 처리한다는 것은 학습 데이터가 가지고 있는 정보들에서 본래값과 가장 근사한 추정치를 구하고, 이 값으로 손실값을 대치하는 것이다. 이것을 실현하기 위한 방안으로 분류기가 정보를 분류하는 과정에서 완성되어가는 결정트리를 이용한다. 다시말해 이 결정트리는 전체 학습 데이터 중에서 손실값을 포함하지 않는 완전한 정보만을 C4.5 분류기에 입력하여 학습하는 과정에서 얻어진다. 이 결정트리의 노드들은 분류 변수의 정보를 가지는데, 루트에 가까운 상위 노드일수록 많은 정보를 포함하게 되고 말단 노드에서는 루트로부터의 경로를 통해 분류 영역을 형성하게 된다. 또한 각 영역에는 분류된 데이터 사건들의 평균이 기록된다. 손실값을 포함하는 사건들은 이러한 결정트리에 입력되어 각 노드의 정보에 따라 순회과정을 통해 사건과 가장 근접한 영역을 찾아가게 된다. 이 영역에 기록된 평균값을 손실값의 추정치로 간주하고, 보상 과정은 완성된다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

데이터 퓨전 : 개념, 문제, 대안

  • 한상훈;하덕주;최종후
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.277-281
    • /
    • 2004
  • 최근 마케팅 현업에서 마이크로 마케팅(Micro Marketing)이 마케팅 기법의 화두로 등장하면서 데이터 퓨전(Data Fusion) 또는 데이터 인리치먼트(Data Enrichment)가 각광받는 영역으로 등장하고 있다. 본 연구에서는 데이터 퓨전의 개념과 그를 둘러싸고 있는 통계적 문제와 그 대안에 대하여 논의한다.

  • PDF

데이터통신서비스 이용자 실태조사

  • 한국정보통신산업협회
    • 정보화사회
    • /
    • 통권5호
    • /
    • pp.22-35
    • /
    • 1988
  • 데이터통신의 이용이 전 산업부문에 걸쳐 보편화되고 있는 추세이다. 데이터통신 서비스는 앞으로 기업뿐만 아니라 일반 공중에로 확산될 전망이다. 이와 같은 서비스 영역의 확산과 양적 팽창에 대비해서 데이터통신의 현재의 위상을 정립함은 물론 문제점을 정확히 도출하고 이를 개선할 방향을 제시하는 일이 필연적이다. 데이터통신 서비스 이용자 실태에 관한 설문조사를 통해 이같은 명제를 재조명해 본다.

  • PDF

빅데이터를 활용한 라이프케어 동향

  • 손재기;신순애;한태화
    • 정보와 통신
    • /
    • 제32권11호
    • /
    • pp.3-7
    • /
    • 2015
  • 최근 활발히 연구되고 있는 빅데이터와 의료 영역이 융합되면서, 보건의료서비스 분야에서는 데이터 집약적이고 공간을 초월한 새로운 서비스패러다임의 움직임이 진행되고 있다. 본고에서는 이러한 빅데이터를 활용하여 건강증진 및 예방을 위하여 생활 속에서 제공되고 있는 생활환경 및 보건 데이터 기반의 라이프케어 서비스동향과 기술에 관하여 알아본다.

심층신경망을 이용한 시간 영역 음향 이벤트 검출 알고리즘 (Time-domain Sound Event Detection Algorithm Using Deep Neural Network)

  • 김범준;문현기;박성욱;정영호;박영철
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.472-484
    • /
    • 2019
  • 본 논문에서는 심층신경망을 이용한 시간 영역 음향 이벤트 검출 알고리즘을 제시한다. 본 시스템에서는 주파수 영역으로 변환되지 않은 시간 영역의 음향 데이터를 심층신경망의 입력으로 사용한다. 전반적인 구조는 CRNN 구조를 사용하였으며, GLU, ResNet, Squeeze-and-excitation 블럭을 적용하였다. 그리고 여러 계층에서 추출된 특징을 함께 고려하는 구조를 제안하였다. 또한 본 연구에서는 강한 라벨이 있는 훈련 데이터를 확보하는 것이 현실적으로 어렵다는 전제 아래에서 약한 라벨이 있는 훈련 데이터 약간 그리고 다수의 라벨이 없는 훈련 데이터를 활용하여 훈련을 수행하였다. 적은 수의 훈련 데이터를 효과적으로 사용하기 위해 타임 스트레칭, 피치 변화, 동적 영역 압축, 블럭 혼합 등의 데이터 증강 방법을 적용하였다. 라벨이 없는 데이터에는 의사 라벨을 붙여 부족한 훈련 데이터를 보완하였다. 본 논문에서 제안한 신경망과 데이터 증강 방법을 사용하는 경우, 종래의 방식으로 CRNN 구조의 신경망을 훈련하여 사용하는 경우보다, 음향 이벤트 검출 성능이 약 6 % (f-score 기준)가 개선되었다.

센서네트워크 상에서 영역질의 처리를 위한 분산 색인 관리 메카니즘 (Distributed Index Management Mechanism for Region Query in Sensor Network)

  • 김규철;장기영;진봉;김창화;박찬정;김상경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.72-76
    • /
    • 2006
  • 센서 네트워크에서는 싱크에서 센서로 자료요청을 위한 쿼리를 발송하고 감지된 데이터를 싱크로 수집하는 방법은 여러 가지가 있을 수 있다. 그러나 어떠한 쿼리 최적화 방법을 사용하느냐에 따라 센서 네트워크의 성능이 달라질 수 있다. 본 논문에서 센서 네트워크 상에서 영역질의를 처리하는 분산 색인 방법을 제안하였다. 본 연구에서 제안한 DIMTree(Distributed Index Management Tree)는 센터에서 데이터를 수집하기 위하여 모든 영역에 쿼리를 배포할 필요가 없이 질의에 적합한 지역에서만 쿼리를 배포하여, 자료 전송 및 수집으로 인한 데이터 전송량을 줄임으로써 통신으로 인한 노드의 에너지를 절감시킬 수 있는 장점을 가진다.

  • PDF

Staging 영역을 활용한 분산 의료정보시스템 통합 (Integration of Distributed Medical Information System using Staging Area)

  • 전영희;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.184-188
    • /
    • 2008
  • 최근 국내 디지털 병원들이 점차 기업화 되면서 각 지역별 분산 및 독립 운영되는 의료통계 정보 활용의 중요성이 증대되고 있다. 또한 각종 연구목적 및 의료 서비스 경쟁력 향상 등을 위해 신속 정확한 의사결정지원 시스템인 데이터 웨어하우스(DW; Data Warehouse) 구축의 필요성이 대두되고 있다. 본 논문에서는 단일 병원 내의 데이터 웨어하우스가 아닌, 전국적으로 분산 운영되고 있는 병원의 다양한 의료정보를 통합하고자 한다. 따라서 Staging 영역을 활용한 분산된 의료정보시스템 통합 방안을 제시한다.

  • PDF

YAFFS2 플래시 파일시스템 상에서 효율적인 마운트를 위한 메타데이터 관리기법 (A Metadata Management Scheme for Efficient Mount on YAFFS2 Flash File System)

  • 서형운;신명섭;박동주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.74-76
    • /
    • 2011
  • 최근 플래시 메모리에 기반을 둔 임베디드 시스템의 사용이 급증하고 있다. 스마트폰이 대중화됨에 따라, 플래시 메모리용 파일시스템에 대한 필요성이 증가되고 있다. 보편적으로 사용하는 YAFFS2 파일시스템은 초기화 시 오래 걸리는 단점이 존재하여 체크포인트 기능으로 보안 하고 있다. 그러나 갑작스러운 Power Failure 나 언마운트시 체크포인트가 저장되지 않으면 전체 영역을 스캔해야 하는 문제점이 존재한다. 본 논문에서는 YAFFS2의 성능 개선 및 신뢰성 향상을 위한 메타데이터 관리 기법을 제안한다. 메인메모리상에 유지되는 메타데이터의 영역을 나눠서 관리해서, Power Failure 가 발생하거나 체크포인트가 존재하지 않아도 전 영역을 스캔 하는 문제점 을 피할 수 있다.