• 제목/요약/키워드: data weighting

검색결과 646건 처리시간 0.026초

이환 형제 자료에 대한 유전적 연관성 분석 방법의 비교 (Comparison of Methods for Linkage Analysis of Affected Sibship Data)

  • 고민진;임길섭;이학배;송기준
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.329-340
    • /
    • 2009
  • 질적 형질에 대한 유전적 연관성 분석은 크게 두 가지로 구분 할 수 있는데, 모형 기반분석과 그렇지 않은 모형 무관 분석 방법이다. 복합질병의 경우 멘델의 유전법칙을 잘 따르지 않기 때문에 모형 기반 분석 방법을 사용하는 것보다 모형 무관 분석 방법을 사용하는 것이 효율적이라고 알려져 있다. 이러한 모형 무관 분석 방법 중 이환 형제 쌍 자료를 이용한 분석 방법은 형제 쌍 간의 유전적 일치 비율을 기준으로 공유하고 있는 대립유전자의 분포를 이용하는 것으로 크게 proportion test, mean test, minmax test로 구분 할 수 있다. 본 연구에서는 형제집단자료로 확장된 경우, 유전 형식에 상관없이 로버스트한 방법으로 알려진 minmax test에 형제 쌍의 가중치를 고려할 수 있는 방법들 즉, 동일 가중 방법, Suarez의 방법, Hodge의 방법, Sham 등의 방법을 적용하여 그 성능을 비교하였다. 모의실험 자료를 이용하여 비교한 결과 표식유전자의 빈도, 형질의 유전 형식, 형제수에 상관없이 Suarez의 방법이 가장 검정력이 높은 방법으로 드러났다. 또한, 동일 가중 방법을 제외하고는 표식유전자의 빈도가 높아질수록, 형제수가 많아질수록 더 높은 검정력을 보였고, 이러한 현상은 우성 유전 형식을 가정한 자료에서 더욱 두드러지게 나타났다.

구역단위 인구자료의 공간적 세분화를 위한 밀도 구분적 표면모델에 대한 평가 (An Evaluation of a Dasymetric Surface Model for Spatial Disaggregation of Zonal Population data)

  • 전병운
    • 한국지역지리학회지
    • /
    • 제12권5호
    • /
    • pp.614-630
    • /
    • 2006
  • 자연 및 기술재해에 빠르고 효과적으로 대응하기 위해서는 그 재해지역 내에 있는 인구수를 정확히 추정할 필요가 있다. 그러나 센서스 구역과 재해지역의 공간적 불일치 문제 때문에, 재해지역 내에 있는 인구수를 정확하게 추정할 때에는 구역단위 인구자료를 공간적으로 세분화할 필요가 있다. 본 논문은 센서스 블럭그룹 내의 인구를 개개의 화소로 세분화하기 위한 밀도 구분적 표면모델을 구현하고, 그 표면기반 공간적 세분화 모델의 성능을 통계적 및 가시적으로 평가한다. 표면기반 공간적 세분화 모델은 밀도 구분적 내삽법과 위성영상으르부터 추출된 토지이용 및 피복자료를 사용하며 지리정보시스템에서 구현되었다. 토지이용 및 피복자료는 밀도 구분적 내삽법에서 인구의 지리적 분포에 관한 추가정보를 제공했고, 토지이용 및 피복자료의 퍼센트에 기반을 둔 경험적 표본추출법과 지역가중법은 각 화소에 대한 밀도 구분적 가중치를 객관적으로 결정하기 위해서 사용되었다. 표면기반 공간적 세분화 모델은 애틀란타 대도시권의 밀도 구분적 인구표면을 만드는데 적용되었다. 그 밀도 구분적 인구표변의 정확도는 센서스 수치와의 비교를 통해서 RMSE와 수정 RMSE를 사용하면서 검증되었다. 또한, 각 센서스 트랙과 블럭그룹별 오차들은 퍼센트 오차지도들에 의해서 가시화 되었다. 분석결과에 따르면, 밀도 구분적 인구표면은 인구수의 정확한 추정치를 제시할 뿐만 아니라, 센서스 블록그룹 내의 인구의 상세한 공간분포를 보여 준다. 또한, 인구표면은 대개 교외 및 산림지역 그리고 도심지역에서 인구를 과소평가하거나 과대평가하는 경향이 있다는 것을 밝혀냈다.

  • PDF

성인의 건강상태, 건강행위가 당뇨병 유병률에 미치는 영향 (Effect of Health status and Health Behavior on the Diabetes Mellitus Prevalence)

  • 홍지연;박진아
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.198-209
    • /
    • 2014
  • 당뇨병은 유병률과 합병증으로 인한 사망률이 지속적으로 증가하는 질병이다. 본 연구는 성인의 당뇨병 유병률 영향요인을 확인함으로써 당뇨병 유병률의 감소를 위한 중재전략 개발의 기초자료를 제공하고자 시도되었다. 연구대상자는 19세 이상 성인으로 2012년 국민건강영양조사 원시자료를 활용하여 분석하였으며, 5995명의 자료가 분석에 사용되었다. 수집된 자료는 SPSS 18.0 프로그램의 복합표본 분석 모듈을 사용하여 가중치를 부여한 후 분석하였다. 연구결과 19세 이상 성인의 당뇨병 유병률은 10.5%였고, 당뇨병 유병 오즈비는 학력에서 대졸 이상에 비해 중졸은 2.51배, 주관적 건강상태가 매우 좋은 경우에 비해 매우 나쁜 경우 4.77배, 비만인 경우 1.44배, 고혈압을 진단받은 경우 2.57배, 고지혈증을 진단받은 경우 2.63배, 체중조절을 하지 않는 경우 1.31배, 식이요법을 하는 경우 2.75배로 높았다. 본 연구는 당뇨병 유병률을 예측하는 변수로 교육수준, 주관적 건강상태, 비만 유병 여부, 고혈압 의사진단 여부, 고지혈증 의사진단 여부, 체중조절 여부, 식이요법 여부를 밝힘으로써 당뇨병 유병률을 감소시키기 위한 간호중재와 연구방향을 제시하였다.

문자열 정보를 활용한 텍스트 마이닝 기반 악성코드 분석 기술 연구 (Research on text mining based malware analysis technology using string information)

  • 하지희;이태진
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.45-55
    • /
    • 2020
  • 정보 통신 기술의 발달로 인해 매년 신종/변종 악성코드가 급격히 증가하고 있으며 최근 사물 인터넷과 클라우드 컴퓨팅 기술의 발전으로 다양한 형태의 악성코드가 확산되고 있는 추세이다. 본 논문에서는 운영체제 환경에 관계없이 활용 가능하며 악성행위와 관련된 라이브러리 호출 정보를 나타내는 문자열 정보를 기반으로 한 악성코드 분석 기법을 제안한다. 공격자는 기존 코드를 활용하거나 자동화된 제작 도구를 사용하여 악성코드를 손쉽게 제작할 수 있으며 생성된 악성코드는 기존 악성코드와 유사한 방식으로 동작하게 된다. 악성 코드에서 추출 할 수 있는 대부분의 문자열은 악성 동작과 밀접한 관련이 있는 정보로 구성되어 있기 때문에 텍스트 마이닝 기반 방식을 활용하여 데이터 특징에 가중치를 부여해 악성코드 분석을 위한 효과적인 Feature로 가공한다. 가공된 데이터를 기반으로 악성여부 탐지와 악성 그룹분류에 대한 실험을 수행하기 위해 다양한 Machine Learning 알고리즘을 이용해 모델을 구축한다. 데이터는 Windows 및 Linux 운영체제에 사용되는 파일 모두에 대해 비교 및 검증하였으며 악성탐지에서는 약93.5%의 정확도와 그룹분류에서는 약 90%의 정확도를 도출하였다. 제안된 기법은 악성 그룹을 분류시 각 그룹에 대한 모델을 구축할 필요가 없기 때문에 단일 모델로서 비교적 간단하고 빠르며 운영체제와 독립적이므로 광범위한 응용 분야를 가진다. 또한 문자열 정보는 정적분석을 통해 추출되므로 코드를 직접 실행하는 분석 방법에 비해 신속하게 처리가능하다.

배수관 내시경 조사를 통한 간접적인 관 노후도 평가방법의 적정성 연구 (A Study on Adequacy of Pipe Deterioration Evaluation Methods using the Endoscope of Water Distribution Pipe)

  • 최태호;강신재;최재호;구자용
    • 상하수도학회지
    • /
    • 제26권5호
    • /
    • pp.669-683
    • /
    • 2012
  • The water supply pipes are buried across wide range of areas, so it is hard to spot them using excavation and takes a large amount of expense. Thus, there is a high risk for direct research and application, accompanying many difficulties in implementation of them. Therefore, it is more economical and convenient to use indirect evaluation variables than direct evaluation of the buried pipes in assessing the degree of pipe deterioration. To assess the degree of pipe deterioration using the indirect evaluation variables, it should be done first to identify how and to what extent they affect the degree of deterioration. This study measured the evaluation variables for pipe deterioration using the pipe endoscope and analyzed the measurement results and the degree of impact on the pipes. In addition, this study attempted to evaluate the adequateness of the pipe deterioration evaluation using the indirect variables based on the analysis results. The evaluation variables measured through the pipe endoscope were the thickness of sediments, size of scale, degree of desquamation and condition of connections. For the indirect evaluation variables, the data such as the property data from GIS pipe network map as well as the material, diameter, age and pipe lining material of the pipe, road type, leakage frequency, average water velocity and water pressure using the leakage repair records was collected. Using the collected data, this study comparatively analyzed the indirect evaluation variables for the degree of pipe deterioration and the results from the pipe endoscope to choose appropriate variables for pipe deterioration evaluation and calculated the weights of the indirect variables on the degree of deterioration. The results showed that the order of the impact of indirect variables on deterioration was pipe age > pipe lining material > road type > leakage frequency > average water velocity with their weights of 0.45, 0.20, 0.15, 0.10, and 0.10, respectively. Conclusively, the results suggest that the measures of sediment thickness, scale size, degree of desquamation and condition of connections are appropriate for the evaluation of pipe deterioration and sufficient for the analysis of the impact of the indirect variables on deterioration.

지표피복 데이터와 지리가중회귀모형을 이용한 인구분포 추정에 관한 연구 (Locally adaptive intelligent interpolation for population distribution modeling using pre-classified land cover data and geographically weighted regression)

  • 김화환
    • 한국지역지리학회지
    • /
    • 제22권1호
    • /
    • pp.251-266
    • /
    • 2016
  • 데시메트릭 매핑은 행정구역 단위로 집계된 인구자료를 행정구역 내부의 공간적 변이에 따라 재집계하여 고해상도의 인구분포 자료를 작성하는 가장 보편적인 기법이다. 본 연구에서는 데시메트릭 매핑을 이용한 인구분포 추정의 장단점을 검토하고, 그 개선방안으로서 지리가중회귀모형을 이용한 다변량 데시메트릭 매핑 기법을 제안하였다. 기존의 지표피복 데이터와 인구센서스 자료를 기반으로 지리가중회귀모형을 적용하여 각 집계단위별로 지표피복 유형과 인구밀도의 상관관계를 분석하고, 모형에서 산출된 회귀계수를 이용해 하위 공간구획의 인구 총수를 산정하였다. 그 결과 지리가중회귀모형 기반 다변량 데시메트릭 매핑 기법을 이용했을 때, 면적가중 보간법, 이진 데시메트릭 매핑, 피크노필렉틱 보간법, 최소자승회귀모형 기반 데시메트릭 매핑 기법 등 다른 지능형 보간법에 비해 정확한 인구분포 추정이 가능하다는 것을 확인하였다. 이는 지리가중회귀모형을 통해서 인구센서스 집계 단위별로 상이한 구역 내 공간적 이질성이 인구분포 추정에 적절히 반영되었기 때문인 것으로 평가할 수 있다.

  • PDF

HyGIS-Landslide를 이용한 산사태 발생 위험도 평가 (Landslide Risk Assessment Using HyGIS-Landslide)

  • 박정술;김경탁;최윤석
    • 한국지리정보학회지
    • /
    • 제15권1호
    • /
    • pp.119-132
    • /
    • 2012
  • 최근 급증하고 있는 국지성 집중호우로 인해 급경사지를 중심으로 산지토사재해가 빈발하고 있으며 이에 대한 예방과 취약지역 분석을 위해 산사태 위험지도의 중요성이 부각되고 있다. 본 연구에서는 산지하천유역의 토사재해 위험지역 분석을 목적으로 수자원지리정보시스템 기반의 HyGIS-Landslide 콤포넌트를 개발하였다. HyGIS-Landslide는 산림청의 산사태 위험지 판정기준 및 등급기준을 토대로 수치공간자료의 연산결과를 분류한 후 산사태 위험성을 제시하도록 설계되었으며 위험지 판정기준의 가중치를 사용자가 재 설정할 수 있도록 구현하여 산사태 발생공간의 지역적 특성을 반영할 수 있도록 하였다. 본 콤포넌트에서는 사용자가 원하는 지역을 대상으로 현시성 있는 공간자료를 활용할 수 있으며 조사자의 점수보정 과정을 반영하여 시스템 활용성을 높이고자 하였다. HyGIS-Landslide는 HyGIS가 제공하는 지형분석 기능을 통해 사용자 편의를 확보할 수 있으며 산사태 발생구역도와의 중첩연산을 통해 위험지 분류결과의 검증이 가능하다. 본 연구에서는 강원도 인제군의 시험유역을 대상으로 HyGIS-Landslide를 적용하였으며 산사태 맵핑결과와의 중첩비교를 통해 모형의 활용성을 평가하고 위험지 판정기준의 가중치를 재조정하여 위험지역을 보다 효과적으로 분류할 수 있음을 제시하였다.

이수평가지수 개발을 통한 유역별 물이용 특성 평가 (Evaluation of Basin-Specific Water Use through Development of Water Use Assessment Index)

  • 백승협;최시중
    • 한국습지학회지
    • /
    • 제15권3호
    • /
    • pp.367-380
    • /
    • 2013
  • 본 연구에서는 물이용특성을 평가할 수 있는 세부지표 및 주제별 중간지수를 과거자료 분석과 요인분석을 통하여 선정하고 주제접근방식의 구성체계로 구성하였다. 또한 이를 종합하여 유역의 물이용 특성을 평가할 수 있는 통합지수(이수취약성지수)를 개발하였다. 개발된 지수를 이용하여 1990년부터 2007년까지의 유관기관의 자료를 활용하여 북한을 제외한 812개의 표준유역에 대해 물이용 특성을 평가하였다. 지표산정에 있어 여러 표준화 및 가중치부여 방법 중 타당한 방법을 찾고자 민감도 분석을 실시하였으며 개발된 지표의 객관성을 높이고자 물이용 특성을 평가하기 위해 개발된 다른 지표와는 달리 피해이력을 세부지표에서 제외하였다. 또한 실증적인 지표 및 지수 개발과 신뢰성을 확보하기 위하여 피해이력 유무에 따른 결과 비교 분석과 2008년 강원지역에 현장 적용성 검토를 수행하였다. 이와 같은 지수의 검증 과정을 통하여 세부지표의 선정과 지수 산정 방법 및 산정식의 타당성을 확인하였다. 본 연구의 결과는 유역의 물이용 관련 취약성을 시 공간적으로 분석하고 이에 대한 관련 정보를 다양하게 제공함으로써 물이용 관련 사업이나 정책의 우선순위 결정, 취약부분에 대한 보완책 마련 등의 대책 및 수립을 지원하는 등 다양한 부분에 적용할 수 있을 것으로 판단된다.

Zoning Permanent Basic Farmland Based on Artificial Immune System coupling with spatial constraints

  • Hua, Wang;Mengyu, Wang;Yuxin, Zhu;Jiqiang, Niu;Xueye, Chen;Yang, Zhang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1666-1689
    • /
    • 2021
  • The red line of Permanent Basic Farmland is the most important part in the "three-line" demarcation of China's national territorial development plan. The scientific and reasonable delineation of the red line is a major strategic measure being taken by China to improve its ability to safeguard the practical interests of farmers and guarantee national food security. The delineation of Permanent Basic Farmland zoning (DPBFZ) is essentially a multi-objective optimization problem. However, the traditional method of demarcation does not take into account the synergistic development goals of conservation of cultivated land utilization, ecological conservation, or urban expansion. Therefore, this research introduces the idea of artificial immune optimization and proposes a multi-objective model of DPBFZ red line delineation based on a clone selection algorithm. This research proposes an objective functional system consisting of these three sub-objectives: optimal quality of cropland, spatially concentrated distribution, and stability of cropland. It also takes into consideration constraints such as the red line of ecological protection, topography, and space for major development projects. The mathematical formal expressions for the objectives and constraints are given in the paper, and a multi-objective optimal decision model with multiple constraints for the DPBFZ problem is constructed based on the clone selection algorithm. An antibody coding scheme was designed according to the spatial pattern of DPBFZ zoning. In addition, the antibody-antigen affinity function, the clone mechanism, and mutation strategy were constructed and improved to solve the DPBFZ problem with a spatial optimization feature. Finally, Tongxu County in Henan province was selected as the study area, and a controlled experiment was set up according to different target preferences. The results show that the model proposed in this paper is operational in the work of delineating DPBFZ. It not only avoids the adverse effects of subjective factors in the delineation process but also provides multiple scenarios DPBFZ layouts for decision makers by adjusting the weighting of the objective function.

사업체패널조사의 조사설계 (Survey Design of the Workplace Panel Survey in Korea)

  • 이기재;김혜원;김수진;김기민;이용희
    • 한국조사연구학회지:조사연구
    • /
    • 제9권3호
    • /
    • pp.71-91
    • /
    • 2008
  • 사업체패널조사는 상용근로자 30인 이상의 사업체를 대표하는 패널을 구성하여 전반적인 경영환경 및 인적자원 관리체계, 노사관계의 현황 및 임금교섭 과정 등에 대한 정보를 추적 조사하는 종단면 조사이다. 이 조사는 우리나라의 고용구조 및 노동수요를 체계적으로 파악하고, 전반적인 인적자원 관리체계를 평가하여 바람직 한 노동시장정책을 수립하기 위한 기초자료로 활용하는 것을 목적으로 한다. 조사에서는 인사담당자 응답용, 노사관계 업무담당자 응답용, 근로자대표 응답용으로 구분된 세 종류의 설문지가 사용되었다. 사업체패널조사의 표본사업체는 지역, 업종 구분 및 사업장 규모 등을 층화변수로 하는 층화임의추줄법에 따라 추출되었다. 사업체패널조사의 가중치는 설계 가중치, 무응답 조정, 사후층화 조정의 과정을 거쳐 작성되었으며, 조사 실사과정은 조사데이터의 질을 높이고자 컴퓨터보조개별면접 (CAPI) 방법을 적용하여 진행되었다. 본 연구에서는 사업체패널조사에 대한 구조와 주요 설문내용, 표본설계, 실사과정, 응답률 현황, 무응답 대체방법, 가중치 작성과정, 조사결과에 대한 설계효과 분석 등에 대해서 논의하였다.

  • PDF