• 제목/요약/키워드: 연관성분석

검색결과 4,845건 처리시간 0.038초

한국인 성인에서 스트레스에 대한 생화학적 요인 분석 연구 (Study of biochemical factors and stress in Korean Adults)

  • 이범주
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.31-36
    • /
    • 2021
  • 스트레스는 건강에 대한 매우 일반적인 위험요소이며 내분비선 및 면역체계와 연관성이 있다. 전 세계적으로 스트레스와 생화학적 요인에 대한 연관성 연구는 일부 진행되었으나, 아직까지 국내에서는 스트레스와 생화학적 인덱스사이에서의 연관성관련 연구는 매우 드물다. 따라서, 본 연구에서는 국내 성인을 대상으로 스트레스와 인구학적 정보 및 생화학적 인덱스에 대한 연관성을 분석하고 스트레스에 대한 위험요인을 도출하고자 한다. 데이터 분석을 위해 binary logistic regression을 이용하여 스트레스군과 정상군을 분석하였다. 남녀 모두에서 나이와 주중 하루평균 수면시간이 스트레스와 연관성이 매우 높았고, 우울증 점수(Patient Health Questionnaire-9)도 스트레스와 매우 높은 연관성을 보였다. 여성에서는 백혈구 수치가 스트레스와 매우 연관성이 높았고, 남성에서는 적혈구 수치가 스트레스와 유의성이 높았다. 이러한 연구결과는 향후 스트레스 예방 및 국민건강에 기여할 것이다.

한국어 텍스트 내 용어연관성 분석을 위한 기초 연구 (Preliminary Study on the Analysis of Term Associations in Korean Text)

  • 정영미;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.243-246
    • /
    • 1998
  • 텍스트 자동분석을 통해 얻어진 통계적인 용어연관성은 정보검색 및 언어 처리와 관련된 여러 분야에서 폭넓게 이용되고 있다. 용어연관성을 구하기 위한 연관계수는 여러 가지가 있지만 적용분야에 관계없이 유사계수 공식이나 상호정보량 공식이 주류를 차지하고 있다. 이런 공식들은 그 통계적 특성이 서로 다르기 때문에 알맞은 적용분야를 파악할 필요가 있다. 이 연구에서는 필요 연관계수 공식의 특성을 이론적으로 파악하였고, 실험으로 검증하기 위하여 240만 어절 분량의 실험용 한국어 신문기사 데이터베이스를 구축하였다.

  • PDF

이분형 예측 유사성 측도의 연관성 평가 기준 적용 방안 (The application for predictive similarity measures of binary data in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.495-503
    • /
    • 2011
  • 데이터 마이닝에서의 연관성 규칙은 방대한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화 하는 방법이다. 의미 있는 연관성 규칙을 탐사하기 위한 가장 기본적인 연관성 규칙 평가 기준에는 지지도, 신뢰도, 향상도 등이 있다. 이들 중에서 향상도는 그 값에 의해 양의 연관성이 있는지 아니면 음의 연관성이 있는지, 즉 연관성의 방향을 알 수 있는 반면에 지지도와 신뢰도는 그 방향을 알 수가 없다. 이를 위해 순수 신뢰도와 기여 순수 신뢰도가 제안되었으나 이들 또한 단점을 안고 있다. 본 논문에서는 기존의 여러 형태의 신뢰도가 가지고 있는 문제점을 해결하기 위해 군집분석이나 다차원 분석에서 활용되고 있는 이분형 예측 유사성 측도 중에서 -1과 1 사이의 값을 가지는 Yule의 Y 및 Q 측도를 연관성 평가 기준으로 제안하였다. 또한 기존의 순수 신뢰도 및 기여 순수 신뢰도의 문제점을 파악한 후, 예제를 통하여 이분형 예측 유사성 측도의 유용성에 관해 알아보았다. 그 결과, 본 논문에서 고려한 유사성 측도들은 기존의 측도들이 가지고 있는 문제점을 해결할 수 있어서 본 논문에서 제안한 이분형 예측 유사성 측도가 연관성 평가 기준으로 활용할 수 있다는 사실을 확인하였다.

데이터 시각화를 이용한 취업자 특성분석 (Analysis of employee's characteristic using data visualization)

  • 조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.727-736
    • /
    • 2014
  • 대졸 취업자들의 특성을 분석하기 위해 주로 모수적인 접근방법을 사용해 온 기존의 연구와는 달리, 본 연구에서는 R 프로그램을 이용하여 데이터 시각화에 초점을 맞추어 분석하였다. 이를 위해 취업여부에 미치는 개인특성 변수들의 유사성 분석을 위해 다중대응분석을 실시하였다. 또한 취업여부에 영향을 미치는 개인특성 변수들의 고차 상호작용효과를 분석하기 위해 의사결정나무분석을 실시하였다. 그리고 연관성분석을 이용한 연관성 규칙을 계산하여 개인특성 변수들이 취업여부에 미치는 효과를 분석하고, 연관성규칙의 결과를 사회연결망분석의 연결망 구조로 시각화 하였다. 분석결과 다음과 같은 주요 결과를 얻었다. 첫째, 취업여부에 영향을 미치는 변수들로는 평균평점, 계열, 강의평가 점수, 성별 등으로 나타났다. 둘째, 평균평점과 강의평가점수가 보통이상으로 높고 자연계열인 경우 취업 가능성이 높음을 알 수 있다. 또한 수시모집으로 입학한 연령이 낮은 졸업생이 취업가능성이 높게 나타났다. 셋째, 평균평점이 낮고 예체능 계열이며 연령이 높은 대졸자들이 취업가능성이 낮음을 알 수 있다. 또한 예체능 계열의 단일전공을 한 여학생들의 경우도 취업가능성이 높지 않음을 알 수 있다.

전자상거래 이용시 연관성 분석을 통한 맞춤형 상품추천 모델 설계 (Design of customized product recommendation model on correlation analysis when using electronic commerce)

  • ;박기용;최상현
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.203-216
    • /
    • 2022
  • 본 연구에서는 COVID-19의 영향과 온라인 시장을 중심으로 구매패턴이 변화하는 현 경영환경의 시대에서 온라인 배송업체의 구매정보와 상품정보를 기반으로 군집분석과 연관성 분석을 실시하였다. 고객군집, 상품군집, 그리고 교차결합을 통해 데이터를 세분화시켜 결합군집을 생성하여 학문적으로 새로운 방안의 군집분석을 시도하였으며, 각각의 군집분석 결과를 토대로 연관성 분석을 하였다. 연관성 분석 결과, 상대적으로 결합군집에서 더 많은 연관 규칙이 도출 되었으며, 중복률은 더 적은 것으로 분석되어 효율성이 매우 높은 것으로 나타났다. 이는 고객의 니즈에 맞게 상품을 추천하기 위해서는 결합군집이 가장 적합한 모델이라고 판단된다. 결합군집 모델은 소비자에겐 시간 절약과 유용한 정보를 제공하면서, 해당 업체에는 판매량을 증가시키는 등의 긍정적인 효과를 가져올 것으로 사료된다. 향후 연구과제로써, 다양한 특성을 갖고 있는 다수의 온라인 배송업체들을 대상으로 비교·분석한다면 좀 더 명확하고 유의미한 연구결과를 도출할 수 있을것으로 기대된다.

연관성 척도의 빈도수준 선호경향에 대한 연구 (A Study on the Frequency Level Preference Tendency of Association Measures)

  • 이재윤
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.281-294
    • /
    • 2004
  • 연관성 척도는 정보검색 및 데이터마이닝을 비롯한 다양한 분야에서 사용되고 있다. 각 연관성 척도가 높거나 낮은 빈도 중에서 어떤 쪽을 선호하는가를 나타내는 빈도수준 선호경향은 척도의 적용 결과에 중요한 영향을 미치므로 이에 대한 면밀한 조사가 필요하다. 이 연구에서는 주요 연관성 척도들의 빈도수준 선호경향을 가상의 데이터를 통해 분석하고 그 결과를 제시하였다. 또한 코사인 계수를 비롯한 대표적인 연관성 척도에 대해서 빈도수준 선호경향을 조절할 수 있는 방법을 제안하였다. 이 조절 방법을 동시출현 기반 질의확장 정보검색에 적용해본 결과 그 유용성이 확인되었다. 마지막으로 분석 및 실험 결과가 관련 분야에 시사하는 바를 논하였다.

한국인 성인남녀에서 신경통과 혈액정보 및 체형정보와의 연관성 연구 (Study of association of neuralgia with blood parameters and anthropometric indices in Korean adult men and women)

  • 이범주
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.413-418
    • /
    • 2020
  • 신경통은 중증의 고통을 수반하는 질병으로써 인간의 삶의 질에 매우 강한 영향을 주는 질병이며, 국내에서도 노화에 따라 유병율이 증가하는 추세이다. 그동안 신경통에 대한 국내외연구들은 주로 신경통과 연관성이 있는 정신질환, 인구학정 정보, 영양성분 등 과의 연관성 분석이 대부분이고, 혈액정보와의 연관성 연구는 매우 드물다. 따라서, 본 연구에서는 신경통과 혈액 파라미터들과의 연관성을 도출하고 신경통과 연관성이 있는 임상지표를 도출하고자 한다. 본 연구를 위해 질병관리본부의 국민건강영양조사 데이터를 기반으로 binary logistic regression을 이용하여 분석하였다. 실험결과 남녀 모두에서 나이가 신경통과 가장 연관성이 높은 경향이 있는 것으로 나타났으며, 여성에서는 복부둘레와 헤마토크리트 수치가 신경통과 연관성이 있는 것으로 나타났고, 남성에서는 공복시혈당과 헤모글로빈이 신경통과 연관성이 있는 것으로 나타났다. 또한 복부둘레 및 혈액정보들과 신경통사이에서의 연관성이 남녀에서 차이가 있는 것을 밝혀내었다.

전자상거래 쇼핑몰 사례분석

  • 최경호
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2002년도 춘계학술대회
    • /
    • pp.129-137
    • /
    • 2002
  • 최근 MarketPlace의 시장의 한 영역으로 형성되고 있는 전자상거래 사이버 쇼핑몰의 규모와 확산도를 알아보고, 이 중 종합쇼핑몰 3곳, 전문쇼핑몰 1곳의 사이트 현황을 살펴본다. 또한 교차판매를 위한 상품간 연관성분석과 소비자간 구성과 거래동향 등을 분석하기 위하여 Data Mining을 이용한다. 좀 더 세분화된 고객분석을 위한 개선점을 제기하고, 이를 통하여 전반적인 전자상거래 쇼핑몰에 대한 인식을 제고한다.

  • PDF

인터넷상에서의 범주형 자료분석 시스템 개발 (Categorical Date Analysis System in the internet)

  • 홍종선;김동욱;오민권
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.83-95
    • /
    • 1999
  • 본 논문의 목적은 인터넷에서 범주형 자료분석에 대한 전문적인 지식이 없는 일반 분석자들에게 보다 쉽고, 간편하게 다룰 수 있는 범주형 자료 분석 시스템을 제공하는것이다. 이 분석 시스템은 크게 세 가지 측면으로 설계하여 구현하였다. 첫째, 범주형 자료에 대한 탐색적 자료분석을 위하여 세 가지 종류의 히스토그램을 제공한다. 둘째, 범주형 변수들간에 존재하는 연관성을 측정하기 위한 여러 연관성 측도들을 제공한다. 특히, 현재 많이 사용되는 통계 패키지들에서 제공하지 못하는 모자익 그림과 연관 그림을 동적 그래픽스로 구현하여 연관성을 측정하거나 모형을 설정하는데 유용한 정보를 얻을 수 있도록 하였다. 셋째, 대수선형모형에 대한 분석을 통해 사용자가 가장 잘 적합된 대수선형모형을 선택할 수 있게 하였다.

  • PDF

SNP와 양적 표현형의 연관성 분석을 위한 분류기 (A Classifier for the association study between SNPs and quantitative traits)

  • 엄상용;이광모
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.141-148
    • /
    • 2012
  • 인간 유전체 정보와 관련된 기술이 발전함으로 인하여 이를 이용한 질환 또는 질병에 대한 연관성을 분석하여 그 위험도나 치료 예후 등에 대한 예측하기 위한 연구가 활발히 진행되고 있다. 이러한 연구의 대부분은 대표적인 질적 표현형을 대상으로 하는 환자-대조군 연구(case-control study) 방법을 이용하고 있으며 양적 표현형에 대해서는 개별 단일 염기 변이의 연관성을 회기 분석 방법을 이용하여 규명하는 연구가 주로 수행되고 있다. 특히 복합 질병(complex disease)에 대한 위험도를 예측하기 위한 연구의 경우 흔한 변이 흔한 질환(common variants common disease)의 가정아래 주로 각각의 단일 염기 변이가 보이는 연관성 정보를 기반으로 진행되고 있으며 여러 변이의 상호 작용에 의한 영향을 분석한 결과는 상대적으로 미비하다. 이 논문에서는 양적 표현형에 대한 SNP의 연관성을 분석하고 그 결과로 발견된 SNP을 이용하여 대상 표현형의 값을 예측하기 위한 분류기를 구성하고 그 성능을 평가하였으며 분류기의 단일 염기 변이의 선택에 있어서 각각의 단일 염기 변이의 연관성을 고려할 때와 단일 염기 변이의 쌍이 보이는 연관성을 고려할 때의 분류 성능을 비교하였다.