• Title/Summary/Keyword: 연관연구

Search Result 9,022, Processing Time 0.042 seconds

환자-대조군 연구에서 인구집단 층화가 일배체형 경향성 검정에 미치는 영향 (Study on Effects of Population Stratification on Haplotype Trend Test in Case-Control Studies)

  • 김진흠;강대룡;임현선;남정모
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.1085-1096
    • /
    • 2009
  • 환자-대조군 연관성 연구에서 후보 유전자와 질병이 연관되어 있지 않더라도 인구집단 층화로 인해 가짜 연관성이 발생할 수도 있다. 본 연구에서는 일배체형에 기초한 환자-대조군 연관성 연구에서 인구집단 층화로 인한 가짜 연관성을 해결하기 위한 방법으로, Zaykin 등 (2002)이 제안한 일배체형 경향성 모형에 인구집단 층화에 대한 정보를 추가하고자 한다. Zaykin 등 (2002)의 모형과 제안한 모형에 기초한 일배체형의 유의성 검정에서 인구집단 층화와 인구집단에 대한 관측 오차가 제1종 오류율에 미치는 영향을 모의실험을 통해 살펴보았다. 인구집단이 층화되어 있지만 각 개체가 속한 인구집단을 정확히 알 수 있을 때, Zaykin 등 (2002)의 모형에 기초한 검정은 제1종 오류율을 잘 조절하지 못했지만 본 연구에서 제안한 모형에 기초한 검정은 제1종 오류율을 잘 조절하는 것으로 나타났다. 그러나 인구집단이 층화되어 있고 관측 오차가 존재하면 제안한 모형에 기초한 검정도 제1종 오류율을 조절하지 못하고 명목 유의수준보다 큰 값을 갖는 것으로 나타났다. 따라서 단일염기다형성에 기초한 환자-대조군 연관성 연구와 마찬가지로 일배체형에 기초한 환자-대조군 연관성 연구에서도 인구집단 층화에 대한 정보를 갖고 있다할지라도 그 속에 관측 오차가 존재하면 위양성을 피하기 어렵다는 것을 알 수 있었다.

테이블 연관관계 도출을 통한 데이터베이스스 워크로드 분석 (Database Workload Analysis Based on Table Relationships)

  • 김민수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.303-306
    • /
    • 2006
  • 데이터베이스 시스템을 효율적으로 운영하기 위하여 데이터베이스 관리자는 시스템의 자원 사용과 응용 프로그램에 의한 워크 로드의 특징을 알아야 한다. 워크 로드 분석을 위해 테이블, 리소스, 튜닝 방법론 등 여러 연구가 진행되어 왔으나 워크 로드를 형성하는 역할이 특정 테이블에만 집중되어 있는 현상에 대해서는 연구된 적이 없었다. 본 논문에서는 운영 시스템의 테이블 간의 연관 관계를 도출해 보고 연관 관계를 가지는 테이블 들이 워크 로드에 참여하는 유형과 횟수를 분석하는 워크 로드 분석 도구를 제안하고 대형 CRM 분석 시스템에 적용하여 데이터베이스 시스템의 워크로드를 분석해 본다.

  • PDF

건축공사 주요자재별 에너지소비량 및 CO2 배출 원단위 값 산출에 산업연관표 적용 적정성 검토 연구 -2005년, 2007년 산업연관표를 중심으로- (Application of Input-Output Table to Estimate of Amount of Energy Consumption and CO2 Emission Intensity in the Construction Materials -Focusing on Input-Output Tables Published in 2005, 2007-)

  • 정영철;김성은;장영준;김태희;김광희
    • 한국건축시공학회지
    • /
    • 제11권3호
    • /
    • pp.247-255
    • /
    • 2011
  • 한국은행에서 2000년도에 발행된 산업연관표를 적용한 주요 건축자재의 에너지소비량과 $CO_2$ 배출에 대한 원단위 DB는 있지만 2005년, 2007년에 발행된 산업연관표를 이용한 원단위 DB는 없는 실정이다. 본 연구에서는 최근에 발행된 2005년, 2007년도 산업연관표를 이용하여 주요 건축자재에서 발생되는 에너지소비량 및 $CO_2$ 배출 원단위 값을 산정하고자 한다. 주요 건축자재의 에너지소비량 및 $CO_2$ 배출원단위 산출을 위한 방법은 산업연관표를 이용한 DB 구축 방식을 바탕으로 산출하였으며, 건설현장에서 주로 사용되는 16가지의 건설자재는 선별하여 적용하였다. 기존 연구결과에서 제시한 2000년도 산업연관표를 적용하여 산출된 원단위 DB 값과 비교한 결과 근소한 차이를 보이고 있어 본 연구의 산출방법이 적정한 것으로 판단하였다. 2005년, 2007년도 산업연관표를 이용하여 산출한 에너지소비량과 $CO_2$ 배출 원단위 값은 감소세를 보이고 있는 것으로 나타났으며, 시멘트와 철근을 주원료로 하는 자재에서 가장 많은 에너지소비량 및 $CO_2$ 배출 원단위 값을 나타났다. 본 연구의 결과를 통해 국내 실정에 적합한 건설자재 생산단계에서 발생되는 환경부하의 간접적인 예측이 가능할 것으로 사료된다.

멀티 온톨로지 기반의 키워드 연관성을 이용한 전문가 검색 시스템 (The Expert Search System using keyword association based on Multi-Ontology)

  • 정계동;황치곤;최영근
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.183-190
    • /
    • 2012
  • 본 연구는 연구논문 및 저자 프로파일을 기반으로 상호 협력이 가능한 전문가 검색 시스템을 구축한다. 제안한 방법론은 다음과 같다. 첫째, 입력 키워드와 가장 연관성 높은 키워드를 검색하기 위한 가중치 부여 기법을 제안하고, 둘째, 이 기법을 통해 전문가를 효율적으로 검색하는 방안을 제안한다. 우선적으로 논문에서 키워드와 저자 프로파일을 추출하고, 이를 통하여 전문가를 검색할 수 있도록 한다. 이것은 소셜 네트워크의 여러 분야에서 활용할 수 있다. 이러한 정보는 여러 시스템에 분산되어 있다. 이렇게 분산된 데이터를 통합하기 위한 기술로 멀티 온토롤지를 이용하는 기법을 제안한다. 멀티 온톨로지는 메타 온톨로지, 인스턴스 온톨로지, 로케이션 온톨로지와 연관관계 온톨로지로 구성되고, 연관관계 온톨로지는 동적으로 키워드 연관관계 분석을 통해 구축된다. 이 멀티 온톨로지를 이용하여 전문가 망을 제공하고, 이것은 키워드의 연관관계 추적을 통한 전문가 검색이 가능하도록 한다. 이를 통하여 전문가들의 연구물을 확인할 수 있도록 제공함으로써 세부 전문분야를 확인할 수 한다.

우리나라와 중국, 일본 물류산업의 상호 파급효과 비교분석 (A study on the International I/O Table Analysis among Korea, Japan, and China Logistics Industries)

  • 반영길;신승식
    • 한국항만경제학회지
    • /
    • 제24권4호
    • /
    • pp.173-197
    • /
    • 2008
  • 본 연구는 한 중 일 등 동북아 3국의 물류산업 투자가 3개국 각각의 물류산업에 미치는 영향, 혹은 한 중 일 3국의 타 산업 투자가 해당 국가의 물류산업에 미치는 영향 등 동북아 3국의 물류산업 상호 파급효과를 분석하는 것이다. 이를 위해 본 연구에서는 일본 아시아경제연구소에서 작성한 11개국 국제산업연관표를 이용하여 물류부문을 외생화한 국제산업연관분석을 수행하였다. 본 연구에서는 1차적으로 11개국 국제산업연관표 가운데 한국, 중국, 일본을 중심으로 하는 국제산업연관표로 작성하였으며, 다음으로 물류산업에 대한 3국간 의존관계를 파악하기 위하여 각국의 물류산업의 변화에 따른 상대국들의 영향을 분석하였다. 분석결과, 물류부문의 생산파급효과는 3국 모두 아직까지는 자국 내 효과가 가장 큰 것으로 나타났으나, 중국의 경우 물류시장의 변화에 따라 한국과 일본 산업이 밀접하게 영향을 받는 것으로 나타났다. 그러나 3국 물류산업간 연관관계는 여전히 매우 낮은 수준으로 나타나 아직까지는 3국 물류산업이 사업영역을 공유하지 않고 독자적인 물류산업을 진행하고 있는 것으로 판단되었다.

  • PDF

MarSel : 대용량 SNP 일배체형 데이터에 대한 연관불균형기반의 tagSNP 선택 시스템 (MarSel : LD based tagSNP Selection System for Large-scale SNP Haplotype Dataset)

  • 김상준;여상수;김성권
    • 정보처리학회논문지A
    • /
    • 제13A권1호
    • /
    • pp.79-86
    • /
    • 2006
  • 최근 인간의 다양성과 SNP과의 연관연구에 드는 비용을 줄이기 위해서, 최소의 tagSNP을 선택하는 문제를 해결하기 위한 연구가 이루어지고 있다. 일반적으로 많은 수의 SNP들을 여러 블록으로 분할하여 각 블록 내에서 tagSNP을 선택하는 접근방법이 사용되고 있다. 본 논문에서 구현된 MarSel은 기존의 블록분할 접근 방법의 문제로 볼 수 있는 생물학적 의미의 부족을 해결하고자, 연관불균형(Linkage Disequilibrium, LD)의 개념을 도입한 시스템이다. 기존의 접근방법에서는 생물학적으로 재조합(recombination)이 일어나지 않는 연속된 구간에서도 여러 블록으로 나누어지는 문제가 생겼던 반면, MarSel에서는 연관불균형 계수 |D'|에 의해서 연속된 구간이 하나의 블록으로 유지된 상태에서 tagSNP을 선택하게 된다. 또한 MarSel에서는 각 블록 내에서 tagSNP을 선택 할 때에 엔트로피(entropy) 기반의 최적해 알고리즘을 이용함으로써 최소한의 tagSNP 선택을 보장하게 되며, 기존의 구현된 시스템들보다 더 많은 양의 데이터를 효율적으로 처리할 수 있도록 구현되었기 때문에 염색체 레벨의 연관 연구도 가능하게 해준다.

독자 추천도서 정보를 이용한 작가 이미지 분석 연구 (Analysis of Author Image Based on Book Recommendation from Readers)

  • 최상희
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.153-171
    • /
    • 2017
  • 여가를 위해 독서를 하는 독자는 특정 작가를 선호하는 경우가 많은데 독서분야를 확장할 때에도 자신이 선호하는 작가와 연관된 작가나 장르로 독서분야를 확장하는 성향이 있다. 이 연구에서는 중심작가로 에드거 앨런 포를 선정한 후 독자들이 에드거 앨런 포와 연관하여 다른 독자에게 추천하는 작가와 작품정보를 기반으로 작가 이미지를 분석하였다. 에드거 앨런 포와 동시출현한 작가와 작품의 빈도수를 분석하고 추천작가간, 작품간 관계를 네트워크 기법으로 분석하였다. 분석결과 에드거 앨런 포의 장르적 이미지와 연관된 작가군, 작가들 간의 관계, 연관 도서가 파악되었다, 이 연구에서 제시한 특정 작가의 이미지, 연관 작가 및 작품 정보를 도출하는 방안은 특정 작가를 중심으로 도서관 독서 프로그램이나 문화 프로그램, 북 큐레이션을 하게 될 경우 활용할 수 있는 도구가 될 것이다.

연관 규칙 마이닝에서의 평가기준 표준화 방안 (Standardization for basic association measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.891-899
    • /
    • 2010
  • 연관성 규칙은 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두개 이상의 항목간의 관련성을 나타내는 기법으로 데이터 마이닝 분야에서 가장 많이 활용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 평가기준에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 향상도는 그 값의 범위가 지지도나 신뢰도와는 다르므로 지지도나 신뢰도의 범위를 동일하도록 하기 위해 표준화할 필요가 있으며, 지지도와 신뢰도도 하나의 후항변수에 대해 여러 개의 전항변수들이 있는 경우 이들 중 어느 것이 후항변수와 가장 연관성이 있는지를 객관적으로 비교하기 위해서도 표준화가 필요하다. 본 논문에서는 각 항목집합의 주변 발생확률을 고려하여 객관적이고도 정확한 연관성 정도를 파악하기 위해 연관성 평가기준을 표준화하는 방안에 대해 연구하고자 한다. 또한 흥미도 측도의 세 가지 조건의 충족 여부를 점검해 본 후, 구체적인 예제를 통하여 기존의 연관성 평가기준과 표준화된 연관성 평가기준을 비교 분석하고자 한다.

온라인 동영상 플랫폼의 알고리듬은 어떤 연관 비디오를 추천하는가: 유튜브의 K POP 뮤직비디오를 중심으로 (What Do The Algorithms of The Online Video Platform Recommend: Focusing on Youtube K-pop Music Video)

  • 이영주;이창환
    • 한국콘텐츠학회논문지
    • /
    • 제20권4호
    • /
    • pp.1-13
    • /
    • 2020
  • 본 연구는 온라인 동영상 플랫폼에 적용되는 추천 알고리듬을 이해하고자 유튜브에서 K-pop 뮤직비디오의 콘텐츠 특성과 재생 시 추천되는 연관 비디오(related video)의 관계를 규명하고 네트워크 분석을 통해 어떤 비디오가 연관 비디오로 추천되는지 살펴보았다. 분석 결과, K-pop 재생 시 비디오의 좋아요 수가 추천 순위에 영향을 주었으며 대부분 같은 채널에 속하거나 동일한 기획사에서 제작한 비디오가 연관 비디오로 추천되었다. 그리고 연관 비디오의 네트워크 분석 결과, K-pop 뮤직비디오의 네트워크가 강하게 형성되어 있으며 연관 비디오의 네트워크 분석에서 BTS의 뮤직비디오가 중심성이 높게 나타났다. 이러한 연구결과는 K-pop간의 네트워크가 강하기 때문에 K-pop을 검색 쿼리로 입력해서 비디오를 시청할 때는 연속적으로 K-pop을 즐길 수 있지만, 반대로 다른 장르의 비디오를 시청할 때는 K-pop이 연관 비디오로 추천되지 못할 수 있음을 의미한다.

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF