• 제목/요약/키워드: 정보변수

검색결과 5,908건 처리시간 0.027초

조건부 상호정보를 이용한 분류분석에서의 변수선택 (Efficient variable selection method using conditional mutual information)

  • 안치경;김동욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1079-1094
    • /
    • 2014
  • 상호정보 (mutual information)를 이용한 변수 선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려하는 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수 선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 Parzen window 방법은 변수의 수가 많아질수록 변수 선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다. 본 논문에서는 조건부 상호정보 계산 시 필요한 설명변수의 분포를 다변량 정규분포로 가정함으로써 변수선택을 위한 계산시간을 단축시키며 동시에 변수선택의 성능을 향상시키고자 한다. 반면, 설명변수의 분포를 다변량 정규분포로 가정한다는 것은 강한 제약이 될 수 있으므로 이를 완화시킨 Edgeworth 근사를 이용한 조건부 상호정보 기반의 변수 선택법을 제안한다. 실증분석을 통해 본 논문에서 제안한 방법의 효율성을 살펴보았으며, 기존의 조건부 상호정보 기반 변수 선택법에 비해 계산 속도나 분류 성능 면에서 우수함을 보였다.

전자문서교환(EDI) 의 확산에 영향을 미치는 조직특성 및 IS의 성숙도에 관한 연구

  • 문태수;노영
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 춘계공동학술대회 발표논문집 IMF시대의정보화 추진전략
    • /
    • pp.281-290
    • /
    • 1998
  • 본 연구는 IOS를 실현시키는 최근 정보기술 중 EDI를 대상으로 하여 국내 기업의조직적 특성과 기업이 보유한 정보시스템의 성숙도가 ISO의 확산에 어떤 영향을 미치는지를 파악하기 위한 것이다. 그리하여 본 연구에서는 IOS확산에 영향을 미치는 변수로 조직규모, 조직 업종, 분권화, 공식화 등의 조직적 특성변수와 조직이 보유한 정보시스템의 성숙도 변수를 선장하여 각 변수가 종속변수에 미치는 영향과 독립변수간의 상호작용에 의해 종속변수에 미치는 영향을 실증적으로 분석하였다.

정보기술특성과 경영지원특성이 사용자 저항에 미치는 영향에 관한 연구 (A Study on the effects of IT characteristics and on the resistance of end-user)

  • 한경일;박종미
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2008년도 추계 공동 국제학술대회
    • /
    • pp.331-340
    • /
    • 2008
  • 본 연구는 농협을 대상으로 정보시스템 사용자의 저항요인을 감소시키고 사용자의 만족을 제고시킬 수 있는 효율적인 운영방안을 모색하기 위하여 정보기술 특성 및 경영지원 특성이 사용자들의 저항에 미치는 영향관계를 알아보았으며, 그 연구결과는 다음과 같다. 첫째, 정보기술특성과 사용자 저항변수간의 분석결과에 의하면, 정보기술의 유용성과 용이성은 사용자저항과 부(-)의 관계가 발견되어 정보기술의 유용성과 용이성이 높을수록 사용자 저항은 감소한다고 할 수 있다. 따라서 정보기술의 유용성, 용이성은 사용자 저항에 중요한 영향을 미치는 변수임을 확인하였다. 둘째, 경영지원변수 중 경영자지원과 사용자 저항 간 분석결과에 의하면, 전혀 유의한 관계가 발견되지 않았다. 따라서 정보기술특성요인이 경영지원 특성요인보다 중요한 영향을 미치는 변수임 을 확인하였다. 본 연구의 결과는 농협이 CRM 시스템을 효율적으로 구축하고 운영하는데 있어 필요한 정보기술시스템의 특성에 관한 정보를 제공하였다는데 그 의의가 있다. 하지만 본 연구는 사용자 저항의 원인변수 중 정보기술특성 및 경영지원특성에 관한 변수만을 사용하였다는 한계점을 갖고 있다. 따라서 향후에는 보다 다양한 사용자 저항 영향요인들을 고려한 연구가 진행되어야 한다고 본다.

  • PDF

은닉 변수 모델을 이용한 문서 추천 (Learning Model for Recommendation of Humor Documents)

  • 이종우;장병탁
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.514-519
    • /
    • 2002
  • 우리는 유머문서의 추천을 위해서 문서 정보, 사용자 정보, 공통 등급매김 정보 등을 모두 이용하는 4 개의 관찰 변수와 이들간 관계의 학습을 위한 은닉변수를 사용한 확률모델을 구축하였다. 이 모델은 학습된 은닉 변수와 가시 변수 간의 관계를 통해 누락 관찰 데이터에 대해서도 추정값을 유도해 낼 수 있으므로 등급매김 정보가 부족하거나 새로운 사용자와 문서의 도입시에 안정적인 추천 성능을 보여 줄 수가 있다. 또한 확률 모델의 학습을 위해서 EMl 알고리즘을 이용하였는데 저평가된 데이터의 이용도를 높이기 위해서 추천을 반대하는 확률 모델을 따로 두고 이들간에 분류모델(classification model)을 두어서 추정값을 분류해내는 방식을 취한다.

  • PDF

선형 회귀를 이용한 쌀 가격 예측 모델의 유의미한 변수 추출 (Analyzing Significant Variables from a Linear Regression-Based Prediction Model for Rice Prices)

  • 서진경;최다정;고광호;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.39-42
    • /
    • 2022
  • 쌀을 주식으로 하는 우리나라에서, 쌀의 가격에 영향을 미치는 변수를 찾는 것은 유의미한 연구이다. 본 논문에서는 쌀 가격을 예측하는 모델에 포함되는 여러 변수 가운데 상대적인 중요도가 낮은 변수를 제거하고 유의미한 변수만을 남기고자 한다. 이를 위해 기상, 수확량, 소비자물가의 10년 치 정보를 수집하고 정제한 결과 총 2460일, 7개 지역에서 추출된 17,219개의 데이터를 이용하였다. 모델 평가 결과, 모든 변수를 포함한 모델의 RMSE는 166.0759, 단계적으로 계수가 작은 9개의 변수를 제거한 최종적인 모델의 RMSE는 168.5576으로 유의미한 차이를 보이지 않았다. 최종적으로 남은 변수는 총 10개로 평균 기온, 평균 풍속, 합계 일사, 평균 지면 온도, 0.5M 평균 습도, 4.0M 평균 습도, 10CM 일 토양 수분, 30CM 일 토양 수분, 50CM 일 토양 수분, 전년도 생산량이 포함된다.

  • PDF

주요성분분석과 상호정보 추정에 의한 입력변수선택 (Input Variable Selection by Principal Component Analysis and Mutual Information Estimation)

  • 조용현;홍성준
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.175-178
    • /
    • 2006
  • 본 논문에서는 주요성분분석과 상호정보 추정을 조합한 입력변수선택 기법을 제안하였다. 여기서 주요성분분석은 2차원 통계성을 이용하여 입력변수 간의 독립성을 찾기 위함이고, 상호정보의 추정은 적응적 분할을 이용하여 입력변수의 확률밀도함수를 계산함으로써 변수상호간의 종속성을 좀더 정확하게 측정하기 위함이다. 제안된 기법을 인위적으로 제시된 각 500개의 샘플을 가지는 6개의 독립신호와 1개의 종속신호를 대상으로 실험한 결과, 빠르고 정확한 변수의 선택이 이루어짐을 확인하였다.

  • PDF

변수-변수 관련성을 이용한 동적 프로그램 조각 추출 알고리즘 (An Extraction Algorithm of Dynamic Program Slice Using Variable-Variable Relationships)

  • 김태희;김병기
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.2874-2883
    • /
    • 1998
  • 프로그램 조각화 기법은 프로그램을 이해하기 쉬운 조각 단위로 분해하여 소프트웨어 개발자나 유지보수다사 프로그램을 쉽게 이해할 수 있도록 지원한는 방법이다. 본 논문ㅇ세는 변수-변수 관련성을 이용하여 정확하고 수행 가능한 프로그램 조각을 추출하는 동적 프로그램 조각 추축 알고리즘을 제안한다. 각 문장에서 변경되는 변수와 참조되는 변수로 나누어서 변수 집합을 계산하고, 선언부에 있는 문장에 대해 변수-변수 관련성을 계산한다. 변수-변수 관련성을 계산할 때는 선언부의 변수가 다른 문장에서 변경되는 변수로 사용된 경우와 참조되는 변수로 사용된 경우를 별도로 조사하여 변경되는 변수 집합은 무조건 관련 집합에 포함시키고, 문장에서 참조되는 변수들은 문장들을 다시 비교하여 기준 변수와 관련된 문장만을 추출하여 관련 집합에 포함시킨다. 제안한 알고리즘은 C 언어를 대상으로 실험한 결과 정확하고 수행 가능한 동적 조각을 추출하였고, 기존의 방법들보다 관련 문자을 찾기 위한 문장의 비교횟수를 평균 42%까지 감소시켰다. 기준 변수가 많을수록 기준 변수와 관련이 없는 변수가 많을수록 문장의 비교 횟수가 현저하게 감소하였다.

  • PDF

분절 특징의 경향 공유에 관한 연구 (A study on trend tying of the segmental-feature)

  • 윤영선
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.17-20
    • /
    • 2001
  • 본 논문에서는 분절 특징 HMM(SFHMM)의 매개변수를 줄이는 방법을 제안한다 SFHMM이 HMM보다 우수한 성능을 보이더라도, SFHMM의 매개 변수 수는 HMM보다 많기 때문에 매개 변수 수를 줄이는 방법에 대한 연구가 필요하다. 일반적으로 궤적(trajectory)은 경향(trend) 정보와 위치(location) 정보로 분리될 수 있다. 경향은 분절 특징의 변이를 나타내며, SFHMM 변수의 많은 부분을 담당하기 때문에, 경향 정보를 공유할 수 있다면 SFHMM의 매개 변수 수는 감소될 수 있을 것이다. 제안된 방법은 궤적의 경향 정보를 양자화(quantization)에 의하여 공유한다. 제안된 방법의 성능을 살펴보기 위하여 영어 데이터베이스인 TIMIT 자료를 사용하여 실험하였다. 실험 결과 제안된 방법의 성능은 기존 연구와 거의 유사하나, 궤적의 다양한 정보를 이용한다면 궤적 정보의 공유에 의하여 매개 변수를 줄일 수 있을 것으로 보인다.

  • PDF

멀티미디어를 이용한 정보기술 교육훈련의 효율성에 영향을 미치는 링크(Link)수와 노드(Node)크기에 대한 실증적 연구

  • 김대룡
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2000년도 추계학술대회
    • /
    • pp.29-35
    • /
    • 2000
  • 본 연구는 멀티미디어의 기본 구성요소인 링크와 노드를 처리변수로 하고 사용자의 편의성과 유용성에 대한 인식을 종속변수로 해서 링크의 숫자와 노드의 크기가 사용자의 인식에 어떻게 영향을 미치는지에 대해 밝히고자 했다. 먼저 2x3 팩토리얼 디자인에 따라 각각 다른 처리변수의 조합을 가진 6개의멀티미디어 자료가 구축이 되었으며 경영대 학생들을 대상으로 실험을 하여 자료를 수집했다. 수집된 자료는 타당성 검사와 신뢰성 검사를 거친 뒤 통계적 분석을 하였다. 종속변수에 대한 상관관계가 검사되었으므로 변량 분산 분석으로 처리변수의 종속변수에 대한 통계적 유의성을 검사했으며 단변량 분산분석 중 이원배치분산분석으로 각각의 종속변수에 대한 처리변수의 영향을 검토했다. 인구통계학적 자료의 종속변수에 대한 상관관계가 발견됨에 따라 다변량 공분산분석과 단변량 공분산분석을 통해 인구통계학적 자료의 영향을 조사했다. 마지막으로 평균차이분석을 통해 실험 참가자들의 선호도를 조사했다. 본 연구의결과를 요약하면 처리변수는 사용자 인식 편의성과 인식 유용성에 영향을 미치고 링크 수와 노드 크기가 멀티미디어의 설계에 중요한 요인인 것이 밝혀졌다.

  • PDF

공공도서관의 지식정보취약계층서비스 이용에 영향을 미치는 요인 분석 - 수도권 지역을 중심으로 - (An Analysis of Factors Influencing Use of Knowledge and Information Services for Vulnerable Classes in Public Libraries)

  • 박혜리
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2017년도 제24회 학술대회 논문집
    • /
    • pp.59-64
    • /
    • 2017
  • 본 연구는 공공도서관의 지식정보취약계층 서비스 이용에 미치는 영향요인을 분석한 것이다. 연구대상은 서울, 인천 경기지역의 공공도서관 382곳이며, 자료는 국가도서관통계시스템을 통해 2016년도 통계자료를 수집하였다. 분석결과, 지식정보취약계층 서비스 이용은 총 15개의 변수 중 9개가 유의하지 않았으며, 지식취약계층관련 예산, 사서 수, 문화프로그램 실시횟수, 자원봉사자 수, 자료구입비 예산, 노인 및 장애인 열람석 수의 총 6개 변수가 종속변수인 지식정보취약계층서비스 이용자 수에 영향을 미치는 것으로 나타났다. 회귀모형의 전체적인 설명력은 43.2%이며, 자료구입비 예산은 유일하게 부(-)의 영향을 미치고 있다. 이를 제외한 5개의 변수는 종속변수와 정(+)의 관계가 있고, 특히, 지식취약계층관련 예산이 가장 큰 영향을 미치는 것으로 분석되었다. 본 연구 결과는 추후 공공도서관에서 지식정보취약계층 서비스 활성화를 위한 방안을 수립할 때 기초자료로 활용될 수 있을 것이다.

  • PDF