• 제목/요약/키워드: Measure

검색결과 31,065건 처리시간 0.059초

태백산맥 남부산지의 암설사면지형 (The Study on the Debris Slope Landform in the Southern Taebaek Mountains)

  • 전영귄
    • 대한지리학회지
    • /
    • 제28권2호
    • /
    • pp.77-98
    • /
    • 1993
  • 본 연구는 암설사면지형이 잘 발달하고 다양하게 분포하는 태백산맥의 남부산지를 대상으로 항공 사진판독과 도상계측 및 현지조사를 통하여 노출암설사면의 분포, 형태 및 퇴적물의 특성을 분석하고 사면의 지형적 배열과 지형발달에 관해서 연구한 논문으로써 분포적 특성에 있어서는 애추의 경우 기반암이 경암이거나 절리가 잘 발달된 지질에서, 암괴류의 경우는 화강섬록암 지질에서 높은 분포밀도를 보였다. 형태적 특성은 애추, 암괴류 모두 설상이 각각 83${\%}$, 80${\%}로 가장 많았으며 지형면의 경사도에 있어서는 애추가, 길이에 있어서는 암괴류가 각각 우세했다. 퇴적물의 특성중 암설의 평균입경은 암괴류가 보다 크게 나타났다. 한 지형면에서 암설의 장축방향성의 경우 방향성 있는 경우와 없는 경우가 있는데, 후자는 지형면상의 함몰로 그 방향성이 상실된 것으로 보인다. 끝으로 지형발달의 경우, 애추는 암석낙하(rock fall)에 의한 형성기(최종빙기)와 2차적인 영역에 의한 조정기(후빙기)로 암괴류는 암괴의 생성기(제3가 또는 제 4기의 간빙기), 암괴류의 형성기(최종빙기), 조정기(후빙기)로 구분할 수 있었다. 그리고 산지 사면의 배열유형은 6가지 유형으로 분류되었다.

  • PDF

시카고협약체계에서의 EU의 항공법규체계 연구 - TCO 규정을 중심으로 - (A Study on Aviation Safety and Third Country Operator of EU Regulation in light of the Convention on international Civil Aviation)

  • 이구희
    • 항공우주정책ㆍ법학회지
    • /
    • 제29권1호
    • /
    • pp.67-95
    • /
    • 2014
  • 시카고협약 일부 체약국은 자국 항공사에게 AOC(Air Operator Certificate)를 승인하여 발행하는 것 이외에 외국 항공사에게도 FAOC(Foreign AOC)를 발행하고 있으며 다양한 항공안전평가도 실시하고 있다. 외국 항공사에게 FAOC 승인 발행 및 항공안전 평가 실시는 점차 확대되고 있는 추세로 전 세계적으로 항공안전증진 및 항공기 사고율 감소에 기여한 공로가 크다고 볼 수 있으나, 항공사 입장에서는 추가적인 허가제도 및 운항제한으로 인하여 항공기 운항 상 불편이 초래되고 있다. 유럽항공안전청(EASA)은 European public law 인 Basic Regulation에 의해 2003년에 설립되어 운영되고 있는 유럽의 단일 항공안전전문기관이다. EASA의 주요 임무는 민간항공분야의 안전기준 및 환경보호기준을 최상의 기준으로 증진하는 것이며, 감항, 승무원, 항공기 운항, 공항 및 ATM 등에 대한 입법업무 및 표준설정 업무를 관장하고 있으며 업무 범위가 점점 확대되고 있다. 유럽에서 TCO(Third country operator) Implementing Rule이 발효(2014.5.26.)됨에 따라, EASA는 32개 EASA 회원국으로 운항하고자 하는 모든 항공운송사업용 TCO에 대하여 안전에 대한 승인을 행할 권한을 가진다. 이에 따라, TCO에 대한 평가 및 승인을 할 때, 안전관련 부문에 대한 평가 및 승인은 EASA가 담당하고 운영허가(Operating permit) 부문은 종전과 같이 각 국가의 항공당국이 수행하게 된다. EU/EASA를 운항하는 TCO가 불편 없이 항공운송사업을 행할 수 있도록 신규제도 도입을 위한 전환기간으로 30개월이 적용 된다. 현재 EASA 회원국을 운항하는 항공사는 TCO 규정 발효 후 6개월 이내인 2014.11.26.까지 EASA에 TCO 허가 신청서를 제출해야 하며, EASA는 TCO 규정 발효 후 30개월 이내에 평가를 완료해야 한다. 유효한 TCO 허가는 운영허가 전에 취득해야 할 사전 요건으로, TCO 허가를 받지 못한 TCO는 EASA 회원국이 발행하는 운영허가를 발급받을 수 없다. TCO 허가 필요 여부는 항공운송사업에 해당하는지에 따라 결정되며 항공운송사업을 행할 경우 TCO 허가를 받아야 한다. 부정기편을 운항하는 항공사의 경우 일정기준을 충족한다면 TCO 허가 없이 운항이 가능하기는 하나 잠재적인 미래 수요가 예상되는 경우 원활한 서비스 제공을 위해 사전에 TCO 허가를 취득하는 것이 바람직하다고 본다. 본 논문에서는 EU의 TCO 규정 도입과 관련하여, EASA의 기능 및 TCO 규정을 포함한 EU의 항공법규체계에 대한 법적 근거와 내용을 고찰하고, 우리나라가 착안하고 개선해야 할 몇 가지 제언과 개선방안을 제시하였다. 본 논문이 1) 항공사가 TCO 허가를 준비하는데 도움이 되고, 2) 정부, 학계 및 항공사 등 유관부문에서 항공안전증진을 위한 국제 동향을 이해하는데 도움이 되고, 3) 국내 항공법규 개선 및 정부조직의 기능을 개선하는데 도움을 주고, 4)아울러, 국제표준 준수 및 항공안전증진에 기여하길 기대한다.

오피니언 마이닝을 이용한 지능형 VOC 분석시스템 (Intelligent VOC Analyzing System Using Opinion Mining)

  • 김유신;정승렬
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.113-125
    • /
    • 2013
  • 기업 경영에 있어서 고객의 소리(VOC)는 고객 만족도 향상 및 기업의사결정에 매우 중요한 정보이다. 이는 비단 기업뿐만 아니라 대고객, 대민원 업무를 처리하는 모든 조직에 있어서도 동일하다. 때문에 최근에는 기업뿐만 아니라 공공, 의료, 금융, 교육기관 등 거의 모든 조직이 VOC를 수집하여 활용하고 있다. 이러한 VOC는 방문, 전화, 우편, 인터넷게시판, SNS 등 다양한 채널을 통해 전달되지만, 막상 이를 제대로 활용하기는 쉽지 않다. 왜냐하면, 고객이 매우 감정적인 상태에서 고객의 주관적 의사를 음성 또는 문자로 표출하기 때문에 그 형식이나 내용이 정형화되어 있지 않고 저장하기도 어려우며 또한 저장하더라도 매우 방대한 분량의 비정형 데이터로 남기 때문이다. 본 연구는 이러한 비정형 VOC 데이터를 자동으로 분류하고 VOC의 유형과 극성을 판별할 수 있는 오피니언 마이닝 기반의 지능형 VOC 분석 시스템을 제안하였다. 또한 VOC 오피니언 분석의 기준이 되는 주제지향 감성사전 개발 프로세스와 각 단계를 구체적으로 제시하였다. 그리고 본 연구에서 제시한 시스템의 효용성을 검증하기 위하여 의료기관 홈페이지에서 수집한 4,300여건의 VOC 데이터를 이용하여 병원에 특화된 감성어휘와 감성극성값을 도출하여 감성사전을 구축하고 이를 통해 구현된 VOC분류 모형의 정확도를 비교하는 실험을 수행하였다. 그 결과 "칭찬, 친절함, 감사, 무사히, 잘해, 감동, 미소" 등의 어휘는 매우 높은 긍정 오피니언 값을 가지며, "퉁명, 뭡니까, 말하더군요, 무시하는" 등의 어휘들은 강한 부정의 극성값을 가지고 있음을 확인하였다. 또한 VOC의 오피니언 분류 임계값이 -0.50일 때 가장 높은 분류 예측정확도 77.8%를 검증함으로써 오피니언 마이닝 기반의 지능형 VOC 분석시스템의 유효성을 확인하였다. 그러므로 지능형 VOC 분석시스템을 통해 VOC의 실시간 자동 분류 및 대응 우선순위를 도출하여 고객 민원에 대해 신속히 대응한다면, VOC 전담 인력을 효율적으로 운용하면서도 고객 불만을 초기에 해소할 수 있는 긍정적 효과를 기대해 볼 수 있을 것이다. 또한 VOC 텍스트를 분석하고 활용할 수 있는 오피니언 마이닝 모형이라는 새로운 시도를 통해 향후 다양한 분석과 실용 프레임워크의 기틀을 제공할 수 있을 것으로 기대된다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

그늘시렁 Wisteria floribunda의 엽면적지수가 온열환경에 미치는 영향 (The Effects of Pergola Wisteria floribunda's LAI on Thermal Environment)

  • 류남형;이춘석
    • 한국조경학회지
    • /
    • 제45권6호
    • /
    • pp.115-125
    • /
    • 2017
  • 본 연구는 등(Wisteria floribunda(Willd.) DC.)으로 피복된 그늘시렁($L\;7,200{\times}W\;4,200{\times}H\;2,700mn$)의 엽면적지수(LAI)의 변동에 따른 온열환경을 규명하고자 한 것이다. 이를 위해 진주시내 광장($N35^{\circ}10^{\prime}59.8^{{\prime}{\prime}}$, $E128^{\circ}05^{\prime}32.0^{{\prime}{\prime}}$, 표고: 38m)의 등으로 피복된 그늘시렁 하부와 햇빛에 노출된 포장지를 대상으로 맑은 날 미기상을 측정하였다. 범용온열기후지수(UTCI)를 산정하기 위해 봄철과 여름철의 미기상환경으로서 지상 60cm 높이에서 기온, 풍속, 상대습도 그리고 6방향의 장파 및 단파복사를 2017년 4월 9일부터 8월 27일까지 측정하였다. 또한, LAI는 LAI-2200C 수관분석기로 측정하였다. 18일간 오전 10시부터 오후 4시까지의 앉은 자세의 인체가 흡수한 매 1분 간격 인체-생기상학적 자료를 분석한 결과는 다음과 같다. 측정기간 동안 햇빛노출지에 비해 그늘시렁 하부의 일평균 기온은 $0.7{\sim}2.3^{\circ}C$ 낮았으며, 일평균 풍속과 일평균 상대습도는 각각 0.17~0.38m/s와 0.4~3.1% 높았다. LAI와 쥴리안 데이 사이의 회귀식은 $y=-0.0004x^2+0.1719x-11.765(R^2=0.9897)$였다. 그늘시렁 하부의 일평균 평균복사온도($T_{mrt}$) 값은 햇빛 노출지에 비해 각각 $11.9{\sim}25.5^{\circ}C$로 낮았으며, 최대 평균복사온도 감소(${\Delta}T_{mrt}$)는 $24.1{\sim}30.2^{\circ}C$였다. LAI의 변동에 따른 햇빛 노출지 대비 일평균 $T_{mrt}$ 감소율(%) 사이의 회귀식은 $y=0.0678{\ln}(x)+0.3036(R^2=0.9454)$였다. 그늘시렁 하부의 일평균 UTCI 값은 햇빛 노출지에 비해 각각 $4.1{\sim}8.3^{\circ}C$로 낮았으며, 최대 범용온열기후지수 감소 값(${\Delta}UTCI$)는 $7.8{\sim}10.2^{\circ}C$였다. LAI의 변동에 따른 햇빛 노출지 대비 일평균 UTCI 감소율(%) 사이의 회귀식은 $y=0.0322{\ln}(x)+0.1538(R^2=0.8946)$였다. 종합적으로 보면 여름철에 덩굴식물로 피복된 그늘시렁에 의한 녹음은 차양에 의한 $T_{mrt}$의 감소를 통해 낮 동안 UTCI를 감소시킴으로써 열스트레스를 매우 강한(UTCI>$38^{\circ}C$) 또는 강한(UTCI >$32^{\circ}C$) 단계에서 강한(UTCI >$32^{\circ}C$) 또는 보통(UTCI >$26^{\circ}C$) 단계로 낮추어 준다. 따라서 여름철 열스트레스를 완화하고 쾌적한 인체 온열쾌적성을 제공하기 위해서는 덩굴식물로 피복된 그늘시렁의 도입은 필수적이다. 하지만 폭염 시에는 덩굴식물로 피복된 그늘시렁 하부의 온열환경도 이용자들에게 매우 강한 열 스트레스(UTCI >$38^{\circ}C$)를 주므로 노약자의 옥외활동은 자제시킬 필요가 있다고 판단된다.

클라우드 컴퓨팅 관련 논문의 서지정보 및 인용정보를 활용한 연구 동향 분석: 사회 네트워크 분석의 활용 (Research Trend Analysis Using Bibliographic Information and Citations of Cloud Computing Articles: Application of Social Network Analysis)

  • 김동성;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.195-211
    • /
    • 2014
  • 클라우드 컴퓨팅 서비스는 IT 자원을 사용자 요구에 따라 서비스 형태로 제공하며, IT 자원을 소유하는 기존의 개념에서 빌려서 사용하는 개념으로 새로운 IT 패러다임 전환을 이끌고 있다. 이러한 클라우드 컴퓨팅은 과거의 네트워크 컴퓨팅, 유틸리티 컴퓨팅, 서버 기반 컴퓨팅, 그리드 컴퓨팅 등에 대한 연구들을 기반으로 진화해온 IT 서비스로서, 추후 여러분야에 접목 가능성이 높음에 따라 다양한 분야에서의 연구가 지속적으로 이루어지고 있다. 본 연구에서는 1994년부터 2012년까지 주요 해외 저널에 게재된 클라우드 컴퓨팅 관련 연구 논문들의 서지정보 및 인용정보를 수집하였으며, 사회 네트워크 분석 척도를 활용하여 연구 논문간의 인용 관계와 동일 논문에 출현하는 키워드간의 관계로부터 연구 주제들 간 네트워크 변화를 분석하였다. 이를 통해서 클라우드 컴퓨팅 관련 분야의 연구 주제들간의 관계를 파악할 수 있었고, 추후 잠재성이 높은 신규 연구 주제들을 도출하였다. 또한 본 연구에서는 클라우드 컴퓨팅에 대한 연구 동향 맵(research trend map)을 작성하여, 클라우드 컴퓨팅과 관련된 연구 주제들의 동태적인 변화를 확인하였다. 이러한 연구 동향 맵을 통해서 클라우드 컴퓨팅 주요 연구들의 추이를 쉽게 파악 할 수 있으며, 진화 형태 또는 유망 분야를 설명할 수 있다. 논문 인용 관계 분석 결과, 클라우드 컴퓨팅 보안과 분산 처리, 클라우드 컴퓨팅에서의 광네트워크에 관한 연구 논문들이 페이지랭크 척도를 기준으로 상위에 나타났다. 연구 논문의 핵심 주제를 나타내는 키워드에 대한 결과는 2009년에는 클라우드 컴퓨팅과 그리드 컴퓨팅이 높은 중심성 수치를 보였으며, 2010~2011년에는 데이터 아웃소싱, 에러검출 방법, 인프라구축 등 주요 클라우드 요소 기술에 관한 키워드가 높은 중심성 수치를 나타내었다. 2012년에는 보안, 가상화, 자원 관리 등이 높은 중심성 수치를 보였으며, 이를 통해서 클라우드 컴퓨팅 기술들에 대한 관심이 점차 증가함을 확인 할 수 있다. 연구 동향 맵 작성 결과, 보안은 유망영역에 위치하고 있으며, 가상화는 유망영역에서 성장 영역으로 이동하였고, 그리드 컴퓨팅과 분산 시스템은 쇠퇴 영역으로 이동하고 있음을 확인 할 수 있다.

오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 (Product Community Analysis Using Opinion Mining and Network Analysis: Movie Performance Prediction Case)

  • 진위;김정수;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.49-65
    • /
    • 2014
  • 구전(WOM: Word of Mouth)는 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상을 말하며 소셜 미디어의 발전으로 온라인 구전(eWOM: Electronic Word of Mouth) 형태로 발전하였다. 구전 효과의 중요성으로 인해서 대부분의 기업들의 자사의 상품이나 서비스에 대한 온라인 구전에 촉각을 세우고 있으며, 특히 영화와 같은 경험재의 경우에는 그 영향력이 더욱 크다. 본 연구에서는 영화 커뮤니티에 대한 사회 네트워크 분석을 통해서 영화 흥행성과 지표인 매출에 미치는 영향요인을 규명하고자 한다. 영화 흥행성과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기(volume)와 방향성(valence)과 같은 구전 요인들을 추가하여, 구전 네트워크의 중심성 척도를 영향 요인에 고려하였다. 구전의 크기, 방향성, 그리고 3가지 중심성 척도(연결 중심성, 매개 중심성, 근접 중심성)의 최종 영화 매출에 영향 관계를 가설로 설정하였다. 제시한 연구 모형을 검증하기 위하여 대표적인 온라인 영화 커뮤니티 사이트인 IMDb(Internet Movie Database)에서 영화 구전 데이터를 수집하였고, Box-Office-Mojo사이트에서 영화 매출 데이터를 수집하였다. 2012년 9월부터 1년 동안, 주간 Top-10에 포함된 적이 있는 영화들을 대상으로 하였으며, 총 103개의 영화가 선정되어 이 영화들에 대한 메타 데이터와 커뮤니티 데이터가 수집되었다. 영화 커뮤니티 네트워크는 평가자들간의 댓글 관계를 기초로 구축하였다. 본 연구에서 사용한 3가지 중심성 척도는 사회 네트워크 분석 도구인 NodeXL을 사용하여 계산되었으며, 각 영화별 커뮤니티 참여자들의 중심성 척도의 평균값을 활용하였다. 가설 검증의 사전 분석을 위한 상관관계 분석에서는 3가지 중심성 척도간에 상관 관계가 높은 것으로 파악되어서, 각각에 대하여 별도로 회귀분석을 수행하였다. 분석 결과, 기존 연구와 일관성 있게 구전의 크기와 방향성은 영화 성과지표인 최종 매출에 긍정적인 영향을 미치는 것으로 파악되었다. 또한 구전 네트워크 내의 참여자 매개중심성 평균은 영화의 최종 매출에 영향을 미치는 것으로 파악되었다. 하지만 연결중심성과 근접중심성은 최종 매출에 영향을 주지 못하는 것으로 나타났다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

전국 종합병원 방사선사의 개인피폭선량에 대한 고찰 (A Review of Personal Radiation Dose per Radiological Technologists Working at General Hospitals)

  • 정홍량;임청환;이만구
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제28권2호
    • /
    • pp.137-144
    • /
    • 2005
  • 본 연구는 1998년부터 2002년도까지 전국 16개시 도 44개 종합병원에서 근무하고 있는 최근 5년간 방사선사의 개인평균피폭선량을 측정하여 지역별, 연도별, 병원별로 비교 분석 하였고, 방사선 장비 및 시설의 차이에서 발생될 수 있는 근무환경과 촬영건수의 표준화를 통하여 향후 체계적이고 합리적인 방사선사의 피폭선량 관리가 이루어질 수 있는 기초 자료를 제공하는 목적으로 분석하였다. 5년간 방사선사의 지역별 전체평균피폭선량은 1.61 mSv이었고, 지역별로 보면 대구가 4.74 mSv로 가장 높으며 강원이 4.65 mSv, 경기가 2.15 mSv로 높은 순으로 나타났으며, 가장 낮은 지역은 충북이 0.91 mSv이고 다음이 제주 0.94 mSv, 부산이 0.97 mSv 순으로 나타났다. 5년간 연도별 평균선량은 2000년도가 1.80 mSv로 가장 높게 나타났으며, 2002년이 1.77 mSv, 1999년 1.55 mSv, 2001년 1.50 mSv, 1998년이 1.36 mSv 순으로 나타났으며, 연도별, 지역별 평균피폭선량은 2001년도는 대구지역이 1998년, 1999년, 2000년, 2002년은 강원지역이 가장 높게 나타났고, 평균피폭선량이 1.0 mSv 이하로 나타난 지역은 1998년에는 제주, 충북, 울산, 1999년 울산, 경북, 제주, 2000년 충북, 2001년 경북, 전북, 2000년에는 인천, 전북, 제주로 나타났다. 병원별 피폭선량은 대구의 KMH가 가장 높게 나타났고, 다음으로 강원의 GAH, 서울의 CAH 순으로 높게 나타났으며, 피폭선량이 낮은 병원은 전남의 YSH가 가장 낮고, 경남의 GNH, 충남의 DKH 순으로 나타났다.

  • PDF