• 제목/요약/키워드: 시간 가중치

검색결과 791건 처리시간 0.021초

최적화된 확률 모델을 이용한 다양한 품질의 지문분류 (Various Quality Fingerprint Classification Using the Optimal Stochastic Models)

  • 정혜욱;이지형
    • 한국시뮬레이션학회논문지
    • /
    • 제19권1호
    • /
    • pp.143-151
    • /
    • 2010
  • 지문분류는 1:N 지문인식 시스템의 효율성을 높이는 단계로 지문의 매칭 시간 단축과 인식의 정확성을 높여주는 역할을 한다. 지문 각 클래스의 융선 패턴은 한 개 이상의 클래스와 중복되는 성질을 가지기 때문에 지문분류 작업은 어렵다. 또한 잡음을 많이 포함하거나 예외적인 입력 상태인 경우에도 분류 작업은 어려워진다. 본 논문에서는 다양한 품질의 지문을 효과적으로 분류하기 위해 지문의 방향특징을 이용해 확률 모델을 설계하고, 이를 최적화 하여 지문분류를 수행하는 방법을 제안하였다. 지문 융선을 픽셀단위로 탐색하여 방향 값을 산출하고, 산출된 방향 값을 일정 픽셀 단위로 병합하여 지문의 방향특징을 추출한다. 추출된 방향 특징을 이용해 확률론적 정보추출 및 인식 방식인 마코프 모델을 이용하여 지문의 클래스별 마코프 모델을 생성한다. 생성된 클래스별 마코프 모델의 상태전이 행렬을 분석하여 클래스별 분류 모델의 가중치 항목을 결정하고 유전자 알고리즘을 이용하여 지문분류 성능을 향상시킬 수 있는 최적의 수치를 찾아낸다. 유전알고리즘에 의해 최적화된 분류모델에 다양한 품질의 지문 데이터베이스를 적용하여 실험해 본 결과 최적화 되기 전의 분류 모델에 비해 우수한 분류성능을 보였다. 또한 실험에 사용한 다양한 품질의 데이터베이스를 분석해본 결과 제안한 방법은 특이점 유, 무 및 상태에 독립적으로 예외적인 입력상황의 지문에 대해 효율적으로 지분분류를 수행했다.

셀룰러 오토마타 기반 WCA2D 모형을 이용한 부산 온천천 유역 고해상도 도시 침수 해석 (High-resolution Urban Flood Modeling using Cellular Automata-based WCA2D in the Oncheon-cheon Catchment in Busan, South Korea)

  • 최현진;이송희;우현아;노성진
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.587-599
    • /
    • 2023
  • 기후변화로 인해 전 세계 주요 도시에서 홍수의 빈도와 위험성이 증가함에 따라, 도시 침수에 대비한 선제적 대응을 위해 넓은 공간 영역에서 고해상도 2차원 침수 정보를 신속하고 정확하게 해석할 수 있는 모의 기술의 중요성이 대두되고 있다. 기존의 천수 방정식(shallow water equations)에 기반한 물리적 해석 방법은 고해상도 침수 예측을 위해 많은 컴퓨터 자원과 계산 시간이 소요되는 한계가 있다. 본 연구는 전환 규칙과 가중치 기반 시스템을 사용하여 침수의 시공간 변화를 모의하는 셀룰러 오토마타(cellular automata) 기반 2차원 침수 해석 모형 Weighted Cellular Automata 2D (WCA2D)의 이론적 배경을 고찰하고, 부산 온천천 유역의 침수 사상 모의를 통해 재현하여 국내 도시 유역에 대한 적용성을 검토하였다. 또한, Open Computing Language (OpenCL)와 Open Multi-Processing (OpenMP)과 같은 병렬계산(parallel computing)기술을 적용한 버전을 순차계산(sequential computing)결과와 비교하여 연산성능을 평가 하였다. 연구결과, WCA2D 모형에 의한 최대 침수심 분포는 과거침수 피해지도와 유사하게 모의되어, 복잡한 지형특성을 가지는 도시유역 침수의 시공간적 변화를 해석하기에 적절함을 확인하였다. 또한,병렬 계산 적용시 순차 계산 버전에 비해 OpenCL과 OpenMP는 약8배~14배, 5배~6배 연산 효율이 향상되어 효율적인 도시 침수 모의가 가능하였다.

무인 점포 사용자 이상행동을 탐지하기 위한 지능형 모션 패턴 인식 알고리즘 (Intelligent Motion Pattern Recognition Algorithm for Abnormal Behavior Detections in Unmanned Stores)

  • 최영준;나지영;안준호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.73-80
    • /
    • 2023
  • 최근 최저시급의 가파른 인상으로 인건비에 대한 부담이 늘어남과 함께 코로나19의 여파로 무인 상점의 점유율이 높아지고 있는 추세이다. 그로 인해 무인 점포를 타겟으로 하는 도난 범죄들도 같이 늘어나고 있어 이러한 도난 사고를 방지하기 위해 Just-Walk-Out 시스템을 도입하고 고비용의 LiDAR 센서, 가중치 센서 등을 사용하거나 수동으로 지속적인 CCTV 감시를 통해서 확인하고 있다. 하지만 이런 고가의 센서를 많이 사용할수록 점포 운영에 있어 비용 부담이 늘어나게 되고, CCTV 확인은 관리자가 24시간 내내 감시하기 어려워서 사용이 제한적이다. 본 연구에서는 이런 센서들이나 사람에 의지하는 부분을 해결할 수 있고 무인점포에서 사용할 수 있는 저비용으로 도난 등의 이상행동을 하는 고객을 탐지하여 클라우드 기반의 알림을 제공하는 인공지능 영상 처리 융합 알고리즘을 제안하고자 한다. 또한 본 연구에서는 mediapipe를 이용한 모션캡쳐, YOLO를 이용한 객체탐지 그리고 융합 알고리즘을 통해 무인 점포에서 수집한 행동 패턴 데이터를 바탕으로 각 알고리즘들에 대한 정확도를 확인하며 다양한 상황 실험을 통해 융합 알고리즘의 성능을 증명했다.

다각형 용기의 품질 향상을 위한 딥러닝 구조 개발 (Development of Deep Learning Structure to Improve Quality of Polygonal Containers)

  • 윤석문;이승호
    • 전기전자학회논문지
    • /
    • 제25권3호
    • /
    • pp.493-500
    • /
    • 2021
  • 본 논문에서는 다각형 용기의 품질 향상을 위한 딥러닝 구조 개발을 제안한다. 딥러닝 구조는 convolution 층, bottleneck 층, fully connect 층, softmax 층 등으로 구성된다. Convolution 층은 입력 이미지 또는 이전 층의 특징 이미지를 여러 특징 필터와 convolution 3x3 연산하여 특징 이미지를 얻어 내는 층이다. Bottleneck 층은 convolution 층을 통해 추출된 특징 이미지상의 특징들 중에서 최적의 특징들만 선별하여 convolution 1x1 ReLU로 채널을 감소시키고convolution 3x3 ReLU를 실시한다. Bottleneck 층을 거친 후에 수행되는 global average pooling 연산과정은 convolution 층을 통해 추출된 특징 이미지의 특징들 중에서 최적의 특징들만 선별하여 특징 이미지의 크기를 감소시킨다. Fully connect 층은 6개의 fully connect layer를 거쳐 출력 데이터가 산출된다. Softmax 층은 입력층 노드의 값과 연산을 진행하려는 목표 노드 사이의 가중치와 곱을 하여 합하고 활성화 함수를 통해 0~1 사이의 값으로 변환한다. 학습이 완료된 후에 인식 과정에서는 학습 과정과 마찬가지로 카메라를 이용한 이미지 획득, 측정 위치 검출, 딥러닝을 활용한 비원형 유리병 분류 등을 수행하여 비원형 유리병을 분류한다. 제안된 다각형 용기의 품질 향상을 위한 딥러닝 구조의 성능을 평가하기 위하여 공인시험기관에서 실험한 결과, 양품/불량 판별 정확도 99%로 세계최고 수준과 동일한 수준으로 산출되었다. 검사 소요 시간은 평균 1.7초로 비원형 머신비전 시스템을 사용하는 생산 공정의 가동 시간 기준 내로 산출되었다. 따라서 본 본문에서 제안한 다각형 용기의 품질 향상을 위한 딥러닝 구조의 성능의 그 효용성이 입증되었다.

농어업유산의 경관 평가 지표 연구 (A Study on Landscape Evaluation Indicators for Agricultural and Fishery Heritage)

  • 최우영;김동찬
    • 한국조경학회지
    • /
    • 제43권5호
    • /
    • pp.74-86
    • /
    • 2015
  • 본 연구의 목적은 국가중요농어업유산의 등재 준비 단계부터 사후 관리까지 적용이 가능한 경관 평가 지표를 도출하는 것이다. 이를 위하여 전문가들을 대상으로 델파이 조사를 실시하였으며, 2014년 8월부터 11월까지 1차 개방형, 2차 개방형, 3차 폐쇄형으로 진행하였고, 1차 28명, 2차 25명, 3차 29명의 전문가 의견을 연구에 활용하였다. 그 결과, 농어업유산의 경관 평가 지표는 평가영역 5개, 평가항목 10개, 평가지표 40개로 구성되었다. 평가영역은 향토성, 진정성, 심미성, 관광잠재력, 지역성이었고, 향토성은 농어촌성과 향수성, 진정성은 객관적 진정성과 실존적 진정성, 심미성은 매력성과 조화성, 관광잠재력은 자원가치성과 활용가치성, 지역성은 물리적 고유성과 문화적 정체성으로 분류되었다. 본 연구를 통하여 도출된 시사점은 첫째, 농어업유산의 경관의 질을 평가할 때에는 유산으로서의 가치를 고려해야 한다는 점에서 일반 농어업 경관 평가 준거를 그대로 준용할 수 없음이 규명되었다. 둘째 기존의 농어업 경관에서 주목하고 있는 물리적 요인뿐 아니라, 정서적 요인을 중시하고 있었고, 주민이 농어업활동이나 축제 체험 등 행사에 참여하는 일상적이거나 일시적인 액티비티를 경관 평가 항목으로 포함하고 있다는 점에서 기존의 경관 평가 지표에서보다 확장된 경관 개념을 포함하였다. 셋째, 농어업유산은 그 순간 경작지에서 보이는 공시적 관점뿐 아니라, 눈에 보이지 않는 시간까지 포함한 통시적 관점을 포함한다는 관점에서 주민들의 삶에 주목하게 되고, 따라서 경작지와 자연환경은 물론이고, 마을경관 특히 주거지와의 관계성에 의미를 두고 있음을 알 수 있었다. 끝으로 농어업유산의 핵심 요소인 유산적 가치 측면과 관광적 활용 측면이 모두 반영되었고, 생산경관과 관련된 특산물 판매장의 사고파는 활동을 포함한 일시적이고 동태적인 경관들이 지표로서 도출되었다는 점에서 차별화되었다. 그러나 본 연구는 각 항목 간의 가중치가 도출되지 않아, 상대적 중요도를 알 수 없고, 경관의 총점을 비교할 수 없다는 한계점이 있으므로 이에 대한 연구가 후행되어야 할 것이다.

영남권역에서 가정용 인공호흡기를 사용하는 환자 가족간병인의 간병 부담과 삶의 질 (Survey on the Care Burden and Quality of Life in Family Caregivers of Patients Using Home Mechanical Ventilator in Yeongnam Region, Korea)

  • 손주현;문명훈;조미경;윤라유;허성철;민지홍;문정인;김수연
    • 대한지역사회작업치료학회지
    • /
    • 제10권1호
    • /
    • pp.39-49
    • /
    • 2020
  • 목적 : 본 연구는 영남권역 내 가정에서 인공호흡기 사용 환자를 돌보는 가족간병인이 느끼는 간병 부담과 삶의 질을 알아보고자 하였다. 연구방법 : 영남권역 내에 거주하며 가정에서 인공호흡기를 사용하는 환자를 돌보는 주간병인을 대상으로 설문조사를 시행하였고 가족간병인의 응답 내용을 분석하였다. 설문지는 환자의 정보, 간병 실태 및 추가 지원 요구 사항 등으로 구성하였다. 가족간병인의 간병 부담과 삶의 질을 평가하기 위해 각각 Korean version of Short Form Zarit Burden Interview(K-ZBI-12)과 한국형 가중치 모형에 따라 교정한 3-Level version of EuroQol-5 Dimension(KEQ-5D-3L)을 사용하였다. 통계적 유의수준은 p<0.05로 하였다. 결과 : 총 150명 중 주간병인이 가족간병인인 98명을 분석하였다. 환자의 연령은 54.10±17.94세, 성별은 남자 74명(75.5%), 여자 24명(24.5%)이었고 주 진단은 신경근육계 질환이 83명(84.7%)으로 가장 많았다. 가족간병인의 K-ZBI-12 점수는 33.08±10.34로 간병에 대한 고부담을 보였고 EQ-5D-3L 점수는 0.71±0.25로 두 항목은 음의 상관관계를 보였다(p=.038). 환자의 연령, 인공호흡기 사용기간, 의료비에 대한 가족간병인의 경제적 부담, 간병비에 대한 가족간병인의 경제적 부담 및 전문간병인의 참여 시간은 K-ZBI-12 점수와 각각 통계적으로 유의한 상관관계를 보였다. KEQ-5D-3L 점수는 가정용 인공호흡기의 사용기간과 음의 상관관계를 나타냈다(p=.017). 환자가 침습적 인공호흡기를 사용하는 경우 비침습적 인공호흡기를 사용하는 경우보다 가족간병인의 KEQ-5D-3L 점수가 낮았다(p=.008). 간병에 참여하는 인원이 두 명 이상인 경우가 한 명인 경우보다 K-ZBI-12 점수가 낮았다(p=.001). 가족간병인이 추가지원을 바라는 요구사항 중 경제적 지원에 대한 요구도가 가장 높게 조사되었다. 결론 : 영남권역에서 가정용 인공호흡기를 사용하는 환자들의 보호자가 느끼는 간병 부담이 크고 삶의 질이 낮다는 것을 알 수 있다. 가족간병인의 간병 부담과 삶의 질을 개선하기 위해서 지역에서 실질적으로 필요한 사회경제적 지원 및 환자와 가족들의 요구 사항을 확인하고 추가적인 지원을 위한 노력이 필요하다.

도시자연공원구역 지정 및 관리상의 문제점 분석 (A Study on the Problem Analysis of Designation and Management of the Zone of Urban Nature Park)

  • 이정석;조세환
    • 한국조경학회지
    • /
    • 제39권3호
    • /
    • pp.98-106
    • /
    • 2011
  • 본 연구는 도시자연공원구역 제도가 도입되고 약 6년 정도가 흐른 현 시점에서 지역 지정 및 관리상 발생되고 있는 문제점을 분석 고찰함으로써 향후 도시자연공원구역의 지정 및 관리 측면의 제도개선에 기여 할 수 있는 기초자료를 제공하기 위한 목적으로 수행하였다. 본 연구는 연구대상 도시의 민원 내용 분석 및 전문가 인터뷰를 통해 도시자연공원구역이 지닌 지정 및 관리상의 문제점을 도출하였으며, 이것을 근거로 도시자연공원 관련 전문가 집단을 대상으로 델파이조사를 실시하여 도출된 문제점의 타당성 검증을 검증하였다. 본 연구에서 제시된 연구결과를 요약하면 다음과 같다. 1. 도시자연공원구역의 지정 및 관리와 관련하여 지정기준, 지정과정, 유지 관리, 법 지침 측면에서 20개 항목의 문제점이 도출되었으며, 델파이 분석을 시행한 결과 5개 항목이 제외되고, 2개 항목이 추가되어 모두 17개 항목의 문제점이 있는 것으로 도출되었다. 2. 지정기준 측면 문제점은 공원구역지정기준 우선순위(가중치)의 결여, 정량적 평가가 어려운 항목으로 객관성 결여, 국토환경성평가항목 부적합성, 토지적성평가항목 부적합성, 현장조사에 대한 구체적 기준 미 제시, 공원구역 지정면적 기준 제시 미비 등 6개 항목으로 나타났다. 3. 지정과정 측면 문제점은 공원구역 신규지정 시 민원발생, 공원구역지침 시행 전 수립된 도시자연공원구역 타당성평가 필요, 공원구역관리계획 결정 시 경계설정의 종합적 검토 부족, 정밀한 현장조사 수행을 위한 시간적 재정적 여건의 열악함 등 4개 항목으로 나타났다. 4. 관리기준 측면 문제점은 공간별 관리체계 부재, 공원녹지기본계획 중 도시자연공원구역관리계획의 실효성 부족, 용도구역과 도시공원의 이중적 성격으로 인한 관리주체의 이원화 발생, 공원구역을 유지 관리하기 위한 전문인력의 부족 등 4개 항목으로 나타났다. 5. 법 지침 측면 문제점은 별도의 도시자연공원구역관리계획 부재, 공원구역 내 행위허가 된 시설의 부지면적 기준부적합, 도시자연공원구역 타당성 검토 부재 등 3 개 항목으로 나타났다.

초등학생의 미량영양소 섭취부족 위험 진단을 위한 간이 식습관평가표 개발 (Development of an Eating Habit Checklist for Screening Elementary School Children at Risk of Inadequate Micronutrient Intake)

  • 연미영;현태선
    • Journal of Nutrition and Health
    • /
    • 제42권1호
    • /
    • pp.38-47
    • /
    • 2009
  • 초등학교 $4{\sim}6$학년 어린이 142명 (남 80명, 여 62명)을 대상으로 식습관과 식이섭취조사를 실시하여 미량영양소 섭취부족의 위험이 있는 어린이를 선별할 수 있는 간단한 식습관평가표를 개발한 결과는 다음과 같다. 미량영양소 섭취부족 위험지표는 비타민 A, 리보플라빈, 비타민 C, 칼슘, 철분, 아연의 여섯가지 영양소에 대하여 권장섭취량에 대한 섭취 백분율과 평균 적정섭취비율 (MAR), 이들 여섯가지 영양소 중 평균필요량 미만으로 섭취한 영양소의 개수를 임의로 선정하였다. 식습관의 각 문항에 대한 점수를 구하기 위하여 응답 보기에서 가장 좋은 식습관에 대하여 0점, 가장 좋지 않은 식습관에 대하여 2점을 부여하고, 이 두가지 식습관 사이에 중간 정도의 보기가 있는 경우 1점을 부여하였다. 부여된 점수로 계산한 각 문항의 식습관 점수와 미량영양소 섭취부족 위험지표와의 Pearson 상관계수를 계산한 결과 유의적인 상관관계를 나타낸 식습관 문항은 세끼 식사 여부, 아침식사 시간의 여유, 저녁식사의 규칙성, 식욕, 그리고 김치, 우유, 과일, 콩의 섭취 빈도에 관한 8개 문항으로 나타나 이들을 평가표에 포함 시킬 문항으로 선정하였다. 또한 이 8개 문항에 가중치를 부여하기 위해 MAR과 단계적 회귀분석을 실시하였고 그 결과 유의수준이 0.05 미만인 4개 문항의 배점을 1점으로 낮추었다. 식습관평가표의 영양부족위험 진단기준을 설정하기 위해 MAR < 0.75를 미량영양소 섭취부족군, MAR ${\geq}$ 0.75를 적정군으로 하여 총점 분포를 살펴본 후 각 총점의 민감도, 특이도, 양성예측도를 평가하였고 이 결과에 따라 식습관평가표의 총점이 3점 이하 일 때 저위험군, $4{\sim}5$점일때 중간위험군, 6점 이상일 때 고위험군으로 결정하였다. 식습관평가표의 진단기준에 따라 본 조사대상자를 세 집단으로 분류하고 영양소섭취를 비교한 결과 에너지와 단백질은 세 집단간 대상자 분포의 유의적 차이가 없었으나, 11개의 미량영양소 중에서는 비타민 A, 티아민, 리보플라빈, 니아신, 엽산, 칼슘, 인, 철, 아연 등 9개 영양소에서 평균 필요량 미만으로 섭취한 대상자의 비율이 고위험군이 가장 높았으며, 중간위험군, 저위험군의 순으로 유의적인 차이를 나타냈다. 그러나 비타민 C의 경우 중간위험군과 고위험군 간에는 차이가 없었으며, 저위험군은 유의적으로 낮았고, 비타민 $B_6$의 경우 세 군 간에 유의적인 차이가 없었다. 본 연구에서 개발된 8문항의 식습관평가표는 복잡한 식이섭취조사를 실시하지 않고도 초등학생의 미량영양소 섭취부족 위험을 간편하게 선별할 수 있을 것으로 생각되며, 초등학생이 쉽고 간편하게 사용할 수 있으므로 이들을 대상으로 영양판정이나 영양교육을 실시할 때 활용할 수 있을 것이다. 또한 다양한 지역의 학생을 대상으로 활용하여 타당성 검토를 거치면 영양사업과 영양교육의 도구로서 유용하게 활용될 수 있을 것으로 보인다.

델파이 조사를 통한 저염화사업 성과평가 지표 분석 (Analysis by Delphi Survey of a Performance Evaluation Index for a Salt Reduction Project)

  • 김현희;신은경;이혜진;이난희;천병렬;안문영;이연경
    • Journal of Nutrition and Health
    • /
    • 제42권5호
    • /
    • pp.486-495
    • /
    • 2009
  • 본 연구에서는 저염화 사업의 성과 평가 지표의 현황을 분석하고, 델파이 조사를 통하여 저염화 사업 성과 평가지표의 적절성 및 측정방법의 타당도와 수행용이성을 검증하였으며, 그 결과를 요약하면 다음과 같다. 1) 보건소에서 사용하고 있는 저염화 사업 성과 평가지표로는'소금 섭취량', '적정 소금 섭취 인구비율', '싱겁게 먹는 인구 비율', '나트륨 감소법 인지율', '가공식품 구입시 영양표시 정보 확인율', '국의 염도 감소율', '저염 실천하는 모범음식점 증가율', '참가자 만족도', '소금 판매량', '뇌졸중 사망률' 등으로 다양하게 사용하고 있었다. 2) 델파이 조사 결과, 저염화사업 성과 평가지표로서 영양학적 평가지표로는 1일 소금 섭취량이 가장 적절한 것으로 나타났으며, 적정 소금 섭취 인구비율과 싱겁게 먹는 인구 비율 등도 적절한 것으로 나타났다. 보건학적 지표로는 뇌졸중 사망률과 위암사망률이 적절한 것으로 조사되었다. 3) 영양학적 성과 지표 측정방법 중 24시간 소변 수집법이 타당성은 가장 높았으나, 수행용이성은 가장 낮은 것으로 나타났고, 짜게 먹는 식태도 조사 방법이 수행용이성이 가장 높았으며, 짜게 먹는 식행동 조사와 미각판정 방법이 수행용이성이 그 다음으로 높은 것으로 나타났다. 4) 영양학적 성과지표 측정방법의 타당성과 수행용이성을 동시에 고려하기 위하여 이들의 평균 점수에 가중치를 부여하여 순위를 비교하였을 경우 식행동 조사와 식태도 조사가 1, 2순위로 가장 높았고 음식섭취빈도 조사, 미각판정법이 그 다음 순위인 것으로 나타났다. 5) 미각판정법의 신뢰도를 조사한 결과 5개의 시료 농도별 짠맛에 대한 미각판정 결과 남자의 경우 검사자간 판정 결과의 상관계수가 0.774 (p < 0.01)였으며, 여자의 경우도 0.781 (p < 0.01)로 모두 높은 상관성을 보여주었다. 검사자내 신뢰도 조사에서는 짠맛에 대한 미각판정 결과 남자의 경우 첫 번째, 두 번째 판정결과에 대한 상관계수가 0.591 (p < 0.01), 여자의 경우 0.399 (p < 0.01)로 모두 통계학적 유의성을 보여주어 신뢰도가 높은 것으로 나타났다. 본 연구에서 델파이 조사를 1회 실시한 것이 한계점이라할 수 있으나, 이제 막 저염화 사업이 활성화되고 있는 현 시점에서 저염화 사업의 성과 평가지표개발에 대한 중요성을 인식시켰다는데 그 의미를 둘 수 있을 것이다. 또한 본 연구에서 제시된 싱겁게 먹는 인구비율은 적정 소금 섭취 인구비율과 함께 보건소 단위에서 저염화 사업을 할 때 특히 교육 효과를 평가할 수 있는 유용한 지표가 될 수 있을것으로 사료되며, 향후 저염화 사업에서 이 지표의 적합성 여부를 살펴보기 위한 실질적인 적용 연구가 필요할 것이다. 또한 본 연구에서는 제시하지 못하였으나, 미각판정 도구의 농도에 대한 선호도와 강도를 점수화하여 판정과정과 결과 판정을 컴퓨터 프로그램으로 개발함으로써 미각판정법의 표준화를 확보하는 추구 연구가 필요할 것이다.

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF