• 제목/요약/키워드: 데이터 확장 기법

검색결과 835건 처리시간 0.022초

The Improvement of Convergence Characteristic using the New RLS Algorithm in Recycling Buffer Structures

  • Kim, Gwang-Jun;Kim, Chun-Suck
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.691-698
    • /
    • 2003
  • 적응 횡단선 필터에서 수렴 속도의 개선을 위해 기존의 최소 평균 자승 알고리즘을 확장한 반복적 최소 자승 알고리즘의 탭 가중치 갱신 메커니즘에 재순환 데이터 버퍼를 이용함으로서 수렴특성을 개선시키는 효율적인 기법을 제시하였다. 본 논문은 기존의 적응 횡단선 필터에 데이터 재순환 버퍼 구조를 제안하여 새로운 RLS 탭 가중치 갱신 알고리즘을 유도하여 조화 평균 학습 곡선의 평균 자승 에러 값에 대한 반복수에 대해서 데이터 재순환 버퍼를 사용한 학습 곡선의 수렴 속도가 버퍼가 없는 경우의 재순환 버퍼 RLS 알고리즘의 수렴 속도보다 비례하여 빠르게 수렴한다는 것을 수학적인 연산을 통해 증명하였다. 채널 진폭의 왜곡의 정도와 재순환 데이터 버퍼 수에 따른 평균 자승 에러에 대한 삼차원 시뮬레이션 결과로부터 고유치 확산이 증가함에 따라 특정 값에 수렴하기 위한 요구된 샘플의 반복수가 비례하여 증가하였으며, 재순환 데이터 버퍼 수 B가 증가함에 따라 요구된 샘플의 반복수가 B배만큼 감소함으로서 제안된 구조에서 RLS 가중치 갱신 알고리즘의 수렴특성이 개선됨을 입증하였다.

웨이블렛 변환 계수의 제로트리를 이용한 영상압축 (Image Compression with using Wavelet Conversion Coefficients of Zerotree)

  • 서한석;박세원;임화영
    • 한국ITS학회 논문지
    • /
    • 제11권3호
    • /
    • pp.55-62
    • /
    • 2012
  • 임베디드 제로트리 웨이블렛(EZW : Embedded Zerotree Wavelet) 알고리즘은 원본 영상을 웨이블렛 변환하고 그 변환된 데이터를 이용하여 영상을 압축하는 기법으로써, 간단한 구조형태를 이루며 그 효율이 또한 매우 우수한 알고리즘이다. 본 논문은 이를 개선하여 압축 효율을 향상 시킨 것이다. 기본적으로 임베디드 제로트리 웨이블렛 알고리즘은 웨이블렛 변환된 데이터의 중요도를 판단하고, 그 중요도와 위치정보를 4가지로 분류하여 저장하게 된다. 이 부호는 P, N, Z, T로 나타내며 이중 P,N은 데이터의 크기와 관련한 중요도를 의미하고, 그 위치 정보를 Z, T 부호로 나타낸다. 각각의 부호들은 주부호화 과정을 통해 저장되게 되는데 이때 Z, T의 정보가 중복저장 되어 데이터양이 증가하게 된다. 본 논문에서는 중복 저장되는 데이터 량을 줄이기 위해 기존의 부호에 중복 기능을 나타내는 4가지 부호를 추가한 수정된 임베디드 제로트리 알고리즘을 제안하고, 이를 확장 임베디드 제로트리 웨이블렛(EEZW, Extended Embedded Wavelet) 알고리즘으로 명명하였다. 제안된 알고리즘은 다양한 영상을 대상으로 영상 품질을 정량적으로 표현한 PSNR(Peak Signal To Noise Rate) 수치를 비교하여 우수한 결과를 확인하였다.

컴포넌트 기반의 질병 및 단백질 분석 시스템의 설계 및 구현 (Design and Implementation of an Analysis System for Diseases and Protein Based on Components)

  • 박준호;여명호;이지희;;강광구;권현호;이진주;이효준;임종태;장용진;;김미경;류제운;강태호;김학용;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제10권12호
    • /
    • pp.59-69
    • /
    • 2010
  • 최근 질병 분석 및 신약을 개발하기 위한 단백질에 대한 연구는 생명 공학의 큰 테마 중 하나이다. 질병 및 단백질 데이터를 분석하기 위한 연구는 대용량의 데이터 처리를 요구하기 때문에 과거 실험을 통해 접근하던 방식에서 벗어나 최근 IT 기술의 결합을 통해 다양한 실험 데이터를 공유하고, 연계함으로써 질병 및 단백질 분석에 대한 연구를 가속화하고 있다. 하지만 생명 공학 연구자에게 있어서 IT 지식을 기반으로 하는 단백질 분석 도구를 다루는데 많은 어려움이 있다. 이러한 문제를 해결하고자, IT 연구자와 생명 공학 연구자의 협업을 통한 데이터 분석 도구들이 개발되었다. 그러나 기존 데이터 분석 도구들은 확장성 및 여전히 생명과학자들이 사용하기에 어려운 문제가 있다. 본 논문에서는 기존 기법들의 문제점을 해결하는 컴포넌트 기반 질병 및 단백질 분석 시스템을 설계하고 구현한다.

실제 클러터 배경에서 SAR 영상 임펄스 응답 특성 분석 (SAR Image Impulse Response Analysis in Real Clutter Background)

  • 정철호;정재훈;오태봉;곽영길
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.99-106
    • /
    • 2008
  • 영상 레이다(SAR)는 주야간, 일조량에 관계없이 전천후로 영상획득이 가능하여 군사용으로는 물론 과학 민수용으로 광범위하게 활용된다. SAR 시스템에서는 고도, 운용 주파수, PRF 등의 다양한 시스템설계 파라미터로부터 생성된 임펄스 응답 함수(impulse response function)를 분석하여 공간해상도, PSLR, ISLR 등 영상품질 성능 파라미터의 추정이 가능하다. 그러나 모델링된 임펄스 응답 특성은 주변 클러터 환경이 고러되지 않은 이상적인 경우이므로 실제 주변 클러터 환경을 고려한 SAR 영상품질 분석 기법이 필요하다. 본 논문에서는 먼저 주요 SAR시스템 파라미터를 기반으로 SAR 점표적 원시 데이터를 생성하고, 거리-도플러 알고리듬(range-Doppler algorithm)을 이용하여 임펄스 응답 데이터를 형성한다. 그리고 실제 SAR영상의 일부분을 추출하여 주변 배경 클러터 환경 데이터를 형성한 후, 임펄스 응답 데이터를 삽입한다. 형성된 응답 데이터는 영상품질의 정확도를 향상시키고자 확장보간법을 도입하여 분석하고, 이에 대한 효과를 주요 도플러 파라미터인 방위 FM율 오차에 따른 성능분석을 수행함으로써 확인한다.

일상적 사용 환경에서의 잠재니즈, 은폐니즈의 추상구조 발견 - 스마트폰 사용자의 행동데이터 수집 및 해석 (Discovering abstract structure of unmet needs and hidden needs in familiar use environment - Analysis of Smartphone users' behavior data)

  • 신성원;유승헌
    • 디자인융복합연구
    • /
    • 제16권6호
    • /
    • pp.169-184
    • /
    • 2017
  • 스마트폰과 같이 일상에서 이미 익숙하게 사용하는 제품이나 서비스에 있어 이미 드러난 사용자 니즈가 많은 만큼 드러나지 않는 니즈도 많아진다. '익숙한 불편함'을 알아채고 해결함으로써 기존의 제품 혹은 서비스에 대한 가치 확장의 기회를 끌어낼 수 있다. 숨은 니즈에 대한 다양한 연구들이 있었으며 그 결과 숨은 니즈에 대한 개념정의와 이를 알아내기 위한 방법들이 제시되었다. 그러나 기존 숨은 니즈에 관한 연구들은 주로 새로운 제품이나 서비스 개발에 초점이 맞춰져 있기 때문에 이미 익숙해진 사용에 있어서의 숨은 니즈를 다루기에는 어려운 점이 있다. 이에 익숙한 사용에서의 드러나지 않는 니즈에 대해 가설적으로 재정의하고 이를 알아내기 위해 새로운 방식으로 접근해보고자 한다. 숨은 니즈는 사용자의 표현 범위 밖에 존재하고 명백하게 설명하기 복잡한 문제로 지표 수준에서 다루기 어렵다. 이러한 이유에서 모든 설명을 배제한 사용자 행동 데이터로써 선택한 기본 데이터의 형태는 스마트폰의 스크린 샷이다. 또한 비정형 데이터 기반 정성적 분석의 한계를 극복하기 위해 정성코딩 기법을 사용하여 개별 데이터들에 규칙과 패턴을 부여하고자 한다. 사용자의 숨은 니즈를 이해할 수 있는 유의미한 단서들을 끌어내고 실제 시장동향과의 관련성 검토를 통해 숨은 니즈를 발견하는 방법으로써의 작동 가능성을 확인할 수 있다. 본질적으로 체계화하기 어려운 과제이지만 향후 다른 제품, 서비스 디자인의 숨은 니즈 발견에 있어 참고 가능한 하나의 프레임이 될 수 있을 것으로 기대된다.

설명가능 AI 기반의 변수선정을 이용한 기업부실예측모형 (Corporate Bankruptcy Prediction Model using Explainable AI-based Feature Selection)

  • 문건두;김경재
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.241-265
    • /
    • 2023
  • 기업의 부실 예측 모델은 기업의 재무 상태를 객관적으로 모니터링하는 데 필수적인 도구 역할을 한다. 적시에 경고하고 대응 조치를 용이하게 하며 파산 위험을 완화하고 성과를 개선하기 위한 효과적인 관리 전략을 수립할 수 있도록 지원한다. 투자자와 금융 기관은 금융 손실을 최소화하기 위해 부실 예측 모델을 이용한다. 기업 부실 예측을 위한 인공지능(AI) 기술 활용에 대한 관심이 높아지면서 이 분야에 대한 광범위한 연구가 진행되고 있다. 해석 가능성과 신뢰성이 강조되며 기업 부실 예측에서 설명 가능한 AI 모델에 대한 수요가 증가하고 있다. 널리 채택된 SHAP(SHapley Additive exPlanations) 기법은 유망한 성능을 보여주었으나 변수 수에 따른 계산 비용, 처리 시간, 확장성 문제 등의 한계가 있다. 이 연구는 전체 데이터 세트를 사용하는 대신 부트스트랩 된 데이터 하위 집합에서 SHAP 값을 평균화하여 변수 수를 줄이는 새로운 변수 선택 접근법을 소개한다. 이 기술은 뛰어난 예측 성능을 유지하면서 계산 효율을 향상시키는 것을 목표로 한다. 해석 가능성이 높은 선택된 변수를 사용하여 랜덤 포레스트, XGBoost 및 C5.0 모델을 훈련하여 분류 결과를 얻고자 한다. 분류 결과는 고성능 모델 설계를 목표로 soft voting을 통해 생성된 앙상블 모델의 분류 정확성과 비교한다. 이 연구는 1,698개 한국 경공업 기업의 데이터를 활용하고 부트스트래핑을 사용하여 고유한 데이터 그룹을 생성한다. 로지스틱 회귀 분석은 각 데이터 그룹의 SHAP 값을 계산하는 데 사용되며, SHAP 값 평균은 최종 SHAP 값을 도출하기 위해 계산된다. 제안된 모델은 해석 가능성을 향상시키고 우수한 예측 성능을 달성하는 것을 목표로 한다.

단어그룹 확장 기법을 활용한 순환신경망 알고리즘 성능개선 연구 (A Study on Performance Improvement of Recurrent Neural Networks Algorithm using Word Group Expansion Technique)

  • 박대승;성열우;김정길
    • 산업융합연구
    • /
    • 제20권4호
    • /
    • pp.23-30
    • /
    • 2022
  • 최근 인공지능(AI)과 딥러닝 발전으로 대화형 인공지능 챗봇의 중요성이 부각되고 있으며 다양한 분야에서 연구가 진행되고 있다. 챗봇을 만들기 위해서 직접 개발해 사용하기도 하지만 개발의 용이성을 위해 오픈소스 플랫폼이나 상업용 플랫폼을 활용하여 개발한다. 이러한 챗봇 플랫폼은 주로 RNN (Recurrent Neural Network)과 응용 알고리즘을 사용하며, 빠른 학습속도와 모니터링 및 검증의 용이성 그리고 좋은 추론 성능의 장점을 가지고 있다. 본 논문에서는 RNN과 응용 알고리즘의 추론 성능 향상방법을 연구하였다. 제안 방법은 RNN과 응용 알고리즘 적용 시 각 문장에 대한 핵심단어의 단어그룹에 대해 확장학습을 통해 데이터에 내재된 의미를 넓히는 기법을 사용하였다. 본 연구의 결과는 순환 구조를 갖는 RNN, GRU (Gated Recurrent Unit), LSTM (Long-short Term Memory) 세 알고리즘에서 최소 0.37%에서 최대 1.25% 추론 성능향상을 달성하였다. 본 연구를 통해 얻은 연구결과는 관련 산업에서 인공지능 챗봇 도입을 가속하고 다양한 RNN 응용 알고리즘을 활용하도록 하는데 기여할 수 있다. 향후 연구에서는 다양한 활성 함수들이 인공신경망 알고리즘의 성능 향상에 미치는 영향에 관한 연구가 필요할 것이다.

기하학 기술을 이용한 인레이/온레이의 외면 모델링 (An External Surfaces Modeling of Inlay/onlay Using Geometric Techniques)

  • 유관희;하종성
    • 정보처리학회논문지A
    • /
    • 제12A권6호
    • /
    • pp.515-522
    • /
    • 2005
  • 본 논문에서는 부분적으로 파손된 치아의 수복에 사용되는 인레이/온레이 인공치아를 효과적으로 모델링하는 기법을 제안한다. 인레이/온레이는 지대치에 부착되는 내면과 밖으로 들어나는 외면으로 구성된다. 내면은 지대치와의 밀착력을 확보하기 위하여 지대치의 삭제된 표면의 확장된 부분으로 Minkowski sum을 이용하여 모델링된다. 외면을 모델링하기 위해서는 표준치아 모델, 환자 치아 석고모형을 스캔한 메쉬 자료, 환자 치아교합을 측정한 FGP(functionally guided plane) 등 세 가지 정보와 DMFFD(direct manipulation free-form deformation)[19]과 MWD(multiple wires deformation)[17]의 3D 메쉬 변형 기술들을 이용한다. 표준치아 모델은 외면의 기본적인 형태를 결정하기 위하여 사용되는 반면 석고모형 데이터와 FGP는 환자 치아 인접면과 교합면마다 약간 다르지만 정확한 기능에 매우 중요한 고유 특성을 반영하기 위해 사용되는 정보이다. 이러한 정보들을 입력으로 DMFFD 기법과 MWD 기법을 각각 적용하여 인레이/온레이 인접면과 교합면을 메쉬 자료로 자동으로 생성해낸다. 연구된 기법은 치과의사에 의한 요구사항을 반영하여 생성된 메쉬 모델을 가시화하면서 보다 정확하게 인레이/온레이를 디자인할 수 있도록 구현되었다.

시공간 겹침 조인 연산을 위한 선택도 추정 기법 (Selectivity Estimation for Spatio-Temporal a Overlap Join)

  • 이명술;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권1호
    • /
    • pp.54-66
    • /
    • 2008
  • 시공간 데이타베이스에서 조인 연산은 매우 많은 비용이 소요되며, 시공간 조인 연산의 효율적인 질의 실행 계획을 세우기 위해 조인 연산에 대한 정확한 선택도 추정은 질의처리 성능에 결정적이다. 주어진 두 이산 데이타집합 $S_1,\;S_2$의 타임스탬프 $t_q$에서 시공간 조인 연산은 타임스탬프 $t_q$에서 서로 교차하는 모든 객체 쌍을 검색하는 것이다. 시공간 조인 연산의 선택도 추정치는 검색된 객체 쌍의 수를 $|S_1{\times}S_2|$로 나눈 값이다. 이 논문은 공간 조인 연산의 선택도 추정 기법인 기하 히스토그램 기법을 확장하여 시공간 조인 선택도 추정을 위한 시공간 히스토그램을 제안한다. 균일 데이타 집합과 편중 데이타 집합 모두를 사용하여 제안된 히스토그램 기법으로 시공간 조인 연산의 선택도를 정확하게 추정할 수 있다는 것을 증명하였다. 본 논문의 기여도는 먼저 이산 데이타 집합에 대한 시공간 조인 선택도 추정 연구의 첫 시도를 하였으며 다음으로 이산 객체의 유효시간 동안의 공간 통계정보를 압축하여 히스토그램을 재구축하는 효율적인 유지기법을 제안하였다.

병리특이적 형태분석 기법을 이용한 HRCT 영상에서의 새로운 봉와양폐 자동 분할 방법 (A Novel Method for Automated Honeycomb Segmentation in HRCT Using Pathology-specific Morphological Analysis)

  • 김영재;김태윤;이승현;김광기;김종효
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.109-114
    • /
    • 2012
  • 봉와양폐(Honeycomb)는 직경 2~10mm 정도의 크기가 같지 않은 낭포(Cyst)가 경계가 명확한 섬유질(Fibrosis)로 이루어진 벽에 둘러싸여 밀집된 형태로 이루어져 있다. 봉와양폐가 발견될 경우 급성악화의 발생 빈도가 높으며 따라서 봉와양폐의 관찰 여부와 측정은 임상에서 중요한 지표가 된다. 따라서 본 논문에서는 봉와양폐 영역의 정량적 측정을 위하여 봉와양폐의 특징을 이용한 형태학적 기법과 군집성 평가 기법을 통해 자동 구획 방법을 제안하였다. 첫 번째로 영상의 잡음을 제거하기 위하여 가우시안 필터링을 적용하고, 모폴로지 기법 중 팽창 기법을 이용하여 폐 영역을 구획하였다. 두번째로, 주변 8방향 검사를 통해 봉와양폐를 구성하는 낭포의 후보군을 찾고, 영역 확장과 외곽선 검사를 통해 비 낭포들을 제거하였다. 마지막으로 군집화 검사를 통해 최종적으로 봉와양폐를 구획하였다. 제안한 방법은 80장의 고해상도 컴퓨터 단층촬영 영상에서 실험한 결과, 89.4%의 민감도와, 72.2%의 양성 예측도를 보였다.