• 제목/요약/키워드: 데이터 재배열

검색결과 53건 처리시간 0.024초

문장 독립 화자 인증을 위한 세그멘트 단위 혼합 계층 심층신경망 (Segment unit shuffling layer in deep neural networks for text-independent speaker verification)

  • 허정우;심혜진;김주호;유하진
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.148-154
    • /
    • 2021
  • 문장 독립 화자 인증 연구에서는 일반화 성능 향상을 위해 문장 정보와 독립적인 화자 특징을 추출하는 것이 필수적이다. 그렇지만 심층 신경망은 학습 데이터에 의존적이므로, 동일한 시계열 정보를 반복 학습할 경우, 화자 정보를 학습하는 대신 문장 정보에 과적합 될 수 있다. 본 논문에서는 이러한 과적합을 방지하기 위해 시간 축으로 입력층 혹은 은닉층을 분할 및 무작위 재배열하여 시계열 정보의 순서를 뒤섞는 세그멘트 단위 혼합 계층을 제안한다. 세그멘트 단위 혼합 계층은 입력층 뿐만 아니라 은닉층에도 적용이 가능하므로, 입력층에서의 일반화 기법에 비해 효과적이라 알려진 은닉층에서의 일반화 기법으로 활용이 가능하며, 기존의 데이터 증강 방법과 동시에 적용할 수도 있다. 뿐만아니라, 세그멘트의 단위 크기를 조절하여 혼합의 정도를 조절할 수도 있다. 본 논문에서는 제안한 방법을 적용하여 문장 독립 화자 인증 성능이 개선됨을 확인하였다.

영역별 대역간 양방향 예측과 확장된 SPIHT를 이용한 다분광 화상데이터의 압축 (Multispectral Image Compression Using Classified Interband Bidirectional Prediction and Extended SPHT)

  • 김승진;반성원;김병주;박경남;김영춘;이건일
    • 대한전자공학회논문지SP
    • /
    • 제39권5호
    • /
    • pp.486-493
    • /
    • 2002
  • 본 논문에서는 웨이블릿 영역에서 각 부밴드에 대한 영역별 대역간 양방향 예측과 확장된 SPIHT (set partition in hierarchical trees)를 이용한 효율적인 인공위성 다분광 화상데이터의 압축 방법을 제안하였다. 이 방법에서는 가시광선 영역과 적외선 영역에서 다른 대역과 분광적 상관성이 큰 대역을 기준대역 (feature band)으로 각각 결정하고, 이 대역들에 대해 웨이블릿 변환 (wavelet transform, WT)을 행한 후 SPIHT를 행하여 부호화함으로써 대역내 (intraband) 중복성을 제거한다. 기준대역과 대역간 상관성이 큰 예측대역 (prediction band)들에 대해서는 웨이블릿 변환을 행한 후, 각 대역의 기저밴드의 대역별 특성을 이용하여 영역분류를 하고, 각 부밴드에 대한 영역별 대역간 양방향 예측 (classified interband bidirec- tional prediction)을 행함으로써 대역간 (interband) 중복성을 제거하여 압축 효율을 향상시킨다. 또한 확장된 SPIHT의 부호화 효율을 높이기 위해 예측오차의 최대값에 따라 재배열된 대역들에 대해 확장된 SPIHT를 행하여 예측오차를 부호화함으로써, 예측에 따른 오차를 보상하여 화질을 향상시킨다. 실제 다분광 화상데이터에 대한 모의 실험을 통하여 제안한 방법의 부호화 효율이 기존의 방법에 비하여 우수함을 확인하였다.

단위용적 및 다용적 기법 자기공명분광 신호처리 분석 소프트웨어의 개발 (The Development of Signal Processing Software for Single-and Multi-Voxel MR Spectroscopy)

  • 백문영;이현용;신운재;은충기;문치웅
    • 대한전자공학회논문지SP
    • /
    • 제39권5호
    • /
    • pp.544-555
    • /
    • 2002
  • 단위용적기법(Single-Voxel Technique) 및 다용적기법(Multi-Voxel Technique)으로 얻어진 수소원자핵 자기공명분광(Proton Magnetic Resonance Spectroscopy : 1H-MRS) 데이터를 고가의 특정 workstation이 아닌 일반 PC에서 처리${\cdot}$분석 할 수 있는 GUI(Graphical User Interface) 기반의 분광분석용 소프트웨어(S/W)를 개발하고 MRS 임상 데이터로 기초적인 시험을 하였다. 단위용적기법의 MRS 경우에는 시간 영역의 측정신호와 주파수 영역의 분광정보를 한 화면에 동시에 표시할 수 있게 하였고 필요에 따라 위상보정, 필터링(filtering), 퓨리에변환 등으로 후처리 한 후 생체 대사물질(metabolite) 별 MRS 피크 면적 비를 계산하여 정성분석을 하였다. 다용적기법의 MRS에서는 측정된 신호의 재배열 및 3차원 FFT로 분광영상(spectroscopic image)을 재구성하고 이를 T1-강조 또는 T2-강조 영상 위에 중첩시켜 해부학적 정보와 함께 표시할 수 있도록 하였다. 또한 생체에서 대사물질에 해당하는 분광정보의 각 피크의 분포도(metabolite image)를 만들고 해부학적 영상과 중첩시켰다. 병원에 설치되어있는 MR 장치에서 정상인과 뇌에 이상이 있는 환자를 대상으로 얻은 MR 분광 데이터를 처리·분석한 결과 사용자의 편의성이 높을 뿐만 아니라 신뢰성이 우수하여 임상적 활용도가 높을 것으로 기대된다.

캐리커처 자동 생성을 위한 이미지 변형 법칙에 관한 연구 - 감성적 형태 중심의 변형 방법 - (Image Transformation Logics for Caricature Generation : The Focus on Emotional Form)

  • 김성곤
    • 감성과학
    • /
    • 제12권1호
    • /
    • pp.129-136
    • /
    • 2009
  • 캐리커처 자동 생성기를 개발하기 위한 본 연구는 과거의 여러 연구와는 달리 캐리커처 전문가들이 그리는 방법을 관찰하는 것에서 시작하였다. 관찰 과정에서 전문가들이 특히 그림을 그릴 때 대상물의 형태를 다른 유사한 다른 사물과 비슷하게 그려서 그 특징을 과장하고 있는 사실을 발견하였다. 우리가 일상생활에서 '무엇은 무엇을 닮았다'라고 표현할 때, 이는 동일한 형태 군에서 그 차이점을 부각 시켜서 표현하는 것이다. 본 연구에서는 그리고자 하는 대상물의 형태와 가장 유사한 기하학적 형태를 찾아 그 형태를 강조 변화 하고자 하였다. 연구의 범위는 벡터라인으로 그려진 2차원 단일 외형 폐곡선을 캐리커처 형태로 강조 변화하는 것으로 한정하였다. 이를 위하여 4종류의 유사 기하학적 형태 데이터베이스의 구성방법, 대상 유사 기하학적 형태를 찾기 위한 탐색 방법, 탐색된 데이터를 동일 크기와 좌표로 재배열 방법 그리고 강조 변화하는 방법에 관하여 논하였다. 사람 얼굴을 실험 대상으로 선정하여 데이터베이스를 제작하였다. 변화된 결과물에 대해서 설문한 결과 그 가능성이 입증되었다.

  • PDF

재배열 기반의 낙관적 캐쉬 일관성 유지 기법의 모델링과 분석 (Modeling and Analysis of a Reordering-based Optimistic Cache Consistency Protocol)

  • 조성호;황정현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.458-467
    • /
    • 2001
  • 낙관적 2단계 잠금(O2PL)은 클라이언트 캐쉬를 적절히 사용하고 상대적으로 적은 네트워크 요구량으로 인하여 다른 기법보다 좋거나 같은 성능을 나타낸다. 그러나, 모든 잠금을 얻을 때까지 해당 트랜잭션이 완료될 수 없게 때문에 O2PL은 필요없는 기다림을 만든다. 또한, 낙관적 병행수행 제어(OCC) 기법은 필요없는 철회를 만든다. 본 논문은 이러한 단점들을 완화시킬 수 있는 효율적인 낙관적 캐쉬 일관성 유지 기법을 제안한다. 제안하는 기법은 트 랜잭션의 완료나 철회를 기다림 없이 결정하며 철회율을 최소화하기 위하여 트랜잭션 재배 열을 사용한다. 제안하는 기법은재배열 기법을 사용함에도 불구하고 각 데이터 당 하나의 버전만을 필요로 한다. 마지막으로, 본 논문은 정량적 평가결과를 통하여 제안하는 기법이 O2PL과 OCC 보다 좋은 성능을 나타낸다는 것을 보인다.

  • PDF

포아송 클러스터 강우 모형을 이용한 미래 시단위 이하 강우의 추계학적 모의 (Stochastic simulation of future sub-hourly rainfall using Poisson cluster rainfall model)

  • 박정하;김동균
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.284-284
    • /
    • 2023
  • 도시 침수의 발생과 규모는 도시 유역이 가지는 짧은 도달 시간으로 인하여 주로 시단위 이하의 짧은 지속시간의 강우의 극한 및 변동성에 따라 결정된다. 미래 기간에 대하여 도시 수문 시스템의 적정성을 평가하기 위해서는 기후변화에 따른 시단위 이하 강우의 특성을 살펴보아야한다. 그러나 기후변화 영향 평가 도구로 활용되는 기후 모형들은 대부분 일단위의 결과물을 제공하여 시단위 이하의 미세 규모 강우의 특성을 나타낼 수 없다. 이에 따라 본 연구에서는 기후 모형 모의 결과와 포아송 클러스터 강우 모형을 이용하여 미래 시단위 이하 강우 시계열을 모의하는 방법을 제안한다. 첫째로, 포아송 클러스터 기반 강우 생성 알고리즘과 폭풍우 재배열 알고리즘을 결합한 최신 모형을 선정하였다. 해당 모형은 광범위한 시간 규모에서 관측된 강우량의 주요 통계와 극값을 재현할 수 있는 모형이다. 그 다음 강우 모형에 적합시킬 관측 강우량 통계(평균, 분산, 공분산, 왜도, 우기 비율)를 계산하였다. 둘째, 강우 통계 간의 선형 관계를 도출하였다. 여기서는 클러스터에 있는 모든 관측소의 통계를 사용하여 회귀의 신뢰도를 높였다. 셋째, 강우 평균 조정을 위한 Change Factor는 제어(2000~2019년) 및 미래(2041~2070년) 기간의 기후 모형 자료를 사용하여 계산하였다. 넷째, 조정된 15분 강우 평균은 관측 평균에 Change Factor을 곱하여 계산하고 조정된 강우 평균과 통계 간의 관계를 사용하여 미래 강우 통계 세트를 추정하였다. 여러 통계 세트를 생성한 후 마지막으로 미래 통계에 강우 모형을 적합시켜 최종적으로 미래 시단위 이하 강우 시계열을 모의하였다. 이 방법은 CMIP6에 참여하는 기후 모델의 기후 예측 데이터를 사용하여 용산(415) 및 동래(940) AWS 관측소에 적용되었다. 두 관측소의 미래 강우 모의 결과, 시단위 이하 시간 규모에서 극값이 증가하는 추세를 보였다.

  • PDF

지식 생산 방식에 따른 집단지성 구조 분석 -네이버 지식IN과 위키피디아를 중심으로- ('Collective intelligence Structure' Analysis)

  • 한창진
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1363-1373
    • /
    • 2009
  • 본 연구는 두 집단지성의 가장 대표적인 서비스인 네이버 지식iN과 위키피디아의 구조적, 경험적 차이를 바탕으로 생산의 차원에서 생산 주기, 생산 참여자, 생산물의 모델을 설정하고, 새롭게 탄생하는 지식을 중심으로 검증함으로써 최종 지식 소비 행위를 반영한 각각의 종합모델을 도출하였다. 우리는 웹에서 집단지성의 일상화를 확인할 수 있다. 지식 획득 매체가 매스미디어에서 인터넷으로 변화하는 과정에서 등장한 포털 및 검색사이트는 지식의 생산이 전문가패러다임에서 소비자 중심으로 재편될 수 있는 가능성을 열어주었다. 그리고 이러한 생산 방식의 변화는 '지식'의 개념 역시 변화시키고 있다. 즉, 집단지성이라는 새로운 웹2.0의 현상이 지식생산방식을 변화시키고 변화된 지식생산방식은 '지식'자체를 변화시킨다는 이론적 가설을 도출할 수 있는 것이다. 본 연구는 이러한 새로운 현상들을 분석하기 위해서는 먼저 보다 엄밀하게 집단지성의 개념을 규정할 필요성에 출발하였다. 현재 집단지성이라는 이름으로 불리면서 급격히 성장하고 있는 위키 방식의 인터넷 서비스와 지식검색 방식의 인터넷 서비스를 비교함으로써 보다 정교한 집단지성의 모델을 구축하고자 하였다. 위키형 집단지성과 지식검색형 집단지성의 차이점은 경험적으로도 뚜렷하게 확인할 수 있다. 본 연구는 이러한 경험적 차이와 기존의 문헌에서 밝혀진 사실들을 바탕으로 두 서비스의 지식생산 방식을 생산플로우, 생산참여자 성향, 생산물(지식)의 성향과 같이 세 영역으로 나누어 각각의 가설 모델을 설정하고 이 모델을 선정된 질의어를 바탕으로 검증한 뒤에 최종적인 모델을 도출하는 방식으로 진행되었다. 지식검색형 집단지성은 '질문-답변-채택'의 구조이고, 그 구조 속에서 '질문기-답변기-순서화기'를 거쳐 하나의 지식 덩어리인 'K-let'을 생산한다. 생산된 'K-let'들은 지식검색서비스의 데이터베이스에 축적되고, 이는 공통된 질의어를 기준으로 소비자들에 의해서 검색되어 소비된다. 하나의 질문에 대해 여러 개의 답변들이 존재하고, 답변자의 성향은 크게 전문성과 체계성을 바탕으로 한 전문가형 답변자와 경험적이고 의견지향적인 대화형 답변자로 나눠진다. 다수의 네티즌들의 참여에 의해서 지식의 생산이 진행되므로 질문의 성향 역시 사실, 의견, 경험 등 다양한 스펙트럼을 가지는 모델로 설정하였다. 반면에 위키형 집단지성은 개방형 플랫폼을 바탕으로 한 백과사전의 형식이며, 이러한 형식 속에서 최초의 개념어 등록과 다수의 편집활동을 거치면서 완성되지 않는 하나의 아티클인 'W-let'을 생산한다. 이러한 'W-let'은 생성 초기에 소수에 의한 활발한 내용 입력 활동으로 어느 정도의 안정화를 거친 후에는 꾸준한 다수의 수정활동을 통해서 'W-let'의 생명력을 유지함으로써 지식의 실제적인 변화를 반영한다. 생산된 'W-let'들은 위키형 집단지성 서비스의 데이터베이스에 축적되고, 이것들은 내부링크를 통해서 모두 연결되어 있다. 백과사전 형식으로 하나의 개념어를 설명하는 하나의 아티클은 오로지 사실적인 지식들로만 구성되나 내부링크와 외부링크를 통해서 다양한 스펙트럼을 가지는 모델로 설정하였다. 위와 같이 설정된 모델을 바탕으로 공통된 질의어 및 개념어를 선정하여 각각의 서비스에 노출시켰다. 이를 통해서 얻어진 각 서비스의 데이터베이스에 축적된 모든 데이터들 중에서 일정한 기간을 기준으로 각각의 모델 검증에 필요한 데이터를 추출하여 분석하는 방식으로 진행되었다. 그 결과 지식검색형 집단지성에서는 '질문-답변-채택'의 생산 구조 속에 다수가 참여하여 질문-채택답변-기타답변으로 배열되어 있는 완성된 형태의 K-let들을 지속적으로 생산하며 비슷한 성향을 가진 K-let들이 반복적으로 생산되어 지식검색 데이터베이스에 누적된다. 지식 소비자들은 질의어 검색을 통해서 다양한 K-let들을 선택하여 비교, 검토한 후에 선택된 K-let들의 배열은 해체되어 소비자들에 의해서 재배열됨을 발견할 수 있었다. 이에 지식검색형 집단지성이란 다수의 의해서 생산되고 누적된 지식들이 소비자의 검색과 선택에 의해 해체되어 재배열되는 지식의 맞춤화 과정이라고 정의내릴 수 있었다. 반면에 위키형 집단지성에서는 '내용입력-미세수정' 구조 속에서 생명력 있는 W-let을 생성한다. W-let은 백과사전처럼 정리되어 내부링크를 통해서 서로 연결되고, 외부링크를 통해 확장되고, 지식소비자들은 검색을 통해 최초의 W-let에 도달한 후에 링크를 선택함으로써 지식을 확장시킴을 검증할 수 있었다. 따라서 위키형 집단지성이란 다수의 의해서 생산되고 정리된 지식들이 소비자의 검색과 링크에 의해 무한히 확장되는 지식의 확대 재생산되는 과정이라고 정의 내릴 수 있다. 결국, 현재의 집단지성이란 지식이 다수의 참여로 생산됨으로써 개인에게 맞춤화되고, 끊임없이 확대 재생산되는 과정을 의미한다. 그리고 이러한 집단지성의 방식은 지식이라는 현재의 차원을 넘어서 정치, 경제를 비롯한 사회의 전 영역으로 점차적으로 확대되어갈 것이다. 앞으로 연구들은 두 가지 모델이 혼재되어 있는 현재의 집단지성이 어떠한 새로운 모델을 만들면서 다른 영역으로 확장되어갈 것인지에 대해서 초점을 맞춰 나가야할 것이다.

  • PDF

병렬 시스템 환경하에서 비정형 응용 프로그램을 위한 입출력 시스템의 설계 및 구현 (Design and Implementation of An I/O System for Irregular Application under Parallel System Environments)

  • 노재춘;박성순;알록샤우드리;권오영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1318-1332
    • /
    • 1999
  • 본 논문에서는 입출력 응용을 위해 collective I/O 기법을 기반으로 한 실행시간 시스템의 설계, 구현 그리고 그 성능평가를 기술한다. 여기서는 모든 프로세서가 동시에 I/O 요구에 따라 스케쥴링하며 I/O를 수행하는 collective I/O 방안과 프로세서들이 여러 그룹으로 묶이어, 다음 그룹이 데이터를 재배열하는 통신을 수행하는 동안 오직 한 그룹만이 동시에 I/O를 수행하는 pipelined collective I/O 등의 두 가지 설계방안을 살펴본다. Pipelined collective I/O의 전체 과정은 I/O 노드 충돌을 동적으로 줄이기 위해 파이프라인된다. 이상의 설계 부분에서는 동적으로 충돌 관리를 위한 지원을 제공한다. 본 논문에서는 다른 노드의 메모리 영역에 이미 존재하는 데이터를 재 사용하여 I/O 비용을 줄이기 위해 collective I/O 방안에서의 소프트웨어 캐슁 방안과 두 가지 모형에서의 chunking과 온라인 압축방안을 기술한다. 그리고 이상에서 기술한 방안들이 입출력을 위해 높은 성능을 보임을 기술하는데, 이 성능결과는 Intel Paragon과 ASCI/Red teraflops 기계 상에서 실험한 것이다. 그 결과 응용 레벨에서의 bandwidth는 peak point가 55%까지 측정되었다.Abstract In this paper we present the design, implementation and evaluation of a runtime system based on collective I/O techniques for irregular applications. We present two designs, namely, "Collective I/O" and "Pipelined Collective I/O". In the first scheme, all processors participate in the I/O simultaneously, making scheduling of I/O requests simpler but creating a possibility of contention at the I/O nodes. In the second approach, processors are grouped into several groups, so that only one group performs I/O simultaneously, while the next group performs communication to rearrange data, and this entire process is pipelined to reduce I/O node contention dynamically. In other words, the design provides support for dynamic contention management. Then we present a software caching method using collective I/O to reduce I/O cost by reusing data already present in the memory of other nodes. Finally, chunking and on-line compression mechanisms are included in both models. We demonstrate that we can obtain significantly high-performance for I/O above what has been possible so far. The performance results are presented on an Intel Paragon and on the ASCI/Red teraflops machine. Application level I/O bandwidth up to 55% of the peak is observed.he peak is observed.

인공지능을 이용한 신규간호사 이직률 예측 (Artificial Intelligence to forecast new nurse turnover rates in hospital)

  • 최주희;박혜경;박지은;이창민;최병관
    • 한국융합학회논문지
    • /
    • 제9권9호
    • /
    • pp.431-440
    • /
    • 2018
  • 본 연구에서는 인공지능 기술 중 구글에서 개발하여 오픈소스로 제공하고 있는 텐서플로우(Tensorflow) 활용하여 신규간호사 이직률을 예측해 보았고, 이를 통해 전략적 인적자원관리 방안을 제시하였다. 부산지역 한 대학병원의 2010년에서 2017년 사이 퇴직한 간호사 데이터 1,018건을 수집하였다. 학습에 사용된 자료는 순서를 임의로 재배열 한 뒤 전체 데이터의 80%를 학습에, 나머지 20%를 테스트에 이용하였다. 활용된 알고리즘은 다중신경망회로(multiple neural network)로서 입력층과 출력층, 3개 층의 은닉층을 가지도록 설계 되었다. 본 연구의 결과 텐서플로우 플랫폼을 활용하여 1년 이내 이직률을 88.7%, 3년 이내 조기 이직률은 79.8%의 정확도로 예측하였고, 대상자들의 퇴직 시 연령은 20대 후반부터 30대에 집중되어 있었다. 가장 높은 빈도를 차지한 이직 사유로는 '결혼, 출산, 육아, 가정 및 개인사정'이었으나, 근무기간 1년 이하 대상자 들의 가장 높은 이직사유는 '업무 부적응 및 대인관계 문제'로 나타났다.

FPGA에서 에너지 효율이 높은 데이터 경로 구성을 위한 계층적 설계 방법 (A Model-based Methodology for Application Specific Energy Efficient Data path Design Using FPGAs)

  • 장주욱;이미숙;;최선일
    • 정보처리학회논문지A
    • /
    • 제12A권5호
    • /
    • pp.451-460
    • /
    • 2005
  • 본 논문은 ffGA상에서 에너지 효율이 높은 데이터 경로 설계 방법론을 제안한다. 에너지, 처리시간, 그리고 면적간의 트레이드오프를 이해하기 위하여, 도메인 특성 모델링, coarse-grained 성능평가, 설계공간 조사, 그리고 로우-레벨 시뮬레이션 과정들을 통합한다. 도메인 특성 모델링 기술은 도메인의 특성에 따른 시스템 전체의 에너지 모에 영향을 미치는 여러 가지 구성요소와 파라미터들을 식별함으로써 하이-레벨 모델을 명시한다. 도메인이란 주어진 어플리케이션 커널의 알고리즘에 대응하는 아키텍쳐 패밀리이다. 하이-레벨 모델 또한 에너지, 처리시간 그리고 면적을 예측하는 함수들로 구성되어 트레이드오프 분석을 용이하게 한다. 설계 공간 조사(DSE)는 도메인에 명시된 설계 공간을 분석하여 설계 셋을 선택하도록 한다. 로우-레벨 시뮬레이션은 설계 공간 조사(DSE)에 의해 선택된 설계와 최종 선택된 설계의 정확한 성능평가를 위하여 사용된다. 본 논문에서 제안한 설계 방법은 매트릭스 곱셈에 대응하는 알고리즘과 아키텍쳐 패밀리를 사용한다. 제안된 방법에 의해 검증된 설계는 에너지, 처리시간과 면적간의 트레이드오프를 보인다. 제안된 설계 방법의 효율성을 보이기 위하여 Xilinx에서 제공되는 매트릭스 곱셈 커널과 비교하였다. 성능 비교 메트릭으로 평균 전력 밀도(E/AT)와 에너지 대 (면적 x 처리시간)비를 사용하였다. 다양한 문제의 크기에 대하여 Xilinx설계들과 비교하였을 때 제안한 설계 방법이 전력밀도(E/AT)에서 평균 $25\%$우수하였다. 또한 본 논문에 제안한 설계의 방법을 MILAN 프레임워크를 이용하여 구현하였다.