• 제목/요약/키워드: Index Update

검색결과 137건 처리시간 0.026초

음향 데이터로부터 얻은 확장된 음소 단위를 이용한 한국어 자유발화 음성인식기의 성능 (Performance of Korean spontaneous speech recognizers based on an extended phone set derived from acoustic data)

  • 방정욱;김상훈;권오욱
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.39-47
    • /
    • 2019
  • 본 논문에서는 대량의 음성 데이터를 이용하여 기존의 음소 세트를 확장하여 자유발화 음성인식기의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 먼저 방송 데이터에서 가변 길이의 음소 세그먼트를 추출한 다음 LSTM 구조를 기반으로 고정 길이의 잠복벡터를 얻는다. 그런 다음, k-means 군집화 알고리즘을 사용하여 음향적으로 유사한 세그먼트를 군집시키고, Davies-Bouldin 지수가 가장 낮은 군집 수를 선택하여 새로운 음소 세트를 구축한다. 이후, 음성인식기의 발음사전은 가장 높은 조건부 확률을 가지는 각 단어의 발음 시퀀스를 선택함으로써 업데이트된다. 새로운 음소 세트의 음향적 특성을 분석하기 위하여, 확장된 음소 세트의 스펙트럼 패턴과 세그먼트 지속 시간을 시각화하여 비교한다. 제안된 단위는 자유발화뿐만 아니라, 낭독체 음성인식 작업에서 음소 단위 및 자소 단위보다 더 우수한 성능을 보였다.

이중 스텝 크기를 가지는 MSAG-SCS-MMA-I 적응 블라인드 등화 알고리즘의 성능 평가 (Performance Evaluation of MSAG-SCS-MMA-I Adaptive Blind Equalization Algorithm with dual step-size)

  • 정영화
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.115-121
    • /
    • 2019
  • 본 논문은 256-QAM 시스템에서 기존 SCS-MMA-I 알고리즘의 수렴 속도를 현저히 개선하면서도 정상상태에서 매우 작은 잔류 ISI 및 MSE를 가지는 이중 스텝 크기를 가지는 MSAG-SCS-MMA-I 적응 블라인드 등화 알고리즘을 제안하고, 이 알고리즘에 대한 등화 성능을 평가한다. SCS-MMA-I 와 결정지향 알고리즘으로 부터 얻어지는 '1' 또는 '0'의 이진 Flag에 의해 제어되는 MSAG-SCS-MMA-I의 탭 갱신 식에 고정된 스텝 크기 대신에 결정지향 오차의 크기에 따라 서로 다른 스텝 크기를 적용함으로써 우수한 등화 성능을 가지도록 하였다. 컴퓨터 모의실험 수행 결과 잔류 ISI과 MSE, 그리고 MD등의 성능 지표면에서 제안한 알고리즘이 MMA나 SCS-MMA-I, 그리고 MSAG-SCS-MMA-I 알고리즘보다 훨씬 뛰어난 성능을 가짐을 확인하였다.

농촌 생활권 기초생활서비스 항목 설정 및 공간데이터 구축을 위한 기초연구 (Deriving Basic Living Service Items and Establishing Spatial Data in Rural Areas)

  • 김수연;김상범
    • 한국농촌건축학회논문집
    • /
    • 제24권3호
    • /
    • pp.39-46
    • /
    • 2022
  • This study aims to derive basic living service facility items in rural areas and construct related spatial data. To do this, a literature review on the laws and systems related to the residential environment and services in rural areas, rural spatial planning, and the 'Rural Convention' strategic plan reports for the Jeolla and Gyeongsang Region in 2021 was conducted. Primary data collection and review on the list of basic living service items in rural areas derived from the analysis were conducted. After data collection, 12 sectors and 44 types of rural basic living service items were derived; the data selection was carried out based on the clarity of the subject of data management, whether it was established nationwide, whether it was disclosed and provided, whether it was periodically updated, and whether it was an underlying law. Afterwards, data on the derived rural basic living service items were constructed. Afterwards, spatial data on the derived rural basic living service items were constructed. Because open data provided through various institutions were employed, data structure unification such as data attribute values and code names was needed, and abnormal data such as address errors and omissions were refined. After that, the data provided in text form was converted into spatial data through geocoding, and through comparative review of the distribution status of the converted data and the provided address, spatial data related to rural basic living services were finally constructed for about 540,000 cases. Finally, implications for data construction for diagnosing rural living areas were derived through the data collection and construction process. The derived implications include data unification, data update system establishment, the establishment of attribute values necessary for rural living area diagnosis and spatial planning, data establishment plan for facilities that provide various services, rural living area analysis method, and diagnostic index development. This study is meaningful in that it laid the foundation for data-based rural area diagnosis and rural planning, by selecting the basic rural living service items, and constructing spatial data on the selected items.

주기억 데이타베이스 인덱싱을 위한 CCMR-트리 (Making Cache-Conscious CCMR-trees for Main Memory Indexing)

  • 윤석우;김경창
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권6호
    • /
    • pp.651-665
    • /
    • 2003
  • 매년 CPU 속도가 60% 정도 증가되고, 메모리 속도가 10% 증가되는 현실에서, 캐쉬 미스(Cache miss)를 얼마나 줄이느냐 하는 문제가 현재의 주기억 데이타베이스 환경에서 가장 중요한 문제로 대두되었다. 최근 연구들에서는 R-트리의 변형 모델인 CR-트리와 같은 인덱스 구조들이 제시되었으나, 이는 손실 발생 가능한 압축 기법을 사용함으로써 검색 성능이 더 나빠질 수 있다는 문제점이 있다. 본 논문에서는 MR-트리라고 이름 붙여진 캐쉬 동작에 민감한 R-트리의 새로운 변형 모델을 제시한다. MR-트리는 리프가 아닌 중간 노드 엔트리들을 100%에 가깝게 사용하여 결과적으로 트리의 높이와 중간 노드 엔트리의 MBR을 줄여주는 효과를 준다. 이를 위해 노드 분할 발생시 입력 경로 상에 하나 이상의 빈 엔트리를 지니는 중간 노드가 존재할 경우에만, 노드 분할을 상위로 전송하고, 존재하지 않을 경우 새롭게 생성된 노드는 분할된 노드의 자식 노드가 된다. MR-트리는 이와 같은 동작으로 인해 발생 가능한 트리 불균형 문제를 높이 균형화(HeightBalance) 알고리즘을 수행함으로써 해결한다. 한편, 본 논문에서는 MR-트리를 캐쉬 동작에 더욱 민감한 트리형태로 만들기 위해 CCMR-트리를 제안한다. 본 논문의 실험과 분석 결과, 2차원의 MR-트리는 약간의 개선된 수정 속도와 비슷한 메모리 사용량을 기록하며, 기존의 R-트리에 비해 2.4배 이상의 빠른 검색 속도를 나타냈다.

영역 모니터링 질의 처리를 위한 공간 분할 기법 (A Spatial Split Method for Processing of Region Monitoring Queries)

  • 정재우;정하림;김응모
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.67-76
    • /
    • 2018
  • 본 논문은 영역 모니터링 질의를 효율적으로 처리하는 기법에 대해서 다룬다. 기존의 영역 모니터링 질의 처리를 위해서 사용된 중앙 집중식 기법은 이동 객체가 서버에 주기적으로 자신의 위치 업데이트를 전송하고, 서버가 질의 결과를 지속적으로 업데이트 한다고 가정한다. 그러나 이러한 가정은 많은 양의 위치 데이터 전송으로 인해 시스템 성능을 크게 저하시킨다. 최근, 영역 모니터링 질의 처리를 위한 몇 가지 분산 기법들이 제안되었다. 분산 기법에서 서버는 각 이동 객체에게 I) 작업 공간의 서브 공간인 상주 도메인과 ii) 몇 개의 인접 질의 영역을 할당한다. 각 이동 객체는 상주 도메인을 벗어나거나 질의 영역의 경계를 가로지를 경우에만 서버에게 자신의 위치를 전송한다. 상주 도메인 및 인접 질의 영역을 이동 객체에 할당하기 위해서 서버는 작업 공간을 반복적으로 동일하게 반으로 분할하여 생성되는 질의 색인 구조를 사용한다. 하지만 이와 같은 색인 구조는 불필요한 분할이 발생하게 되므로 시스템의 성능 저하를 발생시킨다. 본 논문에서는 불필요한 분할을 줄이기 위해서 적응 분할 기법을 제안한다. 적응 분할 기법은 I) 질의 영역과 결과 서브 공간의 공간적 관계와 ii) 질의 영역의 분포를 고려하여 동적으로 작업 공간을 분할한다. 본 논문에서는 기존의 색인 구조인 QR-tree에 본 논문에서 제안한 새로운 분할 기법을 적용하였으며, 시뮬레이션을 통해 제안 된 분할 기법의 효율성을 검증했다.

플래시 메모리 기반 인덱스 구조에서 대리블록 이용한 가비지 컬렉션 기법 (Garbage Collection Method using Proxy Block considering Index Data Structure based on Flash Memory)

  • 김선환;곽종욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-11
    • /
    • 2015
  • 낸드 플래시 메모리는 빠른 접근 시간과 저전력의 특성을 가지고 있어 저장장치로 많이 사용되고 있는 추세이다. 하지만 저사양의 임베디드 장치에서는 메모리 요구사항과 구현상의 복잡성으로 FTL을 적용하기에는 비용이 많이 든다. 이러한 이유로 FTL을 구현하기 힘든 임베디드 장치에 적용할 수 있는 B+ 트리 연구들이 다수 제안되었다. 이런 연구들은 낸드 플래시 메모리에서 제자리 업데이트가 불가하다는 단점을 고려하여 삽입과 갱신의 성능을 최적화 하였다. 하지만 B+ 트리에 기존의 가비지 컬렉션 기법들을 적용하면 낸드 플래시 메모리의 페이지 위치를 변경하게 되고 B+ 트리의 재구성을 발생시켜 전체적인 성능을 저하시킨다. 이러한 문제를 해결하고자 본 논문에서는 낸드 플래시 메모리를 기반으로 하는 B+ 트리와 이와 유사한 인덱스 트리 구조에 적용할 수 있는 가비지 컬렉션 기법을 제안한다. 제안하는 가비지 컬렉션 기법은 블록 정보 테이블과 대리 블록을 이용하여 B+ 트리의 재구성을 발생시키지 않는다. 제안된 기법의 성능평가를 위해, 낸드 플래시 메모리가 장착된 실험 장치에 B+ 트리와 ${\mu}$-Tree를 구현하고 제안된 기법을 적용하였다. 구현 결과 B+ 트리에서 제안된 기법이 GAGC(Greedy Algorithm Garbage Collection)보다 삽입된 키의 개수가 약 73% 많았으며, ${\mu}$-Tree에서 제안된 기법이 GAGC보다 시간 오버헤드가 약39% 적었다.

HBR-Tree를 이용한 실시간 모바일 GIS의 개발 (Development of a Real-Time Mobile GIS using the HBR-Tree)

  • 이기영;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.73-85
    • /
    • 2004
  • 최근 들어 무선 인터넷이 발전하고, PDA, HPC의 보급이 늘어남에 따라 GIS(Geographic Information System)와 관련된 연구 및 개발이 점차적으로 위치 기반 서비스(LBS: Location Based Service)를 제공하기 위한 실시간 모바일 GIS로 변화해 가고 있다. LBS를 효과적으로 제공하기 위해서는 이동 객체의 동적인 상황을 효과적으로 처리할 수 있는 실시간 GIS 플랫폼과 위치 데이타의 특성을 반영한 위치 인덱스가 필요하다. 위치 데이타는 이전의 GIS에서 사용되는 것과 동일한 데이타 타입(예, 점)이 사용되지만 위치 데이타의 관리는 이전 GIS와는 다른 처리 방식을 사용해야 한다. 이를 위하여 본 논문에서는 대용량의 위치 데이타를 효율적으로 처리할 수 있는 HBR-tree를 이용한 실시간 모바일 GIS의 개발에 대하여 연구하였다. 본 연구에서 개발된 실시간 모바일 GIS는 HBR-tree와 실시간 GIS 플랫폼으로 구성되어 있다. HBR-tree는 R-tree와 공간 해쉬가 결합된 위치 인덱스이다. 그러므로, 위치 데이타가 빈번하게 변경되더라도 갱신 연산은 HBR-tree의 동일한 해쉬 테이블에서 일어나기 때문에 다른 트리 기반 인덱스에 비하여 갱신 연산이 적으며, 검색 연산은 R-tree의 검색 메커니즘을 이용하기 때문에 공간 데이타를 신속하게 검색할 수 있다. 본 논문에서 실시간 GIS 플랫폼은 주기억장치 데이타베이스 시스템의 기능이 확장된 실시간 GIS 엔진, 공간 및 비공간 데이타를 서버와 클라이언트로 전송하기 위한 미들웨어, 그리고 모바일 장치에서 동작하는 모바일 클라이언트로 구성되어 있다. 특히, 본 논문에서는 실험적 방법을 사용하여 HBR-tree와 실시간 GIS 엔진의 성능 평가 결과에 대해서도 기술하였다. 확보하며 이루어져야 가능하다. 여러 지자체를 중심으로 수행된 지자체 GIS 감리와 컨설팅의 경험을 통해 도출된 문제점들을 일반화시켜 정리하였으며, 이를 통해 지자체 GIS사업의 추진 및 운영모델을 제시하였다. 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수

  • PDF

확장 가능한 고가용 데이터베이스 클러스터에서 B+ 트리 색인의 온-라인 재조직 기법 (Online Reorganization of B+ tree in a Scalable and Highly Available Database Cluster)

  • 이충호;배해영
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.801-812
    • /
    • 2002
  • 온-라인 재조직 기법은 인터넷 환경과 같은 동적 환경에서 높은 가용성과 고성능을 제공하기 위한 비공유 데이터베이스 클러스터의 필수적인 기능이다. 기존의 온-라인 재조직 기법은 클러스터 안의 프로세싱 노드에 과부하가 생긴 경우, 과부하 노드의 데이터를 인접 노드로 빠르게 이동시킴으로써 부하 분배를 수행한다. 그러나 동시에 두개 이상의 다중 노드에 과부하가 발생된 경우, 부하 분배를 위해 인접 노드로 여러 번의 반복된 데이터 이동이 발생되고, 재조직 수행동안 시스템의 응답 속도가 늦어지는 문제점이 있다. 본 논문에서는 다중 노드에 발생한 과부하 문제를 빠르고 효율적으로 해결하는 향상된 $B^{+}$트리 색인의 온-라인 재조직 기법을 제안한다. 제안된 기법은 확장 가능한 데이터베이스 클러스터 환경 하에 온-라인 확장을 통해 새롭게 추가된 노드들에 데이터를 이동시킴으로써 데이터 이동의 회수를 줄이면서 빠른 시간 안에 온-라인 재조직을 수행하도록 한다. 또한 제안된 기법에서는 $B^{+}$-트리 색인 대신 캐시를 고려한 CS$B^{+}$-트리 색인을 이용하여 검색과 갱신 연산을 보다 빠르게 처리하도록 한다. 제안된 온-라인 재조직 기법은 확장 가능한 고가용 데이터베이스 클러스터 시스템으로 개발된 최대 결함허용 보장 데이터베이스 클러스터(Ultra Fault-Tolerant Database Cluster) 환경에서 성능 평가를 통해 기존 기법에 비해 빠르고 효율적임을 보인다.

시그내쳐 기반의 네트워크 침입 방지에서 고속의 패킷 필터링을 위한 시스템 구조 (A High-speed Packet Filtering System Architecture in Signature-based Network Intrusion Prevention)

  • 김대영;김선일;이준용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권2호
    • /
    • pp.73-83
    • /
    • 2007
  • 네트워크 침입 방지에서 공격 패킷은 시그내쳐에 기반을 둔 방법에 의해 발견되어 제거된다. 패턴 매칭(Pattem Matching)은 공격 시그내쳐를 발견하기 위해 광범위하게 사용되고 있고, 또한 네트워크 침입방지 시스템에서 시간적으로 가장 많이 수행되는 부분이다. 네트워크 침입방지 시스템에 사용되는 패턴 매칭은 주로 하드웨어를 사용하여 가속화되며 회선 속도로 수행되어야 한다. 그러나 이것만으로는 충분치 않고 다음과 같은 조건들이 더 요구된다. 첫째, 패턴 매칭 하드웨어는 패턴 인덱스 번호와 패턴 발견위치를 포함한 충분한 패턴 매칭 정보를 회선 속도에 맞게 제공해야 한다. 둘째, 불필요한 패턴 매칭을 줄이기 위한 패턴 그룹을 지원할 수 있어야 한다. 셋째, 패턴의 개수가 증가하더라도 최저 성능을 보장 할 수 있어야 한다. 마지막으로, 수행 중단 없이 몇분 또는 몇초 이내에 패턴 업데이트가 가능해야 한다. 본 논문에서는 위의 요구사항을 만족하는 시스템 구조를 제안한다. 이 시스템은 여러 개의 패턴 문자를 동시에 처리하고 파이프라인 구조를 사용하여 고속의 처리를 가능케 한다. Xilinx FPGA 시뮬레이션을 통해 제안된 시스템이 10Gbps 이상의 속도에서 동작하며 위의 모든 요구사항을 만족시킴을 보였다.

오차 신호의 비선형 변환을 이용한 Varying Step Size 방식의 SE-MMA 적응 등화 알고리즘의 성능 평가 (Performance Evaluation of SE-MMA Adaptive Equalization Algorithm with Varying Step Size based on Error Signal's Nonlinear Transform)

  • 임승각
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.77-82
    • /
    • 2017
  • 본 논문은 16-QAM과 같은 스펙트럼 효율적인 nonconstant modulus 신호 전송에서 채널에서 발생되는 찌그러짐에 의한 부호간 간섭을 보상하기 위한 SE-MMA (Signed Error-Multiple Modulus Algorithm) 블라인드 적응등화 알고리즘에서 오차 신호의 비선형성을 이용한 가변 적응 스텝 크기를 적용하여 등화 성능을 개선할 수 있는 VSS_SE-MMA (Varying Step Size_SE-MMA)에 관한 것이다. SE-MMA는 기존 MMA 적응 등화기의 탭 계수 갱신시 오차 신호의 극성만을 이용하므로서 연산량을 줄이기 위하여 등장하였으나 이로 인한 등화 성능이 열화되는 문제점이 있다. VSS_SE-MMA에서는 이와 같은 SE-MMA의 문제점을 개선하기 위해 오차 신호를 고려한 스텝의 크기를 변화시켜 적응 등화기의 탭 계수 갱신에 이용하므로서 이의 성능을 시뮬레이션을 통해 확인하였다. 이의 개선된 성능을 확인하기 위하여 등화기 출력 성상도, 잔류 isi, 최대 찌그러짐과 MSE, 채널의 신호대 잡음비에 따른 SER을 적용하였으며, 시뮬레이션 결과 VSS_SE-MMA 알고리즘이 SE-MMA보다 수렴 속도에서 거의 비슷하면서도 정상 상태에서 모든 성능 지수에서 개선됨을 확인하였다.