• 제목/요약/키워드: Feature analyze

검색결과 826건 처리시간 0.027초

입술 움직임 영상 선호를 이용한 음성 구간 검출 (Speech Activity Detection using Lip Movement Image Signals)

  • 김응규
    • 융합신호처리학회논문지
    • /
    • 제11권4호
    • /
    • pp.289-297
    • /
    • 2010
  • 본 논문에서는 음성인식을 위한 음성구간 검출과정에서 유입될 수 있는 동적인 음향에너지 이외에 화자의 입술움직임 영상신호까지 확인함으로써 외부 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위한 한 가지 방법이 제시된다. 우선, 연속적인 영상이 PC용 영상카메라를 통하여 획득되고 그 입술움직임 여부가 식별된다. 다음으로, 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세서와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서 공유메모리에 저장되어진 데이터를 확인함으로써 화자의 발성에 의한 음향에너지인지의 여부가 입증된다. 최종적으로, 음성인식기와 영상처리기를 연동시켜 실험한 결과, 영상카메라에 대면해서 발성하면 음성인식 결과의 출력에 이르기까지 연동처리가 정상적으로 진행됨을 확인하였고, 영상카메라에 대면치 않고 발성하면 연동처리시스템이 그 음성인식 결과를 출력치 못함을 확인하였다. 또한, 오프라인하의 입술움직임 초기 특정값 및 템플릿 초기영상을 온라인하에서 추출된 입술움직임 초기특정값 및 템플릿 영상으로 대체함으로써 입술움직임 영상 추적의 변별력을 향상시켰다. 입술움직임 영상 추적과정을 시각적으로 확인하고 실시간으로 관련된 패러미터를 해석하기 위해 영상처리 테스트베드를 구축하였다, 음성과 영상처리 시스템의 연동결과 다양한 조명환경 하에서도 약 99.3%의 연동율을 나타냈다.

에너지신산업을 위한 에너지 빅데이터 전처리 시스템 (Energy Big Data Pre-processing System for Energy New Industries)

  • 양수영;김요한;김상현;김원중
    • 한국전자통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.851-858
    • /
    • 2021
  • 재생에너지 및 분산자원의 증가로 에너지신산업에서는 전통적인 데이터뿐만 아니라 다양한 에너지 관련 데이터들이 생성되고 있다. 즉 다양한 재생에너지 설비와 발전 데이터, 계통 운영 데이터, 계량 및 요금 관련 데이터뿐만 아니라 새로운 서비스와 분석을 위해 필요한 기상 및 에너지 효율화 데이터 등이 있다. 에너지 빅데이터 처리 기술은 분산자원, 계통, AMI(: Advanced Metering Infrastructure)를 포함한 전력 생산·소비 인프라의 전반기에서 발생하는 데이터를 체계적으로 분석 ·진단할 수 있다. 이를 통해 ICT(: Information and Communications Technology)산업과 에너지 산업 간 융복합의 새로운 비즈니스 창출을 지원하는 기술이 될 수 있을 것이다. 이를 위해서 수집된 데이터의 항목별 특성 분석 및 연관관계 표본 추출과 각 특징들의 범주화 및 요소 정의 등 데이터 분석 시스템에 대한 연구가 필요하다. 또한 데이터의 손실 및 이상 상태 처리를 위한 데이터 정제 기술에 대한 연구가 이루어져야 한다. 그리고 에너지 데이터를 실시간으로 저장 및 관리할 수 있도록 Apache NIFI, Spark, HDFS(: Hadoop Distributed File System)에 대한 개발 및 구축이 필요하다. 본 연구에서는 위와 같은 다양한 전력거래를 위한 전반적인 에너지 데이터 처리 기술과 시스템를 제안하였다.

산업용 IoT 환경을 위한 고성능 키-값 저장소의 설계 및 평가 (Design and Evaluation of a High-performance Key-value Storage for Industrial IoT Environments)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.127-133
    • /
    • 2021
  • 산업용 IoT 환경에서 센서들은 감지하고 있는 대상의 데이터들을 연속으로 생성하며, IoT 게이트웨이에 전달한다. 따라서 대량의 실시간 센서 데이터를 관리하는 것은 IoT 게이트웨이에 필수적인 기능이며 이러한 센서 데이터를 관리하기 위해 키-값 스토리지 엔진들이 널리 사용되고 있다. 그러나 IoT 게이트웨이에 사용되는 키-값 스토리지 엔진들은 산업용 IoT 환경에서 생성되는 센서 데이터들의 특징을 고려하지 않고 있으며 이 때문에 제한된 성능을 보인다. 본 논문에서는 산업용 IoT 환경에서 센서 데이터의 특징을 활용하여 키-값 스토리지 엔진을 최적화한다. 제안하는 최적화 기법은 키-값 스토리지 엔진의 입력인 키를 분리하여 계층적인 색인화 작업을 하는 것이다. 이를 통해 과도하게 발생하는 쓰기 증폭을 줄이며 성능을 향상 시킬 수 있다. 이러한 최적화 기법을 LevelDB에 구현하였으며, 제안하는 기법을 평가하기 위해 TPCx-IoT의 워크로드를 사용했다. 실험 결과에 따르면 제안하는 기법의 성능은 기존의 방법보다 21배 더 좋으며 이는 제안하는 기법이 산업용 IoT 환경에서 데이터 수집을 고속으로 처리할 수 있음을 보인다.

Protein molecular structure, degradation and availability of canola, rapeseed and soybean meals in dairy cattle diets

  • Tian, Yujia;Zhang, Xuewei;Huang, Rongcai;Yu, Peiqiang
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권9호
    • /
    • pp.1381-1388
    • /
    • 2019
  • Objective: The aims of this study were to reveal the magnitude of the differences in protein structures at a cellular level as well as protein utilization and availability among soybean meal (SBM), canola meal (CM), and rapeseed meal (RSM) as feedstocks in China. Methods: Experiments were designed to compare the three different types of feedstocks in terms of: i) protein chemical profiles; ii) protein fractions partitioned according to Cornell Net Carbohydrate and Protein System; iii) protein molecular structures and protein second structures; iv) special protein compounds-amino acid (AA); v) total digestible protein and energy values; vi) in situ rumen protein degradability and intestinal digestibility. The protein second structures were measured using FT/IR molecular spectroscopy technique. A summary chemical approach in National Research Council (NRC) model was applied to analyze truly digestible protein. Results: The results showed significant differences in both protein nutritional profiles and protein structure parameters in terms of ${\alpha}-helix$, ${\beta}-sheet$ spectral intensity and their ratio, and amide I, amide II spectral intensity and their ratio among SBM, CM, and RSM. SBM had higher crude protein (CP) and AA content than CM and RSM. For dry matter (DM), SBM, and CM had a higher DM content compared with RSM (p<0.05), whereas no statistical significance was found between SBM and CM (p = 0.28). Effective degradability of CP and DM did not demonstrate significant differences among the three groups (p>0.05). Intestinal digestibility of rumen undegradable protein measured by three-step in vitro method showed that there was significant difference (p = 0.05) among SBM, CM, and RSM, which SBM was the highest and RSM was the lowest with CM in between. NRC modeling results showed that digestible CP content in SBM was significantly higher than that of CM and RSM (p<0.05). Conclusion: This study suggested that SBM and CM contained similar protein value and availability for dairy cattle, while RSM had the lowest protein quality and utilization.

디지털 사진기록물 관리를 위한 Raw 이미지 파일 포맷의 도입에 관한 연구 (A Study on the Introduction of Raw Image File Formats for the Management of Digital Photographic Records)

  • 박준영;이명규
    • 한국기록관리학회지
    • /
    • 제19권3호
    • /
    • pp.155-178
    • /
    • 2019
  • 이 연구의 목적은 Raw 이미지 파일 포맷의 특성과 문제점을 분석하고, 디지털 사진기록물 관리에 적합한지 평가하고, 공공기관에서 Raw 이미지 파일 포맷을 활용하기 위한 도입 방안을 제시하는 것이다. Raw 이미지 파일 포맷은 적용된 이미지 편집을 되돌릴 수 있는 가역성과 편집자의 의도를 효과적으로 반영할 수 있는 유연성을 지닌다. 하지만 Raw 이미지 파일 포맷의 대다수가 디지털카메라 제조업체에 종속된 독점 파일 포맷이라는 문제가 있다. Raw 이미지 파일 포맷을 표준화하기 위해 개발된 DNG 포맷은 해외 공공기관에서 긍정적인 평가를 받고 있다. 그러나 공식 표준 혹은 사실상 표준으로 완전히 인정받지 못했다는 한계가 있어 표준 Raw 포맷이 등장하기까지 잠정적으로 활용하는 것이 적합하다. 한편, 대검찰청에서 포맷 변환한 디지털 사진 파일을 법적 진본성을 가진 원본으로 인정하지 않는다는 문제가 있다. 따라서 단기적으로는 포맷 변환하여 생성한 DNG 파일과 원본 Raw 파일을 캡슐화하여 병행 보존하고, 장기적으로는 포맷 변환하여 생성한 DNG 파일만으로 법적 진본성을 인정받을 수 있도록 디지털 사진기록물의 해시값과 파일 크기 기준 시점을 재정의할 필요가 있다.

용어 사전의 특성이 문서 분류 정확도에 미치는 영향 연구 (Analyzing the Effect of Characteristics of Dictionary on the Accuracy of Document Classifiers)

  • 정해강;김남규
    • 경영과정보연구
    • /
    • 제37권4호
    • /
    • pp.41-62
    • /
    • 2018
  • 다양한 소셜 미디어 활동과 인터넷 뉴스 기사, 블로그 등을 통해 유통되는 비정형 데이터의 양이 급증함에 따라 비정형 데이터를 분석하고 활용하기 위한 연구가 활발히 진행되고 있다. 텍스트 분석은 주로 특정 도메인 또는 특정 주제에 대해 수행되므로, 도메인별 용어 사전의 구축과 적용에 대한 중요성이 더욱 강조되고 있다. 용어 사전의 품질은 비정형 데이터 분석 결과의 품질에 직접적인 영향을 미치게 되며, 분석 과정에서 정제의 역할을 수행함으로써 분석의 관점을 정의한다는 측면에서 그 중요성이 더욱 강조된다. 이렇듯 용어 사전의 중요성은 기존의 많은 연구에서도 강조되어 왔으나, 용어 사전이 분석 결과의 품질에 어떤 방식으로 어떤 영향을 미치는지에 대한 엄밀한 분석은 충분히 이루어지지 않았다. 따라서 본 연구에서는 전체 문서에서의 용어 빈도수에 기반을 두어 사전을 구축하는 일괄 구축 방식, 카테고리별 주요 용어를 추출하여 통합하는 용어 통합 방식, 그리고 카테고리별 주요 특질(Feature)을 추출하여 통합하는 특질 통합 방식의 세 가지 방식으로 사전을 구축하고 각 사전의 품질을 비교한다. 품질을 간접적으로 평가하기 위해 각 사전을 적용한 문서 분류의 정확도를 비교하고, 각 사전에 고유율의 개념을 도입하여 정확도의 차이가 나타나는 원인을 심층 분석한다. 본 연구의 실험에서는 5개 카테고리의 뉴스 기사 총 39,800건을 분석하였다. 실험 결과를 심층 분석한 결과 문서 분류의 정확도가 높게 나타나는 사전의 고유율이 높게 나타남을 확인하였으며, 이를 통해 사전의 고유율을 높임으로써 분류의 정확도를 더욱 향상시킬 수 있는 가능성을 발견하였다.

조리실습과목 학습부진 대학생의 기초실무능력향상 프로그램을 통한 액션러닝 적용 효과 (Study on the Effect of Action Learning Application through Basic Practical Skills Improvement Program of Underachievers College Student of Cooking Practice Subject)

  • 김양훈
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.454-462
    • /
    • 2021
  • 본 연구의 목적은 조리전공 대학생을 대상으로 기초조리실습과목의 학습부진 학습자를 도출하여 기초실무능력향상 프로그램을 운영함과 동시에 액션러닝 교수법을 적용하였다. 또한 Q방법론을 사용하여 학습자들의 주관적이 인식을 분석하고자 하였으며, 이를 통해 학습자의 조리연수, 현장실습, 취업 등과 연계되는 실무관련 프로그램 운영에 대한 전공역량을 향상하고자 하였다. 조사기간은 2020년 5월1일부터 20일까지 C대학 조리전공 1학년 재학생을 대상으로 진행하였다. 분석결과 총 3가지의 유형이 도출되었으며, 그 특이성에 따라 제1유형(N=7) : 자기주도학습효과 유형 (Self-directed learning effect type), 제 2유형(N=8): 문제해결능력효과 유형 (Problem Solving Effect Types), 제3유형(N=6): 동료학습효과 유형 (Peer learning effect type)으로 각 각 독특한 특징의 유형으로 분석되었다. 본 연구의 진행과 시사점 도출을 통해 조리 관련 학과에서의 프로그램 운영 및 실무관련 교수학습방법 적용에 유용한 자료가 될 것으로 기대한다.

Performance Analysis of Trading Strategy using Gradient Boosting Machine Learning and Genetic Algorithm

  • Jang, Phil-Sik
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.147-155
    • /
    • 2022
  • 본 연구에서는 그래디언트 부스팅 기계학습과 유전 알고리즘을 이용하여 일별 주식 포트폴리오를 동적으로 구성하는 시스템을 구축하고 트레이딩 시뮬레이션을 통해 성능을 분석하였다. 이를 위해 유가증권시장과 코스닥시장에 상장된 종목들의 가격 데이터 및 투자자별 거래정보를 포함한 다양한 데이터를 수집하고, 전처리 과정과 변수가공을 통해 학습-예측에 이용될 변수들을 생성하였다. 첫 번째 실험에서는 예측정확도와 정밀도, 재현율 및 F1 점수 등 네 가지 지표를 활용하여 그래디언트 부스팅 기법들(XGBoost, LightGBM, CatBoost)의 성능을 비교 평가하였다. 두 번째 실험에서는 전 단계에서 선택된 LightGBM과 유전 알고리즘을 적용하여 상장 종목들의 일별 수익 여부를 학습-예측하였다. 그리고 예측된 수익 발생확률을 바탕으로 종목을 선별하여 트레이딩 시뮬레이션을 시행하고, CAGR, MDD, 사프지수 및 변동성 측면에서 코스피, 코스닥 지수와의 성능을 비교 평가하였다. 분석 결과, 제안된 전략들 모두 네 가지 성능평가 지표상에서 시장 평균을 넘어서는 것으로 나타났으며, 그래디언트 부스팅과 유전 알고리즘의 결합이 주식 가격 예측에 효과적으로 이용될 수 있음을 보여주었다.

컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마 설계 (Design of Standard Metadata Schema for Computing Resource Management)

  • 이미경;조민희;송사광;임형준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.433-435
    • /
    • 2022
  • 본 논문에서는 국가연구데이터커먼즈에서 연구데이터 분석·활용에 사용되는 컴퓨팅 리소스를 등록, 검색, 관리하기 위한 컴퓨팅 리소스 표준 메타데이터 스키마 설계 방안에 대해 소개한다. 국가연구데이터커먼즈는 연구데이터 공유·활용 극대화를 위한 연구데이터와 컴퓨팅 리소스 연합 활용 체계이다. 컴퓨팅 리소스는 연구 전 과정에서 사용하는 연구데이터를 분석·활용하는데 필요한 분석 인프라, 분석 소프트웨어 등 컴퓨팅 환경의 모든 리소스들을 말한다. KRDC 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 관리를 위한 공통 필수 속성과 각 컴퓨팅 리소스 특징에 따른 속성을 고려하여 설계하였다. 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 메타데이터 스키마와 컴퓨팅 리소스 제공자 메타데이터 스키마로 구성된다. 또한, 컴퓨팅 리소스와 제공자의 메타데이터 스키마는 성격에 따라 서비스 스키마와 시스템 스키마 그룹으로 구분하여 설계하였다. 표준 메타데이터 스키마는 KRDC 프레임워크를 통해 컴퓨팅 리소스 제공자와 컴퓨팅 리소스 사용자를 위한 컴퓨팅 리소스 등록, 카탈로그 검색, 컴퓨팅 리소스 관리, 워크플로우 서비스에 사용되며, 다양한 컴퓨팅 리소스 연계를 위해 확장 가능한 형태로 설계되었다.

  • PDF

강우로 인한 철도 연변사면의 활동분석 : 실내모형실험 (Analysis on the Rainfall Driven Slope Failure Adjacent to a Railway : Flume Tests)

  • 사공명;김민석;김수삼;이인용
    • 한국지반공학회논문집
    • /
    • 제22권5호
    • /
    • pp.83-91
    • /
    • 2006
  • 최근 지구온난화현상으로 인해 발생하는 국지성 호우는 철도 연변사면 활동 및 활동 토체로 인한 선로매몰 그리고 선로유실 등의 불안정성을 초래하는 요인으로 대두되고 있다. 강우로 인한 사면의 거동에 대한 현장조사 결과 토층의 두께 및 사면의 형태적 특성 등에 따라 서로 다른 활동특성이 관측되었다. 이와 같은 활동특성을 천층 활동타입, 중간층 활동타입, 우곡부 활동타입, 암반 경계부 활동타입 4가지로 분류하였다. 이러한 관측과 관련하여 각 타입의 활동메커니즘을 규명하고 강우시 사면의 거동특성을 분석하고자 실내모형실험을 수행하였다. 실내모형실험은 미립분함량, 초기함수비, 경사각, 다짐에너지를 고정 변수로 취하고 토피고, 강우강도, 사면표면의 형태를 변화시키는 조건으로 수행되었다. 실내모형실험의 결과 천층 활동은 주로 표층에서 발생하며 침식에 의한 활동임을 알 수 있었다. 또한 초기 침식이 상대적으로 다른 활동타입에 비해서 늦게 발생하였으나 침식의 진행은 빨랐다. 우곡부 활동타입은 우곡부로 집수된 빗물로 인하여 침식 정도가 더 심하게 진행되었으며 사면내 위치하는 전석이 드러날 정도였다. 전석층까지 침식이 발생한후 전석의 존재로 인하여 추가적인 침식이 상대적으로 그 이전보다 느리게 발생하였다. 암반 경계부 활동타입의 경우 본 실험에서 가장 빨리 초기 활동 발생이 관측되었다. 각 활동타입에서 공통적으로 관측된 사항은 사면의 하단부에서 초기 변형이 관측되었으며 이러한 관측은 사면내 침투수의 사면방향의 흐름을 의미한다.