• 제목/요약/키워드: Real-time Segmentation

검색결과 267건 처리시간 0.026초

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

동영역 분할에 의한 고속 움직임 추정 부호화에 관한 연구 (A Study on the Fast Motion Estimation Coding by Moving Region Segmentation)

  • 이봉호;최경수;곽노윤;황병원
    • 대한전자공학회논문지SP
    • /
    • 제37권3호
    • /
    • pp.88-97
    • /
    • 2000
  • 본 논문은 영역분할 정보를 이용한 움직임 추정 기법을 제안하고자 한다 움직임 추정은 연산량이 매우 방대해서 소프트웨어적인 실시간 구현이 매우 어렵고 전용 칩을 사용하여 구현하고 있다 본 논문에서는 영역 분할 정보 및 가변 탐색 창 설정을 통해서 FSMA에 비해 연산량을 줄이는 영역 기반 움직임 추정 기법을 제안한다 둘째로, 분할된 영역 중 얼굴과 같은 의미를 갖는 영역을 선택적으로 부호화하기 위한 인식 기법을 제안하고자 한다 의미 영역 인식의 기본 취지는 화상 회의나 화상 전화와 같은 대체로 움직임이 적고 화자 중심으로 이루어진 영상에서 화자의 살색 영역 즉, 얼굴 영역을 우선 보호하여 주관적인 화질을 개선하자는 데에 있다.

  • PDF

시멘틱 세그멘테이션을 활용한 이미지 오브젝트의 효율적인 영역 추론 (Efficient Inference of Image Objects using Semantic Segmentation)

  • 임헌영;이유림;지민규;고명현;김학동;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.67-76
    • /
    • 2019
  • 본 연구에서는 다중 라벨링이 되어 있는 이미지 데이터를 대상으로 시멘틱 세그멘테이션을 활용한 효율적인 오브젝트별 영역 분류 기법을 연구한다. 이미지 데이터에 포함된 색상 정보, 윤곽선, 명암, 채도 등 다양한 픽셀 단위 정보와 프로세싱 기법뿐만 아니라 각 오브젝트들이 위치한 세부 영역을 의미 있는 단위로 추출하여 추론 결과에 반영하는 실험을 진행하고 그 결과에 대해 논의한다. 이미지 분류에서 훌륭한 성능을 검증받은 뉴럴 네트워크를 활용하여 비정형성이 심하고 다양한 클래스 오브젝트가 포함된 이미지 데이터를 대상으로 어떤 오브젝트가 어디에 위치하였는지 파악하는 작업을 진행한다. 이러한 연구를 기반으로 향후 다양한 오브젝트가 포함된 복잡한 이미지의 실시간 세부 영역 분류를 진행하는 인공지능 서비스 제공을 목표로 한다.

Research on Relay Selection Technology Based on Regular Hexagon Region Segmentation in C-V2X

  • Li, Zhigang;Yue, Xinan;Wang, Xin;Li, Baozhu;Huang, Daoying
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.3138-3151
    • /
    • 2022
  • Traffic safety and congestion are becoming more and more serious, especially the frequent occurrence of traffic accidents, which have caused great casualties and economic losses. Cellular Vehicle to Everything (C-V2X) can assist in safe driving and improve traffic efficiency through real-time information sharing and communication between vehicles. All vehicles communicate directly with Base Stations (BS), which will increase the base station load. And when the communicating vehicles are too far apart, too fast or there are obstacles in the communication path, the communication link can be unstable or even interrupted. Therefore, choosing an effective and reliable multi-hop relay-assisted Vehicle to Vehicle (V2V) communication can not only reduce the base station load and improve the system throughput but also expand the base station coverage and improve the communication quality of edge vehicles. Therefore, a communication area division scheme based on regular hexagon segmentation technology is proposed, a relay-assisted V2V communication mechanism is designed for the divided communication areas, and an efficient communication link is constructed by selecting the best relay node. Simulation results show that the scheme can improve the throughput of the system by nearly 55% and enhance the robustness of the V2V communication link.

Investigation of molten fuel coolant interaction phenomena using real time X-ray imaging of simulated woods metal-water system

  • Acharya, Avinash Kumar;Sharma, Anil Kumar;Avinash, Ch.S.S.S.;Das, Sanjay Kumar;Gnanadhas, Lydia;Nashine, B.K.;Selvaraj, P.
    • Nuclear Engineering and Technology
    • /
    • 제49권7호
    • /
    • pp.1442-1450
    • /
    • 2017
  • In liquid metal fast breeder reactors, postulated failures of the plant protection system may lead to serious unprotected accidental consequences. Unprotected transients are generically categorized as transient overpower accidents and transient under cooling accidents. In both cases, core meltdown may occur and this can lead to a molten fuel coolant interaction (MFCI). The understanding of MFCI phenomena is essential for study of debris coolability and characteristics during post-accident heat removal. Sodium is used as coolant in liquid metal fast breeder reactors. Viewing inside sodium at elevated temperature is impossible because of its opaqueness. In the present study, a methodology to depict MFCI phenomena using a flat panel detector based imaging system (i.e., real time radiography) is brought out using a woods metal-water experimental facility which simulates the $UO_2-Na$ interaction. The developed imaging system can capture attributes of the MFCI process like jet breakup length, jet front velocity, fragmented particle size, and a profile of the debris bed using digital image processing methods like image filtering, segmentation, and edge detection. This paper describes the MFCI process and developed imaging methodology to capture MFCI attributes which are directly related to the safe aspects of a sodium fast reactor.

역 원근 변환과 검색 영역 예측에 의한 실시간 차선 인식 (Real-Time Lane Detection Based on Inverse Perspective Transform and Search Range Prediction)

  • 정승권;김인수;김성한;이동활;윤강섭;이만형
    • 한국정밀공학회지
    • /
    • 제18권3호
    • /
    • pp.68-74
    • /
    • 2001
  • A lane detection based on a road model or feature all needs correct acquirement of information on the lane in an image. It is inefficient to implement a lane detection algorithm through the full range of an image when it is applied to a real road in real time because of the calculating time. This paper defines two (other proper terms including"modes") for detecting lanes on a road. First is searching mode that is searching the lane without any prior information of a road. Second is recognition mode, which is able to reduce the size and change the position of a searching range by predicting the position of a lane through the acquired information in a previous frame. It allows to extract accurately and efficiently the edge candidate points of a lane without any unnecessary searching. By means of inverse perspective transform which removes the perspective effect on the edge candidate points, we transform the edge candidate information in the Image Coordinate System(ICS) into the plan-view image in the World Coordinate System(WCS). We define a linear approximation filter and remove faulty edge candidate points by using it. This paper aims at approximating more correctly the lane of an actual road by applying the least-mean square method with the fault-removed edge information for curve fitting.e fitting.

  • PDF

다각근사법을 이용한 도로방향 결정 (Decision of Road Direction by Polygonal Approximation.)

  • 임영철;박종건;김의선;박진수;박창석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 B
    • /
    • pp.1398-1400
    • /
    • 1996
  • In this paper, a method of the decision of the road direction for ALV(Autonomous Land Vehicle) road following by region-based segmentation is presented. The decision of the road direction requires extracting road regions from images in real-time to guide the navigation of ALV on the roadway. Two thresholds to discriminate between road and non-road region in the image are easily decided, using knowledge of problem region and polygonal approximation that searches multiple peaks and valleys in histogram of a road image. The most likely road region of the binary image is selected from original image by these steps. The location of a vanishing point to indicate the direction of the road can be obtained applying it to X-Y profile of the binary road region again. It can successfully steer a ALV along a road reliably, even in the presence of fluctuation of illumination condition, bad road surface condition such as hidden boundaries, shadows, road patches, dirt and water stains, and unusual road condition. Pyramid structure also saves time in processing road images and a real-time image processing for achieving navigation of ALV is implemented. The efficacy of this approach is demonstrated using several real-world road images.

  • PDF

U-net 딥러닝 기법을 활용한 PVA 섬유 보강 시멘트 복합체의 섬유 분리 (Phase Segmentation of PVA Fiber-Reinforced Cementitious Composites Using U-net Deep Learning Approach)

  • 서지우;한동석
    • 한국전산구조공학회논문집
    • /
    • 제36권5호
    • /
    • pp.323-330
    • /
    • 2023
  • PVA 섬유 보강 시멘트 복합체는 매우 복잡한 미세구조를 가지고 있으며, 재료의 거동을 정확히 평가하기 위해서는 미세구조 특성을 반영하여 실제 실험과 시너지효과를 내며 효율적인 재료 설계를 가능하게 하는 해석 모델의 개발이 중요하다. PVA 섬유 보강 시멘트 복합체의 역학적 성능은 PVA 섬유의 방향성에 큰 영향을 받는다. 그러나 마이크로-CT 이미지로부터 얻은 PVA 섬유의 회색조 값을 인접한 상과 구분하기 어려워, 섬유 분리 과정에 많은 시간이 소요된다. 본 연구에서는 섬유의 3차원 분포를 얻기 위하여 0.65㎛3의 복셀 크기를 가지는 마이크로-CT 이미지 촬영을 수행하였다. 학습에 사용될 학습 데이터를 생성하기 위해 히스토그램, 형상, 그리고 구배 기반 상 분리 방법을 적용하였다. 본 연구에서 제안된 U-net 모델을 활용하여 PVA 섬유 보강 시멘트 복합체의 마이크로- CT 이미지로부터 섬유를 분리하는 학습을 수행하였다. 훈련의 정확도를 높이기 위해 데이터 증강을 적용하였으며, 총 1024개의 이미지를 훈련 데이터로 사용하였다. 모델의 성능은 정확도, 정밀도, 재현율, F1 스코어를 평가하였으며, 학습된 모델의 섬유 분리 성능이 매우 높고 효율적이며, 다른 시편에도 적용될 수 있음을 확인하였다.

학습 기반의 자동차 번호판 인식 시스템 (Learning-based approach for License Plate Recognition System)

  • 김종배;김갑기;김광인;박민호;김항준
    • 융합신호처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.1-11
    • /
    • 2001
  • 자동차 번호판은 조명과 카메라에 따라 영상에서 다양한 형태로 나타나고 영상내의 잡음으로 인해 알고리즘 방식으로 자동차 번호판을 인식하기가 쉽지 않다. 이러한 문제에 적합한 해결 방법으로 본 논문에서는 학습 기반의 자동차 번호판 인식 시스템을 제안한다. 제안한 시스템은 자동차 검출 모듈, 번호판 추출 모듈, 번호판 문자 인식 모듈로 구성된다 본 논문에서는 자동차 번호판 추출을 위해서 입력 영상의 잡음에 상대적인 영향이 적은 시간-지연 신경망(Time-Delay Neural Networks : TDNN)과 번호판 인식을 위해서 일반적인 신경망보다 일반화 성능이 뛰어난 서포트 벡터 머신(Support Vector Machines : SVMs)을 시스템에 적용한다. 주차장과 톨게이트에서 여러 시간대의 움직이는 자동차 영상들을 실험한 결과, 번호판 추출율은 97.5%, 번호판 문자 인식률은 97.2%의 성능을 내었고, 전체 시스템 성능은 947%이며 처리 시간은 약 1조 미만이다. 따라서 본 논문에서 제안한 시스템은 실세계에서 유용하게 적용될 수 있다.

  • PDF

Edge 검출과 Optical flow 기반 이동물체의 정보 추출 (Information extraction of the moving objects based on edge detection and optical flow)

  • 장민혁;박종안
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.822-828
    • /
    • 2002
  • 다제약 접근기반 OF(optical flow) 평가기술이 이동 물체의 인식에 자주 이용되고 있다. 그러나 OF 평가시간 뿐만 아니라 오차 문제로 인하여 사용이 제한되고 있다. 본 논문에서는 sobel 에쥐 검출과 다제약 접근기반 OF를 이용하여 효율적으로 움직임 정보를 추출하는 방법을 제안한다. 먼저 에쥐 검출 후 차영상과 영역분할기법으로 영상열 내 이동물체를 검출하고 임계치 처리로 잡음에 의해 검출된 이동물체들을 제거한다. 그리고 OF 최적 제약선을 찾기 위한 CHT와 Voting 누적을 적용한다. 이때 에쥐 검출과 영역분할을 이용함으로써 연속하는 영상열 내에서 이동 물체를 찾기 위한 CHT 계산시간을 현저히 줄이는 것이 가능하다. CHT 기반의 Voting은 최소자승법을 가미함으로써 오차 또한 감소시킨다. 그리고 제약선에 따른 수많은 점들을 계산하는 작업도 변환된 기울기-교점 파라미터를 사용함으로써 줄어들게 된다. 시뮬레이션 결과 영상 내에서 이동물체 인식비가 증가됨을 보였고 이동물체의 움직임 정보를 제공하는 OF 벡터도 매우 효율적으로 검출됨을 확인하였다.