• 제목/요약/키워드: 이미지 인식기법

검색결과 386건 처리시간 0.029초

LaneNet 차선 인식과 Fuzzy 모터 제어를 기반으로 한 주행 시스템 연구 (A Study on LaneNet Lane Detection and Fuzzy Motor Control-Based Driving System)

  • 유호연;홍석인
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1175-1176
    • /
    • 2023
  • 전기차의 자율주행을 위해선 차선 인식과 모터 제어가 필요하다. 카메라로 입력된 영상에 허프 변환을 적용하고, 변환된 이진 이미지에 Enet 및 DeepLabv3+ 구조를 활용한 LaneNet 모델을 적용하여 차선을 학습시키고, Fuzzy 제어 기법을 활용하여 모터의 조향이 원활이 되도록 하였다. 기존의 Rule base 기법에 비하여 차선 인식 정확도가 월등히 향상되었으며, 주행 결과 Real-Time 주행환경 판단에 대한 여지를 남겼다.

상관도에 의한 실시간 안면 추출과 조명 평면을 이용한 영상 개선 (A Realtime Facial Region Extraction by Correlation and Image Enhancement Using illumination Plane)

  • 김도현;강동구;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.508-510
    • /
    • 2002
  • 본 연구에서는 실시간으로 얼굴을 인식, 검증하기 위한 전처리 단계로써 얼굴을 고속으로 추출하고 추출된 영상을 개선하기 위한 효율적인 기법들을 소개한다. 먼저 RGB로 획득되는 영상을 인간의 시각 구조와 유사한 HSI 컬러 모델로 변환하고 여기서 인간의 피부 영역에 해당하는 컬러 분포를 조사하여 대강의 얼굴 영역을 찾고 이 영역을 대상으로 두 개의 가변 템플릿과의 상관도(Correlation)를 이용하여 최적의 얼굴 안면을 찾는다. 보다 나은 얼굴 인식을 위하여 검출된 얼굴 안면 이미지에서 조명 평면(Illumination plane) 이미지를 추출하여 먼저 불균일성을 보정한 다음 평활화(Equalization)를 수행함으로써 영상을 개선한다.

  • PDF

컬러 이미지 화질 개선을 위한 Retinex 기반의 로그변환 기법 (Retinex-based Logarithm Transformation Method for Color Image Enhancement)

  • 김동형
    • 한국산학기술학회논문지
    • /
    • 제19권5호
    • /
    • pp.9-16
    • /
    • 2018
  • 광원 자체의 밝기가 낮거나 그림자 등의 이유로 어두운 영역을 포함하는 이미지는 Retinex 기반의 영상화질 개선기법을 통해 주관적 화질을 높일 수 있다. Retinex 이론은 인간의 시각 시스템이 장면을 인식할 때 특정 위치에서의 장면의 밝기를 인식하는 것이 아니라 주변과의 상대적인 밝기를 인식하는 특징을 적용한 방법으로 크게 SSR, MSR, MSRCR의 방법으로 나눌 수 있다. 제안하는 방법은 컬러복원단계를 포함하고 있는 MSRCR에 기반한 방법으로 크게 3단계로 구성되어 있다. 첫 번째 단계에서는 기존의 MSRCR 방법을 적용하고 두 번째 단계에서 MSRCR 출력의 동적 영역을 이미지의 히스토그램분포에 따라 조정한다. 마지막 단계에서는 인간의 시각특성을 고려한 로그변환함수를 이용하여 Retinex 출력 값을 디스플레이 동적영역으로 변환한다. 실험결과 제안하는 알고리즘은 전체적으로 어두운 이미지뿐만 아니라 밝은 영역과 어두운 영역을 모두 포함하는 이미지에서도 주관적 화질을 효과적으로 증가시키는 것을 볼 수 있다. 특히 낮은 밝기를 갖는 이미지의 경우 제안한 알고리즘은 기존의 방법들 보다 높은 성능향상을 보였다.

칩 사진 상의 와이어 인식 방법 (Wire Recognition on the Chip Photo based on Histogram)

  • 장경선
    • 전자공학회논문지
    • /
    • 제53권5호
    • /
    • pp.111-120
    • /
    • 2016
  • 칩 상에서 연결을 담당하는 와이어의 인식은 칩 역공학에서 가장 중요한 부분 중 하나이다. 칩 사진에서 인식된 와이어는 칩 회로의 논리 수준 또는 기능 수준 표현을 복원하는데 사용된다. 기존의 칩 역공학에서 주로 사용되는 수작업에 의한 와이어 인식은 정확한 결과를 제공하지만, 한 칩이나 블록에 속한 와이어의 수가 수십 만개 또는 그 이상이 될 경우 너무 많은 시간이 걸리는 단점이 있다. 칩 상의 와이어는 그 재료에 따라 특정한 밝기나 색상 특성을 가지고 있다. 따라서, 본 논문에서는 칩 사진에 나타나는 영역의 밝기나 색상 특성을 이용하여 와이어 여부를 판단하는 2단계 방법을 제안한다. 즉, 이미지 이진화 과정과 이진 이미지에 나타나는 영역에 대한 와이어 여부를 판단하는 과정으로 이루어진다. 활용되는 기법들은 기존에 제안된 기법들을 이용한다. 둘째 단계에서, 와이어 영역의 특성을 지정해주기 위해서 사용자는 특정 와이어 영역을 선택하는 과정을 수행해야 한다. 선택된 와이어 영역의 히스토그램 특성은 다른 영역과의 히스토그램 유사도를 계산하는 데 사용된다. 첫 번째 실험은, 기존에 제안된 몇 가지 이미지 이진화 기법 중에서 둘째 단계를 위해 적절한 한 가지 기법을 선택하기 위한 것이다. 와이어 영역 판별 방법에 대한 둘째 실험은, 실험적으로 비교 가능한 기존 방법이 없는 관계로, 본 논문에서 제안하는 그레이 스케일 또는 HSV 컬러를 이용하는 히스토그램 유사도 비교 방법 세 가지에 대한 비교 실험 결과를 제시한다. 제일 성능이 좋은 방법은, 와이어 영역으로 판단한 영역이 진짜 와이어 영역인 비율이 98% 이상임을 확인하였다.

도로 상 차량 번호판 검출을 위한 효율적인 윈도우 슬라이딩 기법 (An Efficient Window Sliding Method for On-road Vehicle License Plate Detection)

  • 모홍철;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.450-453
    • /
    • 2011
  • 고화질의 디지털 카메라 및 스마트폰, 감시용 카메라의 보급 등으로 인해 최근 패턴 인식 및 이미지 프로세싱 분야에서 고화질의 이미지 및 비디오를 처리해야 하는 경우가 많아지고 있다. 특히 차량 번호판 감지 등과 같은 객체 인식 분야의 경우, 고화질의 이미지로 인해 그만큼 인식에 필요한 계산 비용이 증가하게 되었는데 따라서 이러한 계산 비용을 효율적으로 줄이기 위한 기법이 요구되고 있다. 또한 기존의 차량 번호판 감지의 도메인과는 다르게 도로 상에서의 실시간 차량 번호판 감지의 필요성이 대두되고 있기에 본 논문에서는 도로 상에서의 실시간 번호판 감지 시스템을 위한 차량 번호판 주변정보 기반의 효율적인 윈도우 슬라이딩(window sliding) 방법을 제안한다. 본 논문의 시스템은 총 3단계로, (1) SVM(Supported Vector Machine) 을 통한 차량 번호판 주위 정보에 대한 학습, (2) 도로 상의 번호판 위치 확률 모델링을 통한 탐색 공간의 감소, (3) $context_{plate}$분류기를 통한 OCS(operator context scanning)의 수행이다. 이와 같은 $context_{plate}$분류기와 OCS를 통해 번호판 검출을 위한 윈도우 슬라이딩의 수가 크게 줄었음을 알 수 있었으며, 또한 번호판의 정보를 건너뛰지 않고, 신뢰성 있게 접근함을 알 수 있었다.

조명영향 분리 얼굴 고유특성 텍스쳐 부분공간 기반 얼굴 이미지 조명 정규화 (Face Illumination Normalization based on Illumination-Separated Face Identity Texture Subspace)

  • 최종근;정선태;조성원
    • 대한전자공학회논문지SP
    • /
    • 제47권1호
    • /
    • pp.25-34
    • /
    • 2010
  • 다양한 조명 환경에서 강인한 얼굴 인식 성취는 어렵다. 조명에 강인한 얼굴 인식을 위해서 보통 전처리 단계로 얼굴 이미지 조명 정규화를 수행한다. 기존 조명 전처리 기법들은 투영 음영을 효과적으로 처리할 수 없다. 본 논문에서는 조명 영향 분리 얼굴 고유특성 텍스쳐 부분공간에 기반한 새로운 얼굴 조명 정규화 기법을 제안한다. 조명분리 얼굴 고유특성 텍스쳐 부분 공간은 얼굴 텍스쳐 공간에서 조명 변화 영향이 분리된 부분공간으로 구축되기 때문에 얼굴 이미지를 이 부분공간으로 투영하여 얻은 얼굴 이미지는 조명 변화 영향이 최소화된 좋은 조명 정규화를 달성한다. 실험을 통해 본 논문에서 제안한 얼굴 조명정규화 기법이 표면 음영뿐만 아니라 투영 음영도 효과적으로 제거할 수 있으며, 좋은 얼굴 조명 정규화를 달성한다는 것을 확인하였다.

심플 프레임 마커: 마커 내부 이미지 및 문자 패턴의 인식 및 추적 기법 구현 (Simple Frame Marker: Implementation of In-Marker Image and Character Recognition and Tracking Method)

  • 김혜진;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.558-561
    • /
    • 2009
  • 본 논문에서는 증강현실에서 마커에 포함된 이미지뿐만 아니라 문자 인식을 지원하기 위한 심플 프레임 마커를 제안한다. 마커 내부에 임의의 패턴 대신에 문자를 삽입하고 문자 인식 알고리즘(Optical Character Recognition)을 사용하여 인식하면 실행 전 학습과정이 필요 없을 뿐만 아니라 문자의 친숙함 때문에 시각적 장애요인도 줄일 수 있다. 따라서 기존의 마커 방식인 이미지뿐만 아니라 문자도 인식하기 위해서 제안된 심플 프레임 마커는 정의된 마커의 가로세로 비율에 따라 이미지타입의 마커(Square SFMarker)인지 문자타입의 마커(Rectangle SFMarker)인지를 구별하고 각기 다른 인식 알고리즘을 적용한다. 또한 문자 인식을 위한 전처리 과정을 줄이기 위해 디자인 단계에서 마커 테두리에 방향정보를 삽입하고, 인식 단계에서는 이 방향 정보를 추출하여 문자 인식을 빠르고 정확하게 수행한다. 마지막으로 매 프레임 문자를 인식하는 알고리즘을 수행 시 추적 속도가 저하되므로, 프레임간 변화량이 적을 때는 이전 프레임의 인식 결과 정보를 사용하여 수행 속도를 높인다.

  • PDF

하수관망관리의 자동화 및 전략적 관리계획 (Strategic Management Planning for Sanitary Sewer Infrastructure)

  • 채명진
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2004년도 제5회 정기학술발표대회 논문집
    • /
    • pp.163-169
    • /
    • 2004
  • 최근의 발전된 컴퓨터 기술과 로보틱스 기술을 이용하여 지하매설된 인프라 (주로 상하수도 관망)를 관측하기 위한 방법들이 발전되어 왔다. 이 논문은 하수관망 관리에 관한 첨단 장비들과 데이타 처리에 관한 기법들, 그리고 궁극적으로 하수관망의 효율적 관리에 관한 개념을 정리 하고 있다. 원격조정되는 디지탈 카메라와 이미지 처리 기법, 인공지능 시스템, 그리고 하수관망의 노화예측모델로 본 논문이 구성되어있다.

  • PDF

N-grams를 사용한 CNN 기반의 악성코드탐지 기법 연구 (Malware Detection Based on CNN with N-grams)

  • 허정원;문봉교
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.431-434
    • /
    • 2020
  • 본 논문에서는 악성코드탐지 기법으로 n-grams를 사용한 특징 추출을 통해 이미지 인식 분야에서 널리 쓰이는 Convolutional Neural Network로 학습하는 프레임워크를 제안한다. 윈도우즈 실행 파일의 PE 포맷에서 특징을 추출하여 6-grams 확률을 구하고 grayscale 을 통해 이미지로 변환한다. 이것을 기존에 연구된 탐지방법과 비교하여 우수함을 보인다. 학습에 사용된 데이터는 총 55,000개로 5-folds 교차검증을 하였으며 예측 정확도는 98.87%였다.

다차원 데이터의 동적 얼굴 이미지그래픽 표현 (Representation of Dynamic Facial ImageGraphic for Multi-Dimensional)

  • 최철재;최진식;조규천;차홍준
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권10호
    • /
    • pp.1291-1300
    • /
    • 2001
  • 이 논문은 실시간 변화가 가능한 동적 그래픽스를 기반하며, 인간의 감성적 인식을 위해서 이미지 영상을 다차원 데이터의 그래픽 요소로 조작하는 시각화 표현 기법으로 연구되었다. 이 구현의 중요한 사상은 사람의 얼굴 특징 점과 기존의 화상 인식 알고리즘을 바탕으로 획득한 모수 제어 값을 다차원 데이터에 대응시켜 그 변화하는 수축 표정에 따라 감성 표현의 가상 이미지를 생성하는 이미지그래픽으로 표현한다. 제안된 DyFIG 시스템은 감성적인 표현을 할 수 있는 얼굴 그래픽의 모듈을 제안하고 구현하며, 조작과 실험을 통해 감성 데이터 표현 기술과 기법이 실현 가능함을 보인다.

  • PDF