• 제목/요약/키워드: 이미지 추출

검색결과 1,783건 처리시간 0.036초

위치적 연관성과 어휘적 유사성을 이용한 웹 이미지 캡션 추출 (Web Image Caption Extraction using Positional Relation and Lexical Similarity)

  • 이형규;김민정;홍금원;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.335-345
    • /
    • 2009
  • 이 논문은 웹 문서의 이미지 캡션 추출을 위한 방법으로서 이미지와 캡션의 위치적 연관성과 본문과 캡션의 어휘적 유사성을 동시에 고려한 방법을 제안한다. 이미지와 캡션의 위치적 연관성은 거리와 방향 관점에서 캡션이 이미지에 상대적으로 어떻게 위치하고 있는지를 나타내며, 본문과 캡션의 어휘적 유사성은 이미지를 설명하고 있는 캡션이 어휘적으로 본문과 어느 정도 유사한지를 나타낸다. 이미지와 캡션을 독립적으로 고려한 자질만을 사용한 캡션 추출 방법을 기저 방법으로 놓고 제안하는 방법들을 추가적인 자질로 사용하여 캡션을 추출하였을 때, 캡션 추출 정확률과 캡션 추출 재현율이 모두 향상되며, 캡션 추출 F-measure가 약 28% 향상되었다.

U-Net을 이용한 화염 Segmentation 추출기법 (Flame Segmentation Extraction Method using U-Net)

  • 유수빈;신영찬;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.391-394
    • /
    • 2023
  • 일반적으로 화재 감지 시스템은 정확하고 빠르게 화재를 감지하는 것은 어려운 문제 중 하나이다. 본 논문에서는 U-net을 활용하여 기존의 화재(불) 영역 추출 기법으로 Segmentation으로 보다 정밀하게 탐지하는 기법을 제안한다. 이 기법은 화재 이미지에서 연기제거 및 색상보정을 통해 이미지를 전처리하여 화염 영역을 추출한 뒤 U-Net으로 학습시켜 이미지를 입력하면 불 영역의 Segmentation을 추출하도록 한다.

  • PDF

코너 형태와 그레이스케일 히스토그램을 정제를 이용한 영상검색 (Image Retrieval using Gray Scale Histogram Refinement and Corner Shape)

  • 정일회;;박종안
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.380-383
    • /
    • 2008
  • 본 논문은 단순한 키워드 검색에서 발생하는 오차를 줄이기 위해 이미지의 코너정보와 그레이스케일 히스토그램 정제를 이용한 영상 검색 시스템을 구현하고자 한다. 먼저 원하는 이미지의 특정을 추출하는 단계와 추출된 특징을 분석하는 단계, 확보된 정보를 데이터베이스로부터 검색하는 단계, 그 결과 안에서의 그레이스케일 히스토그램 정제 방법으로 다시 재검색하는 단계, 마지막으로 정확한 정보 추출단계를 거치게 된다. 구현 알고리즘은 검색 단계에 있어서 크게 2단계로 나눠진다. 먼저 이미지를 에지로 변환 코너정보를 추출하는 단계, 코너 점의 픽셀을 3*3으로 나누어 RGB중의 픽셀의 합을 하는 단계, 그 코너 값을 데이터베이스와 비교하는 단계, 최대 500개까지의 추출된 이미지를 데이터베이스에 저장되는 단계로 이루어지며 다음 단계는 원 이미지를 그레이스케일로 변환 등질화하는 단계, 히스토그램 정보 획득하는 단계, 8*8 개의 빈으로 나누어 최대 색상정보 값을 추출하는 단계, 그리고 최대 색상정보 영역을 1단계 결과 값과 비교하여 정확한 검색을 얻는 단계로 구성되며 시뮬레이션 결과는 우수한 정확도를 보여 주고 있다.

  • PDF

tag 정보와 추출된 색 정보를 이용한 이미지 업로드 시스템의 설계 및 구현 (Implementation of Upload System Using Tag Information and Extracted Color Information)

  • 김명순;김용수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.645-648
    • /
    • 2010
  • 본 논문은 이미지를 검색하고자 할 때, 사용자에게 tag 정보와 이미지에서 추출된 색 정보를 이용하여 보다 정밀도를 검색 시스템을 제공하기 위하여 이미지를 업로드 할 때부터 tag 정보와 이미지에서 추출한 색 정보를 연결시켜 웹 데이터베이스에 업로드 하는 시스템을 제안한다. 현재 tag 정보에 대한 일관성 있고 표준화된 처리 방식에 대한 연구가 미비한 상황이다. 본 논문에서는 시스템을 통해 tag 정보의 재사용이 가능하게 한다. 이로써 본 논문에서 제시한 tag 정보와 추출한 색 정보를 이용한 이미지 업로드 시스템은 이미지 질의 처리를 통한 검색 시스템에서 tag 정보의 표준화에 대한 기초자료로써 활용 가능하며, 검색 효율 향상에 도움을 줄 것이다.

인식 영역의 추출과 이미지 개선을 통한 신용카드 전표 이미지 인식 (Recognition of Cardslip Images Using Extraction of ROI and Image Enhancement)

  • 박상은;강경원;최영우;김진형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.341-343
    • /
    • 2000
  • 본 논문은 신용카드 전표 이미지를 효과적으로 인식하기 위한 이미지의 분석 및 처리 방법을 제안한다. Histogram Matching 기법을 통하여 ROI를 추출함으로써 빠른 속도로 고급 전처리 방법을 적용할 수 있는 방법과 이미지 개선을 위한 필터의 조합 방법 및 ROI 내부에서 숫자열을 정확하게 추출하여 인식하는 방법을 제안하고 있다. 그리고 실제 전표 영상에 대하여 수행한 실험을 통하여 제안한 방법이 유효함을 보여준다.

  • PDF

칼라 공간과 형태 정보를 이용한 내용기반 이미지 검색 시스템의 설계 및 구현 (Daign and Implementation of Content-based Image Retrieval system using Color Spatial and Shape Information)

  • 반종오;강문주;최형진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.613-615
    • /
    • 2002
  • 최근 디지털 이미지 사용이 급속도로 증가함에 있어 자동적인 이미지 데이터 색인과 검색에 관한 연구가 증가하고 있는 추세이나 특정한 분야에 속하지 않은 일반 이미지를 대상으로 하는 연구는 아직까지 만족스럽지 못한 실정이다. 내용기반 이미지 검색은 대량의 일반 이미지 집합에서 사용자가 원하는 이미지를 효율적으로 찾아내는 시스템이며 이에 본 논문에서는 이미지의 색상과 형태의 특징 정보들을 추출하여 자동으로 색인하고 검색하는 새로운 시스템을 제안하였다. 특징 추출은 인간의 이미지 인식 과정에 기반하여 전체적인 정보와 세부적인 정보로 구분하여 수행하는 새로운 기법을 사용하였고 추출된 특징 정보들은 전역 칼라, 부분 영역 칼라, 전역 형태, 부분 영역 형태 정보로 구분되어 데이터베이스에 저장하였으며 유사도 검색 시에는 사용자가 검색 목적에 알맞은 가중치를 적용하여 이미지를 검색하도록 하였다.

  • PDF

JPEG 압축 이미지 내용 기반 검색 (Content Based Image Retrieval on JPEG Compressed Image)

  • 홍창배;송병호;심마로;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.259-261
    • /
    • 1998
  • 멀티미디어 데이터 중에서도 많은 부문의 응용에 사용되는 이미지 데이터의 내용 기반 검색에 대한 연구가 활발히 이뤄지고 있지만, 기조의 내용 기반 이미지 검색 대부분이 대상으로 삼고 있는 임지 포맷과는 달리 현재 이용되는 대부분의 이미지는 압축된 상태이다. 이미지 압축의 표준으로 사용되는 JPEG 압축 이미지에 대해서 압축 상태에서 특성을 추출하고 이를 검색에 이용하면 기존의 방법에 비해 압축을 해제하는 비용을 줄일 수 있고 블록 정보를 이용하는 장점을 가지게 된다. 본 논문에서는 JPEG 압축 이미지에서 블록 단위의 정보를 가진 특성으로 추출해내고 이를 사용한 이미지 검색 기법을 제안한다.

관성 센서 데이터를 활용한 3 DoF 이미지 스티칭 향상 (Enhancement on 3 DoF Image Stitching Using Inertia Sensor Data)

  • 김민우;김상균
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.51-61
    • /
    • 2017
  • 본 논문은 수평을 유지하여 촬영해야 한다는 기존 이미지 스티칭을 이용한 영상 정합 과정의 단점을 극복하기 위하여, 스마트폰의 가속도 센서와 자기장 센서 데이터를 사용하여 3가지 자유도(3 DoF)에 강인한 이미지 스티칭 방법을 제안한다. 이미지를 붙이는 작업인 이미지 스티칭은 크게 이미지 특징점 추출, 추출된 특징점에서 매칭에 필요한 참인 점(inlier)을 선별, 참인 점을 호모그래피(homography) 행렬로 변환, 호모그래피 행렬을 사용하여 이미지를 왜곡(warping), 왜곡된 이미지와 다른 이미지를 합하는 과정으로 이루어져 있다. 본 논문에서는 일반적으로 사용하는 SIFT, SURF 등의 알고리즘뿐만 아니라 MPEG에서 표준화한 MPEG-7 CDVS(Compact Descriptor for Visual Search) 표준의 특징점 추출 알고리즘을 사용하여 이미지의 특징점을 추출한다. 또한 각 알고리즘의 특징점 추출시간, 추출된 특징점 개수, 선별된 참인 점의 개수를 비교하고, 스티칭 정확도를 판단하여 본 연구에서 활용한 데이터에 어느 알고리즘이 효율적인지 살펴본다.

도메인 어댑테이션을 이용한 폰트 변화에 강인한 한글 분류기 개발

  • 박재우;이은지;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.50-53
    • /
    • 2019
  • 본 논문에서는 도메인 어댑테이션을 이용하여 폰트 변화에 강인한 한글 분류기를 학습하는 방법을 제안한다. 제안하는 네트워크 모델은 총 7 개로 이루어져 있으며 각각 이미지로부터 폰트에 무관한 정보를 추출하는 인코더, 추출된 정보의 유효성을 판단하기 위해 이미지 재합성에 사용되는 디코더, 재합성된 이미지의 글자 분류기, 폰트 분류기, 재합성된 글자의 정교함을 판단하는 판별기(discriminator), 그리고 인코더에서 추출된 정보에 대한 글자 분류기, 폰트 분류기이다. 본 논문에서는 적대적 생성 신경망의 학습법을 따르는 도메인 어댑테이션 기법을 이용하여 인코더의 추출 정보가 폰트 정보는 속이면서 글자 분류의 정확성은 높이도록 학습하였다. 학습 결과 인코더로부터 추출되는 정보들은 폰트에 무관한 성질을 지니면서 글자 분류에 높은 정확성을 띄었으며, 추가로 디코더에서 나오는 이미지들도 원본 폰트와 같은 이미지를 생성해 낼 수 있었다.

  • PDF

장면 이미지로부터 문자-에지 맵 특징을 이용한 텍스트 추출 (Text Extraction using Character-Edge Map Feature From Scene Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.139-142
    • /
    • 2006
  • 본 연구는 장면 이미지로부터 텍스트에 존재하는 문자-에지 특징을 이용하여 텍스트를 추출하는 방법을 제안한다. 캐니(Canny)에지 연산자를 이용하여 장면 이미지로부터 에지를 추출하고, 추출된 에지로부터 16종류의 에지-맵 생성한다. 생성된 에지 맵을 재구성하여 문자 특징을 갖는 8종류의 문자-에지 맵을 만단다. 텍스트는 배경과 잘 분리되는 특징이 있으므로 텍스트에 존재하는 '문자-에지 맵'의 특징을 이용하여 텍스트를 추출한다. 텍스트 영역에 대한 검증은 문자-에지 맵의 분포와 텍스트에 존재하는 글자간의 공백 특징으로 한다. 제안한 방법은 다양한 종류의 장면 이미지를 실험대상으로 하였고, 텍스트는 적어도 2글자 이상으로 구성된다는 제한조건과 너무 크거나 작은 텍스트는 텍스트 추출에서 제외하였다. 실험결과 텍스트 영역 추출률은 약 83%를 얻었다.

  • PDF