• 제목/요약/키워드: Text Detector

검색결과 29건 처리시간 0.025초

화재 예방을 위한 스마트 화재 감지기 시스템 (A Smart Fire Detector System for Fire Prevention)

  • 박차훈;강윤호;장민성;서희준;김윤민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.293-294
    • /
    • 2022
  • 본 프로젝트에서는 화재 발생 시 발견하기 어려운 곳이나 화재가 빈번한 곳에 구축하는 것을 목적으로 하고 있다. 가스와 불꽃을 감지하는 센서로 화재를 감지하고, 디스플레이와 LED 그리고 소리를 통해 화재발생을 알려준다. 그 후, 스프링클러가 작동하여 초기화재에 대응에 도움을 주고 119에 자동으로 신고가 된다. 일정 수치의 센서에 대한 감지 값을 인식하고 인식한 감지 값에 반응하여 화재 대처를 가능하게 구현하는 시스템을 제안한다. 감지센서를 통한 화재장소에서의 불꽃과 가스를 감지하게 되어 스프링클러가 1차적으로 화재의 번짐을 지연해 주고 은근 소방서에 자동적으로 신고를 하게 되는 자동화 프로그램 이행을 목표로 하고 있다.

  • PDF

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

중성자 핵반응에 의한 보론의 알파트랙 검출 (Detection of Alpha Tracks of Boron by Nuclear Reaction with Neutron)

  • 손세철;표형열;박용준;지광용;김원호
    • 분석과학
    • /
    • 제17권1호
    • /
    • pp.8-15
    • /
    • 2004
  • 수용액 시료에 포함된 미량의 보론 함량을 분석하는데 적합한 고체트랙 검출기를 선정하기 위하여 알파복합선원 등을 이용하여 검출능력을 비교 검토하였다. 보론의 알파트랙 검출에는 polycarbonate 재질(Lexan 및 CR-39)과 cellulose nitrate 재질(CN-85 및 LR-115))의 고체트랙 검출기를 사용하였다. 알파입자 방출물질로는 복합알파선원, 금속 우라늄 입자 및 보론 표준용액을 사용하였다. 본 연구에서는 에칭조건 및 중성자 조사조건 등에 따른 검출기의 특성을 비교하였으며, 실험 결과 보론 정량에는 CN-85 검출기가 가장 적합한 것을 알 수 있었다. 또한, 선정된 검출기를 이용하여 수용액 매질에 포함된 미량의 보론을 알파트랙 기입방법으로 측정한 실험결과에 대해 검토하였다.

문자-음성 합성기의 데이터 베이스를 위한 문맥 적응 음소 분할 (Context-adaptive Phoneme Segmentation for a TTS Database)

  • 이기승;김정수
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.135-144
    • /
    • 2003
  • 본 논문에서는 문-음성 합성기에서 사용되는 대용량 데이터 베이스의 구성을 목적으로 하는 음성 신호의 자동 분할기법을 기술하였다. 주된 내용은 은닉 마코프 모델에 기반을 둔 음소 분할과 여기서 얻어진 결과를 초기 음소 경계로 사용하여 이를 자동으로 수정하는 방법으로 구성되어 있다. 다층 퍼셉트론이 음성 경계의 검출기로 사용되었으며, 음소 분할의 성능을 증가시키기 위해, 음소의 천이 패턴에 따라 다층 퍼셉트론을 개별적으로 학습시키는 방법이 제안되었다. 음소 천이 패턴은 수작업에 의해 생성된 레이블 정보를 기준 음소 경계로 사용하여, 기준 음소 경계와 추정된 음소 경계간의 전체 오차를 최소화하는 관점에서 분할되도록 하였다. 단일 화자를 대상으로 하는 실험에서 제안된 기법을 통해 생성된 음소 경계는 기준 경계와 비교하여 95%의 음소가 20 msec 이내의 경계 오차를 갖는 것으로 나타났으며, 평균 자승 제곱근 오차면에서 수정 작업을 통해 25% 향상된 결과를 나타내었다.

고차 통계를 이용한 잡음 환경에서의 화자식별 (Speaker Identification Using Higher-Order Statistics In Noisy Environment)

  • 신태영;김기성;권영욱;김형순
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.25-35
    • /
    • 1997
  • 음성 신호 처리에 널리사용되어 온 2차 통계에 의한 음성 분석 방법은 잡음 환경에서 성능이 크게 저하되는 단점을 지닌다. 이에 반하여 고차 통계 방법은 Gaussian 잡음 등을 억제하는 특성을 가지고 있어서 잡음 환경에 상대적으로 강인한 음성 특징 추출을 가능하게 한다. 본 논문에서는 고차 통계에 의한 음성 분석 방법을 이용하여 백색 및 유색 잡음 환경에서의 문맥 독립형(text-independent) 화자식별 시스템을 제안하고, 기존의 2차 통계에 의한 방식과 성능을 비교하였다. 본 논문에서의 화자식별 시스템은 벡터 양자화 방법에 기반을 두고 있으며, 고차 통계 방법에 의한 유성음/무성음 판별을 통해 non-Gaussian 특징을 가지면서도 화자 정보가 집중되어 있는 유성음 부분에 대해서만 음성 특징을 추출하여 인식에 사용하였다. 50명의 화자를 대상으로 한 화자식별 실험 결과, 고차 통계 방법이 2차 통계에 의한 방법보다 잡음 환경에서 상대적으로 우수한 인식 성능을 나타냄을 확인하였다.

  • PDF

LED 통신기반 멀티 홉 무선 전송네트워크시스템 (LED Communication-based Multi-hop Wireless Transmission Network System)

  • 조승완;리데덩;안병구
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.37-42
    • /
    • 2012
  • LED는 빛을 내는 반도체 이다. 최근 친환경적 산업이 발전함에 따라 LED조명의 연구가 활발하게 진행되어 가고 있다. 특히 LED를 이용한 통신기법인 LED 통신에 대한 활발한 연구가 진행 중이다. 본 논문에서는 LED 통신 기반 멀티 홉 무선 전송네트워크시스템을 설계 구현하였다. 설계된 시스템은 LED를 이용한 송신부 회로, PD와 OP-Amp를 이용한 수신부 회로 및 멀티 홉 지원을 위해서 PD, OP-Amp 및 LED로 구성된 릴레이로 시스템이 구성된다. 설계된 시스템의 실험은 다음처럼 진행되었다. 송 수신부 양 끝단에 컴퓨터를 연결하고, 중간 노드로서 두 개의 릴레이를 송 수신 컴퓨터 사이에 연결한다. 그리고 텍스트 전송프로그램을 이용하여 텍스트를 연속적으로 전송하였다. 이때 보드 레이트, 전송거리 등 다양한 변화를 주면서 실험을 진행하였다.

옥외영상의 개선된 차량번호판 인식기술 (An Improved License Plate Recognition Technique in Outdoor Image)

  • 김병준;김동훈;이준환
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.423-431
    • /
    • 2016
  • 일반적으로 옥외영상에서의 자동차 번호판 인식은 인위적인 환경에서와는 다르게 기하학적으로 왜곡되어 있을 뿐만 아니라 조명 변화도 크기 때문에 단순환 문제가 아니다. 본 논문에서는 일반 CCTV 카메라로 옥외에서 촬영된 영상에서 자동차 번호판 인식을 위한 개선된 기술들을 제안한다. 먼저 다양한 특징을 상보적으로 사용하는 직렬구조의 다단계 Adaboost 검출기를 제안한다. 제안하는 검출기는 MB-LBP 및 Haar-like 특징을 사용하는 Adaboost 구조를 직렬로 연결하여 번호판 검출의 검출성능을 향상시켰다. 또한 검출된 번호판의 기하학적 왜곡을 보정하고 번호판의 타입을 먼저 결정하여 영상처리를 용이하게 하는 방법을 제안한다. 이런 방법은 그래이 변환, 문자/숫자 분리, 분리된 영상의 영상처리 등에서 사전지식 없이 전체 번호판 영상을 이용하는 경우보다 효율적이다. 본 논문에서 DBN(Deep Belief Network)를 문자/숫자 인식기로 사용하여 영상처리과정에서 기인한 획 손실이나 기울어짐 같은 기하학적인 왜곡에서도 강건한 인식률을 달성하였다.

H.263+ 협상모드들의 적응적 선택에 의한 성능개선 (Performance Improvement Using the Adaptive Selection of H.263+ Negotiable Option Modes)

  • 김강욱;황찬식;김남철;고종석
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1963-1970
    • /
    • 1999
  • H.263 권고안의 성능을 향상시키고 응용범위를 넓히기 위한 연구가 ITU-T LBC 그룹에서 계속 진행되고 있으며 그 대표적인 것이 H.263+이다. H.263는 기존의 H.263 권고안에 새로운 내용이 추가된 형태의 권고안이다. 본 논문에서는 H.263에 포함된 4개의 협상모드와 H.263+에 새롭게 포함된 5개의 모드를 합한 9개를 H.263+ 협상모드로 규정하고 이들을 영상 클래스별로 실험하여 각 모드의 특성을 분석하였으며 4가지 클래스가 혼합된 영상시퀀스에 대해 장면전환 검출기를 이용해서 9가지 협상모드를 적응적으로 사용하는 방안을 제안하였다. 제안한 방법을 사용한 경우 PSNR 측면에서 기본모드보다 1.6 dB, 협상모드를 고정적으로 사용한 것과 비교해서는 0.4∼1.0 dB 정도의 향상을 가져왔으며 비트효율 면에서도 기본모드보다 프레임당 278 비트, 고정적 협상모드 사용보다 2.6∼180 비트 정도의 감소를 가져왔다.

  • PDF

한국어 반어 표현 탐지기 (Korean Ironic Expression Detector)

  • 방승주;박요한;김지은;이공주
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.148-155
    • /
    • 2024
  • 자연어 처리 분야에서 반어 및 비꼼 탐지의 중요성이 커지고 있음에도 불구하고, 한국어에 관한 연구는 다른 언어들에 비해 상대적으로 많이 부족한 편이다. 본 연구는 한국어 텍스트에서의 반어 탐지를 위해 다양한 모델을 실험하는 것을 목적으로 한다. 본 연구는 BERT기반 모델인 KoBERT와 ChatGPT를 사용하여 반어 탐지 실험을 수행하였다. KoBERT의 경우, 감성 데이터를 추가 학습하는 두 가지 방법(전이 학습, 멀티태스크 학습)을 적용하였다. 또한 ChatGPT의 경우, Few-Shot Learning기법을 적용하여 프롬프트에 입력되는 예시 문장의 개수를 증가시켜 실험하였다. 실험을 수행한 결과, 감성 데이터를 추가학습한 전이 학습 모델과 멀티태스크 학습 모델이 감성 데이터를 추가 학습하지 않은 기본 모델보다 우수한 성능을 보였다. 한편, ChatGPT는 KoBERT에 비해 현저히 낮은 성능을 나타내었으며, 입력 예시 문장의 개수를 증가시켜도 뚜렷한 성능 향상이 이루어지지 않았다. 종합적으로, 본 연구는 KoBERT를 기반으로 한 모델이 ChatGPT보다 반어 탐지에 더 적합하다는 결론을 도출했으며, 감성 데이터의 추가학습이 반어 탐지 성능 향상에 기여할 수 있는 가능성을 제시하였다.