• 제목/요약/키워드: Intelligent Character System

검색결과 97건 처리시간 0.023초

항만 야드 자동화크레인(ATC)에서 효율적인 컨테이너번호 인식시스템 개발 (Implementation of Efficient Container Number Recognition System at Automatic Transfer Crane in Container Terminal Yard)

  • 홍동희
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권9호
    • /
    • pp.57-65
    • /
    • 2010
  • 본 논문은 컨테이너터미널의 야드에서 무인으로 하역작업을 수행하는 자동화 크레인(ATC; Automatic Transfer Crane) 에서 신속하고 효율적으로 작업 대상인 컨테이너화물의 컬러 영상 이미지내의 컨테이너번호를 인식하는 방법에 대한 연구이다. 부산의 신선대부두 게이트에는 정부의 연구개발사업인 "지능형 항만물류시스템 기술 개발"에 의해 컨테이너번호 인식시스템이 설치되어 있다. 수출컨테이너화물을 자동으로 인식하기 위해 게이트에 터널식 구조물 내 카메라를 설치하여 컨테이너번호를 인식하는 방식이다. 그러나 컨테이너터미널에 자동화장비가 도입되고 작업의 무인화가 점진적으로 이루어짐에 따라 야드의 자동화크레인에서 작업 대상의 확인을 위한 컨테이너번호 인식시스템을 필요로 한다. 따라서 게이트와는 달리 햇빛, 비, 눈, 그림자 등 영상을 통한 문자인식의 방해요소가 많은 야드의 자동화크레인에서는 그에 맞는 컨테이너번호 인식시스템이 필요하다. 본 논문에서는 카메라, 조명, 센서 등 하드웨어 요소들의 변경과 주변 환경의 밝기차 등을 조절하여 번호를 인식하는 알고리즘 등 소프트웨어 요소들의 변화를 통해 태양광이나 하역장비 아래에 짙게 드리워지는 그림자 문제 등을 해결하고 인식시간의 단축과 인식률을 높이는 결과를 도출하였다.

고해상도 360° 전방위 IP 카메라를 이용한 다중 번호판 인식 시스템 (Multi License Plate Recognition System using High Resolution 360° Omnidirectional IP Camera)

  • 라승탁;이선구;이승호
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.412-415
    • /
    • 2017
  • 본 논문에서는 고해상도 $360^{\circ}$ 전방위 IP 카메라를 이용한 다중 번호판 인식 시스템을 제안한다. 제안한 시스템은 $360^{\circ}$ 원형영상의 평면 분할 부와 다중 번호판 인식 부로 구성되었다. $360^{\circ}$ 원형영상의 평면 분할 부는 고해상도 $360^{\circ}$ 전방위 IP 카메라에서 원형영상 획득, 원형영상 분할, 평면영상으로 변환, 보간법을 사용한 픽셀 보정 및 컬러보정, 에지 보정 등의 과정을 거쳐 화질이 개선된 평면영상으로 출력한다. 다중 번호판 인식 부는 평면영상에서 다중 번호판 후보영역 추출, 다중 번호판 후보영역 정규화 및 복원, 신경망을 사용한 다중 번호판 숫자, 문자 인식 과정을 거쳐 다중 번호판을 인식하게 된다. 제안된 고해상도 $360^{\circ}$ 전방위 IP 카메라를 이용한 다중 번호판 인식 시스템을 평가하기 위하여 지능형 주차관제시스템 운영 전문 업체와 공동으로 실험한 결과, 97.8%의 높은 번호판 인식률이 확인되었다.

영상 내 차량의 위치 및 촬영 각도에 강인한 차량 번호판 인식 시스템 (A License Plate Recognition System Robust to Vehicle Location and Viewing Angle)

  • 홍성은;황성수;김성대
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.113-123
    • /
    • 2012
  • 최근 지능형 교통 시스템을 다양한 상황 및 환경에 적용하려는 시도가 증가함에 따라, 다수의 지능형 교통 시스템에서 사용되고 있는 차량 번호판 인식 과정이 입력영상 내 차량의 위치 및 촬영 각도와 관계없이 정확하게 이루어질 필요성이 있다. 본 논문에서는 현행 번호판의 규격정보를 활용하여 오검출된 번호판 후보 영역의 제거 및 번호판 내 글자추출을 수행하고, 한글 특성을 고려한 글자인식을 수행하는 차량 번호판 인식 시스템을 제안한다. 제안하는 시스템은 입력영상에서 검출한 번호판 후보 영역들에 대해서 기울기 보정을 수행한 후, 후보 영역 내 글자로 판명되는 객체의 위치 및 형태 정보를 번호판 규격정보와 비교 검증하는 과정을 거쳐 오검출된 번호판 영역을 제거한다. 또한 글자추출 단계에서는 영역 내 밝기 변화를 고려한 이진화를 수행한 뒤, 번호판 규격정보 및 번호판 영역의 종횡비, 배경색, 투영정보 등을 종합적으로 활용하여 번호판 영역 내 글자를 정확하게 추출한다. 그리고 번호판 영역 내 글자들 중 오인식률이 높은 한글의 인식에 있어서, 형태적 유사성으로 그룹을 나눈 뒤, 주요 특징점들을 토대로 계층을 좁혀 나가는 super-class 개념을 적용하여 한글 인식을 수행한다. 성능 검증을 위해 다양한 배경에서 촬영된 영상에 대해서 실험을 수행한 결과 제안하는 번호판 인식 시스템이 영상 내 차량의 위치 및 촬영 각도의 변화에 강인한 것을 확인할 수 있었다.

온톨로지 기반 영화 메타데이터간 연관성을 활용한 영화 추천 기법 (The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata)

  • 김재영;이석원
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.25-44
    • /
    • 2013
  • 최근 IPTV와 스마트 TV 등의 등장과 영상 콘텐츠를 시청하고 검색할 수 있는 웹 서비스의 등장으로 영상 콘텐츠의 접근이 용이해져 사용자들은 자신이 원하는 콘텐츠를 찾고자 하는 요구가 증가하고 있다. 하지만 서비스되는 콘텐츠의 양이 방대하여 영상 콘텐츠를 검색할 때 사용하는 키워드 기반의 검색은 많은 양의 결과를 가져오며 사용자가 필요로 하지 않은 결과가 검색된다. 따라서 사용자가 원하는 콘텐츠의 검색 시간과 노력이 증가 하게 되었다. 이를 극복 하기 위해 콘텐츠 추천 및 검색에 대한 연구가 수행되어 왔다. 기존의 연구에는 사용자의 선호도 분석을 통하여 영상 콘텐츠를 추천하거나 비슷한 성향을 가지는 사용자들을 분류하여 콘텐츠를 추천하는 기법들이 연구되어 왔다. 본 논문에서는 영상 콘텐츠 중 영화의 추천을 위해 사용자 개인의 영화 메타데이터의 선호도를 분석하고, 영화의 메타데이터와 영화의 유사성을 도출하여 이를 기반으로 영화 추천 기법을 제안한다. 영화의 특징을 담고 있고, 사용자의 영화 선호도에 영향을 끼치는 장르, 줄거리, 배우, 키워드 등의 영화 메타데이터를 기반으로 온톨로지를 구축하고, 확률 기법을 통한 메타 데이터간의 유사성을 분석하여 유사 메타데이터를 연결한다. 또한 사용자의 선호도와 그룹을 정의하고, 사용자 정보를 활용하기 위한 사용자 모델을 정의한다. 제안하는 추천 기법은 1) 사용자 정보기반의 후보 영화 검색 컴포넌트, 2) 사용자 선호기반의 후보 영화 검색 컴포넌트, 3) 1)과 2)의 결과를 통합하고 가중치를 부여하는 컴포넌트, 4) 최종결과의 분석을 통한 개인화된 영화 추천 컴포넌트 등 총 4가지 컴포넌트로 구성된다. 제안하는 추천 기법의 실험을 위하여 20대 남/녀 10명씩 20명을 대상으로 실험을 진행하였으며, 실험결과 평균 Top-5에서 2.1개 Top-10에서 3.35개 Top-20에서 6.35의 영화가 보고 싶은 영화로 선택되었다. 본 논문에서는 영화 메타데이터간의 연관성 도출을 통하여 영화간의 유사성을 도출하고 이를 기반으로 사용자의 기본적인 정보를 활용한 추천뿐만 아니라 사용자가 예상하지 못한 영화의 추천이 가능하다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

에이전트 기반 지능형 게임 캐릭터 구현에 관한 연구 (On the Development of Agent-Based Online Game Characters)

  • 이재호;박인준
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.379-384
    • /
    • 2002
  • 개발적인 측면에서 온라인 게임 환경에서의 NPC(Non Playable Character)들은 환경인식능력, 이동능력, 특수 능력 및 아이템의 소유 배분 등을 원활히 하기 위한 능력들을 소유해야 하며, 게임 환경을 인식, 저장하기 위한 데이터구조와 자신만의 독특한 임무(mission)를 달성하기 위한 계획을 갖고 행위를 해야 한다. 이런 의미에서 NPC는 자신만의 고유한 규칙과 행동 패턴, 그리고 목표(Goal)와 이를 실행하기 위한 계획(plan)을 소유하는 에이전트로 인식되어야 할 것이다. 그러나, 기존 게임의 NPC 제어 구조나 구현 방법은 이러한 요구조건에 부합되지 못한 부분이 많았다. C/C++ 같은 컴퓨터 언어들을 이용한 구현은 NPC의 유연성이나, 행위에 많은 문제점이 있었다. 이들 언어의 switch 문법은 NPC의 몇몇 특정 상태를 묘사하고, 그에 대한 행위를 지정하는 방법으로 사용되었으나, 게임 환경이 복잡해지면서, 더욱더 방대한 코드를 만들어야 했고, 해석하는데 많은 어려움을 주었으며, 동일한 NPC에 다른 행동패턴을 적용시키기도 어려웠다. 또한, 대부분의 제어권을 게임 서버 폭에서 도맡아 함으로써, 서버측에 많은 과부하 요인이 되기도 하였다. 이러한 어려움을 제거하기 위해서 게임 스크립트를 사용하기도 하였지만, 그 또한 단순 반복적인 패턴에 사용되거나, 캐릭터의 속성적인 측면만을 기술 할 수 있을 뿐이었다 이러한 어려움을 해소하기 위해서는 NPC들의 작업에 필요한 지식의 계층적 분화를 해야 하고, 현재 상황과 목표 변화에 적합한 반응을 표현할 수 있는 스크립트의 개발이 필수 적이라 할 수 있다 또한 스크립트의 실행도 게임 서버 측이 아닌 클라이언트 측에서 수행됨으로써, 서버에 걸리는 많은 부하를 줄일 수 있어야 할 것이다. 본 논문에서는, 대표적인 반응형 에이전트 시스템인 UMPRS/JAM을 이용하여, 에이전트 기반의 게임 캐릭터 구현 방법론에 대해 알아본다.퓨터 부품조립을 사용해서 Template-based reasoning 예를 보인다 본 방법론은 검색노력을 줄이고, 검색에 있어 Feasibility와 Admissibility를 보장한다.매김할 수 있는 중요한 계기가 될 것이다.재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.ting LMS according to increasing the step-size parameter $\mu$ in the experimentally computed. learning curve. Also we find that convergence speed of proposed algorithm is increased by (B+1) time proportional to B which B is the number of recycled data buffer without complexity of computation. Adaptive transversal filter with proposed data recycling buffer algorithm could efficiently reject ISI of channel and increase speed of convergence in avoidance burden of computational complexity in reality when it was experimented having

  • PDF

사용자 만족도 향상을 위한 지능형 서비스 선정 방안에 관한 연구 : 클라우드 컴퓨팅 서비스에의 적용 (A Study on the Intelligent Service Selection Reasoning for Enhanced User Satisfaction : Appliance to Cloud Computing Service)

  • 신동천
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.35-51
    • /
    • 2012
  • 클라우드 컴퓨팅은 컴퓨팅 자원에 대해 확장 가능한 요구중심의 서비스를 인터넷상에서 제공하는 인터넷 기반의 컴퓨팅이라 할 수 있다. 이러한 환경에서 서비스 사용자가 만족하는 서비스를 선정하여 제공하는 문제는 인터넷과 모바일 기술의 발전에 따라 향후에 다양하고 수많은 클라우드 서비스가 제공되는 경우 매우 중요한 이슈중의 하나가 된다. 과거 연구의 대부분은 요구사항과 연관된 개념의 유사성을 기반으로 하거나 사용자 요구사항의 다양성이 결여되어 있어 사용자의 만족도 향상에 한계를 보이고 있다. 본 논문에서 제안하는 방안은 서비스 만족도 향상을 위해 속성의 개념 유사성 대신에 서비스 속성의 기능적 포함 관계와 규격 등을 기반으로 구성되는 서비스 속성 그래프(Service Attribute Graph : SAG)를 도입하여 사용한다. 뿐만 아니라, 다양한 사용자 선호도를 반영하고 문자, 숫자, 부울린 등 여러 가지 속성 값 유형들을 고려함으로서 서비스 속성의 다양성을 지원한다. 본 논문의 가장 큰 의미는 다른 연구들과 달리 여러 가지 사용자 선호도를 통합적으로 고려하면서 그래프 기반의 선정 방안을 처음으로 제시하고 있다는 점이다.

다중 지문 시퀀스를 이용한 스마트폰 보안 (Smartphone Security Using Fingerprint Password)

  • 배경율
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.45-55
    • /
    • 2013
  • 최근 모바일 디바이스와 휴대기기의 발달로 원격접속이 늘어남에 따라 보안의 중요성도 점차 증가되었다. 그러나 기존 패스워드나 패턴과 같은 보안 프로그램은 지나치게 단순할 뿐 아니라 다른 사용자가 쉽게 취득하여 악용할 수 있다는 단점이 있다. 생체인식을 활용한 보안 시스템은 보안성이 강화 되었지만 위조 및 변조가 가능하기 때문에 완전한 해결책을 제시하지 못한다. 본 논문에서는 이러한 문제점을 해결하기 위해 지문인식과 패스워드를 결합하여 보안성을 향상시킬 수 있는 방안을 연구하였다. 제안한 시스템은 하나의 지문이 아니라 다수의 지문을 이용하는 방법으로, 사용자가 패스워드를 입력할 때 여러 지문 중에서 정확한 지문의 순서를 제공하도록 한다. 오늘날 스마트폰은 패스워드나 패턴, 지문을 이용할 수 있지만 패스워드의 강도가 낮거나 패턴이 쉽게 노출되는 등의 문제가 있다. 반면에 제안한 시스템은 다양한 지문의 이용과 패스워드의 연계, 또는 다른 생체인식 시스템과 연결함으로써 매우 강력한 보안장치가 될 수 있다.

스마트 팩토리에서 그리드 분류 시스템의 협력적 다중 에이전트 강화 학습 기반 행동 제어 (Cooperative Multi-Agent Reinforcement Learning-Based Behavior Control of Grid Sortation Systems in Smart Factory)

  • 최호빈;김주봉;황규영;김귀훈;홍용근;한연희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권8호
    • /
    • pp.171-180
    • /
    • 2020
  • 스마트 팩토리는 설계, 개발, 제조 및 유통 등 생산과정 전반이 디지털 자동화 솔루션으로 이루어져 있으며, 내부 설비와 기계에 사물인터넷(IoT)을 설치해 공정 데이터를 실시간으로 수집하고 이를 분석해 스스로 제어할 수 있게 하는 지능형 공장이다. 스마트 팩토리의 장비들은 게임과 같이 가상의 캐릭터가 하나의 객체 단위로 구동되는 것이 아니라 수많은 하드웨어가 물리적으로 조합되어 연동한다. 즉, 특정한 공동의 목표를 위해 다수의 장치가 개별적인 행동을 동시다발적으로 수행해야 한다. 공정 데이터를 실시간으로 수집할 수 있는 스마트 팩토리의 장점을 활용하여, 일반적인 기계 학습이 아닌 강화 학습을 사용하면 미리 요구되는 훈련 데이터 없이 행동 제어를 할 수 있다. 하지만, 현실 세계에서는 물리적 마모, 시간적 문제 등으로 인해 수천만 번 이상의 반복 학습이 불가능하다. 따라서, 본 논문에서는 시뮬레이터를 활용해 스마트 팩토리 분야에서 복잡한 환경 중 하나인 이송 설비에 초점을 둔 그리드 분류 시스템을 개발하고 협력적 다중 에이전트 기반의 강화 학습을 설계하여 효율적인 행동 제어가 가능함을 입증한다.

스토리텔링 콘텐츠의 효과적인 관리를 위한 영화 스토리 발단부의 자동 경계 추출 (Extracting Beginning Boundaries for Efficient Management of Movie Storytelling Contents)

  • 박승보;유은순;정재은
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.279-292
    • /
    • 2011
  • 영화는 스토리를 전달하는 대표적인 매체 중의 하나이며 영화 속 스토리는 인물, 사건, 배경의 유기적인 연결을 통해 진행된다. 소설과 같이 스토리를 지닌 다른 매체와 마찬가지로 영화 역시 서사 구조를 갖고 있다. 즉 등장인물 간의 갈등과 해결이 인과 관계에 따라 전개된다. 영화의 서사구조는 아리스토텔레스의 3막 구조를 가지며 6단계로 세분화 될 수 있다. 전통적인 3막 구조는 발단부, 중반부, 결말부로 구성된다. 발단부는 영화에 등장하는 인물이나 배경을 소개하고 사건의 실마리와 갈등을 암시하는 장치들을 제시한다. 중반부는 내외적인 요인들에 의해 사건이 발전하고 갈등과 긴장을 고조시키는 부분이다. 결말부에서는 사건이 해결되면서 스토리의 주제 및 작가의 메시지가 전달된다. 특히 발단부는 스토리 진행을 위해 등장인물의 성격을 설정하고 배경을 지시하는 등의 다양한 정보가 노출되는 부분이기 때문에 영화의 축약이나 등장인물들의 중요한 정보를 추출할 수 있는 중요한 부분이다. 따라서 영화의 스토리를 추출할 경우 서사구조에 따라 가중치를 다르게 부여할 필요가 있다. 본 논문에서는 등장인물 수를 누적한 그래프를 이용하여 발단부와 중반부의 경계를 추출하는 방법을 제시한다. 발단부에서는 주요 등장인물이 소개되고 이들 간의 갈등이 암시되거나 사건의 실마리가 제시된다. 따라서 주요 등장인물의 등장이 마무리되는 장면에서 일정 장면이 진행된 이후의 장면이 발단부와 중반부의 경계가 된다. 주요 등장인물은 주인공과 적대자, 그리고 주인공과 적대자를 보조해 주는 각각의 보조자(조연)로 구성되기 때문에 등장인물 수 누적 그래프에서 주요 등장인물의 등장이 마무리되는 장면을 찾기 위해서는 단역을 제거하여야 한다. 또한 주요 등장인물이 더 이상 등장하지 않는 변곡점을 찾는 방법이 필요하다. 이를 위해 본 논문에서는 단역이 제거된 등장인물 수 누적 그래프를 그린 후 변곡점을 찾는 방법을 제안한다. 실제 발단부와 중반부의 경계는 주요 등장인물의 출현이 마무리 된 후 갈등과 사건의 실마리가 암시되는 추가적인 장면이 진행된 후에 나타난다. 따라서 다수의 영화를 통해 추가적인 장면의 개수를 설정하는 실험을 진행할 것이다.