• 제목/요약/키워드: Human visual intelligence

검색결과 74건 처리시간 0.022초

조선말(朝鮮末) 일제(日帝) 참모본부(參謀本部) 장교의 한반도 정찰과 지도제작 (Japanese Military Surveys and Making Topographic Maps of the Korean Peninsula at the End of Chosun Dynasty)

  • 남영우;도변리회;산근구미자;이호상;소림무
    • 대한지리학회지
    • /
    • 제44권6호
    • /
    • pp.761-778
    • /
    • 2009
  • 본 연구는 조선왕조 말기에 일본 육군성 참모본부 소속의 장교들로 조직된 간첩대가 한반도에 침투하여 비밀측량을 실시한 배경과 과정을 파악하고 그 실체를 규명한 것이다. 본 연구의 대상이 된 지도들은 첩보장교들의 목측에 의해 은밀하고 신속하게 제작된 노상측도와 목측신속도(目測迅速圖)로 제작된 것들이다. 종래에는 1885년경부터 노상측도가 행해진 것으로 밝혀진 바 있으나, 본 연구에서는 1882년 이소바야시 중위에 의해 최초로 노상측도가 시도되었음이 밝혀졌다. 그들은 1883~1887년에 걸친 정찰루트와 간행지도를 분석한 결과 단기간에 지도제작은 물론 정보수집을 위하여 역할이 분담되었던 것으로 확인되었다.

센서 퓨전을 통한 인공지능 4족 보행 애완용 로봇 (An Intelligence Embedding Quadruped Pet Robot with Sensor Fusion)

  • 이래경;박수민;김형철;권용관;강석희;최병욱
    • 제어로봇시스템학회논문지
    • /
    • 제11권4호
    • /
    • pp.314-321
    • /
    • 2005
  • In this paper an intelligence embedding quadruped pet robot is described. It has 15 degrees of freedom and consists of various sensors such as CMOS image, voice recognition and sound localization, inclinometer, thermistor, real-time clock, tactile touch, PIR and IR to allows owners to interact with pet robot according to human's intention as well as the original features of pet animals. The architecture is flexible and adopts various embedded processors for handling sensors to provide modular structure. The pet robot is also used for additional purpose such like security, gaming visual tracking, and research platform. It is possible to generate various actions and behaviors and to download voice or music files to maintain a close relation of users. With cost-effective sensor, the pet robot is able to find its recharge station and recharge itself when its battery runs low. To facilitate programming of the robot, we support several development environments. Therefore, the developed system is a low-cost programmable entertainment robot platform.

인공지능기술의 IoT 통합보안관제를 위한 데이터모델링 (Data Modeling for Cyber Security of IoT in Artificial Intelligence Technology)

  • 오영택;조인준
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.57-65
    • /
    • 2021
  • 산업 전 분야에 4차 산업혁명의 신기술인 IoT(Internet of Things), AI(Artificial Intelligence), Bigdata 등이 융합되어 새로운 가치를 창출하는 초연결 지능정보사회가 도래되고 있다. 모든 것이 네트워크에 연결되어 데이터가 폭발적으로 증가하고, 인공지능이 스스로 학습하여 지적 판단 기능까지도 가능하다. 특히 사물인터넷은 언제 어디서나 어느 것과도 연결될 수 있는 새로운 통신환경을 제공함에 따라 모든 것들이 연결되는 초 연결을 가능케 하고 있다. 인공지능 기술은 인간이 가진 지각, 학습, 추론, 자연어처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현되고 있다. 인공지능은 기계학습, 딥러닝(Deep leearning), 자연어처리, 음성인식, 시각인식 등 첨단기술을 개발하는 방향으로 발전되고 있으며, 안전, 의료, 국방, 금융, 복지 등의 다양한 응용 분야에 특화된 소프트웨어와 머신러닝(Machine learning), 클라우드(Cloud) 기술을 포함하고 있다. 이를 통해 인간의 편의와 새로운 가치를 제공하기 위해 산업 전반의 다양한 분야에 활용된다. 하지만, 이와는 반대로 지능적이고 정교해진 사이버 위협들이 증가하고 신기술의 기술적 안전성 확보와 같은 잠재적 역기능들을 동반함에 따라 이에 대한 대응이 필요한 시점이다. 본 논문에서는 이러한 역기능을 해결하기 위한 하나의 방안으로 인공지능기술을 활용하여 IoT 통합보안관제 가능하도록 새로운 데이터모델링(Data modelling) 방안을 제안하였다.

동영상 시맨틱 이해를 위한 시각 동사 도출 및 액션넷 데이터베이스 구축 (Visual Verb and ActionNet Database for Semantic Visual Understanding)

  • 배창석;김보경
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.19-30
    • /
    • 2018
  • 영상 데이터에 대한 시맨틱 정보를 정확하게 이해하는 것은 인공지능 및 기계학습 분야에서 가장 어려운 도전과제의 하나로 알려져 있다. 본 논문에서는 동영상 시맨틱 이해를 위한 시각 동사 도출과 이를 바탕으로 하는 동영상 데이터베이스인 액션넷 데이터베이스 구축에 관해 제안하고 있다. 오늘날 인공지능 기술의 눈부신 발달에는 인공지능 알고리즘의 발전이 크게 기여하였지만 알고리즘의 학습과 성능 평가를 위한 방대한 데이터베이스의 제공도 기여한 바가 매우 크다고 할 수 있다. 인공지능이 도전하기 어려운 분야였던 시각 정보 처리에 있어서도 정지 영상 내의 객체인식에 있어서는 인간의 수준을 능가하기 시작하면서 점차 동영상에서의 내용에 대한 시맨틱 이해 기술 개발로 발전하고 있다. 본 논문에서는 이러한 동영상 이해를 위한 학습 및 테스트 데이터베이스로서 액션넷 구축에 요구되는 시각 동사의 후보를 도출한다. 이를 위해 언어학 기반의 동사 분류체계를 살펴보고, 영상에서의 시각 정보를 명세한 데이터 및 언어학에서의 시각 동사 빈도 등으로부터 시각 동사의 후보를 도출한다. 시각 동사 분류체계와 시각 동사후보를 바탕으로 액션넷 데이터베이스 스키마를 정의하고 구축한다. 본 논문에서 제안하는 시각 동사 및 스키마와 이를 바탕으로 하는 액션넷 데이터베이스를 개방형 환경에서 확장하고 활용성을 제고함으로써 동영상 이해 기술 발전에 기여할 수 있을 것으로 기대한다.

지각과 행위: 체화된 인지와의 융복합적 접근 (Perception and action: Approach to convergence on embodied cognition)

  • 이영림
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.555-564
    • /
    • 2016
  • 공간 지각은 일반적으로 물체(형태)를 인식하는 능력에 대한 문제로 여겨진다. 대안적으로, 형태 지각 연구는 시각 공간의 기하학에 관한 논의에 기여한다. 이러한 공간의 기하학은 일반적으로 유클리드가 아닌, 타원, 유사성, 또는 아핀(affine) 기하학으로 알려져 왔다. 다시 말해, 많은 형태 지각 연구들에서 보여 왔듯, 공간은 변형된 기하학으로 지각된다. 이 논문의 목적은 지각된 형태와 시각적으로 유도되는 행동과 관련된 시각 공간의 기하학에 대한 이해를 돕기 위함이다. 따라서 지각과 행위의 관계에 대해 설명하고 있는 두 이론을 비교해 본다. 제한된 인지와 더 나아가서, 인공 지능 연구와의 융합에 있어서 이러한 인간의 기본적인 공간 지각 능력과 시각적으로 유도되는 행위를 먼저 이해하는 것이 중요하다.

위모트를 활용한 시지각 장애아동 교육 콘텐츠개발 (Development of an Edutainment Contents using Wiimote Controller for Children with Visual Perception Disabilities)

  • 유상조;한경임;김봉석;박동규
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1547-1556
    • /
    • 2010
  • 현재까지 유아나 장애인을 위한 컴퓨터 활용 교육 콘텐츠는 지각훈련, 인지훈련, 한글 교육 등 다양한 분야에서 개발되었으나 가장 큰 문제점은 컴퓨터 모니터 앞에서 장시간 마우스를 이용하여 교육을 할 경우 활동성이 저하된다는 점이다. 이것은 특히 왕성하게 운동 능력이 발달하는 시기의 유아와 운동 장애로 인해 활동 기회가 부족한 장애 아동에게 적잖은 문제점으로 지적되어 왔다. 이와 같은 문제점을 개선하고 활동성과 협동력, 몰입성을 강화시키는 콘텐츠를 개발하기 위해서는 터치스크린과 같은 스크린 상에서 인간의 동작을 인식하여 이를 대화식으로 보여주는 기술이 필요하다 본 연구에서는 기존의 컴퓨터 활용 콘텐츠의 단점을 보완하고, 사용자의 활동성을 강화하기 위해 위모트가 가지는 센서 기술을 활용하여 실시간으로 빔 프로젝터나 컴퓨터 스크린으로 교육콘텐츠를 제공하고 신체를 직접 움직이며 적외선 펜을 사용하여 자극에 반응하는 교육 콘텐츠를 개발하였다.

IoL Field Gateway: An Integrated IoT Agent using Networked Smart LED Lighting Controller

  • Mariappan, Vinayagam;Jung, Soonho;Lee, Sangwoon;Cha, Jaesang
    • 정보와 통신
    • /
    • 제34권2호
    • /
    • pp.12-19
    • /
    • 2017
  • The LED technology advancement introduce cuttingedge technology on Internet of Things (IoT) to connect the physical world to the digital realm, using digital smart lighting infrastructure called Internet of light (IoL). This paper proposes an Integrated IoT agent on networked smart LED lighting controller called IoL Filed Gateway using lighting infrastructure in which a lighting system that can connect to a network and can be monitored and controlled from a centralized system or via the cloud. The IoL Field Gateway defines new world of smart connected intelligence, lighting can become an integral and responsive part of everyday human life environments. The proposed connected lighting gateway uses the concept of multi-hop ad hoc network using visible light communication (VLC) with RF wireless technologies and Wired PLC (Power Line Communication). This connectivity and intelligence integrated into LED-based luminaires form the backbone of smart buildings and cities and make the Internet of Things (IoT) vision feasible and enables the lighting administrator can control numerous lightings easily and visitors can get visual information from the lightings with their smart devices. The proposed IoL gateway design is emulated on Arduino based HW platform with VLC, RF, and PLC connectivity and evaluated with four sensor interface.

소셜 지능로봇의 특성이 만족과 사용의도에 미치는 영향: 1인 가구 소셜 지능로봇 사용자를 중심으로 (The Effect of Characteristics of Social Intelligence Robots on Satisfaction and Intention to Use: Focused on User of Single Person Households)

  • 전규리;이채현;정성미;최정일
    • 품질경영학회지
    • /
    • 제52권1호
    • /
    • pp.95-113
    • /
    • 2024
  • Purpose: This study focused on the societal changes associated with the entry into an ultra-aged society and the increase in single-person households. The core objective of this research is to investigate how social intelligent robots can bring about positive changes in the lives of individuals in single-person households and how such changes influence user satisfaction and the intention to use these robots. Methods: The study employed a cross-sectional analysis using a structural equation model. A survey designed to assess the impact of social intelligent robots' characteristics, such as perceived encouragement, empathy, presence, appearance, and attachment, on user satisfaction and usage intentions was conducted. Data were collected from a total of 335 users and analyzed using the structural equation model. Results: In the characteristics of social intelligent robots for single-person households, it was found that empathy, presence, and attachment significantly influenced satisfaction, while perceived encouragement, empathy, and attachment significantly influenced usage intentions. The research results indicate differences between enhancing user satisfaction and increasing the intention to use social intelligent robots. The findings suggest the essential need for a user-centric approach in the design and development of social intelligent robots. Additionally, it was observed that emotional support plays a crucial role in users' experiences with social intelligent robots. Conclusion: This study verified the impact of social intelligent robots on satisfaction and usage intentions based on users' experiences. It examined the influence of linguistic, visual, and personal characteristics of robots on user experiences, providing insights into how technological and human aspects of social intelligent robots interact to shape user satisfaction and usage intentions. Consequently, the study confirmed that social intelligent robots can bring positive changes to human life, emphasizing the necessity for the advancement of robot technology in a human-centric direction.

관계 추론 심층 신경망 모델의 성능개선 연구 (A Study on Improving Performance of the Deep Neural Network Model for Relational Reasoning)

  • 이현옥;임희석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권12호
    • /
    • pp.485-496
    • /
    • 2018
  • 지금까지 인공지능의 한 분야인 딥러닝 방법은 구조화되지 않은 데이터로부터 문제를 해결하는 놀라울만한 성과를 이루어왔지만, 인간처럼 여러 상황들을 종합적으로 판단, 그것들의 연관성을 추론하고, 그 다음 상황을 예측하는 수준의 지능을 갖는데 도달하지 못하였다. 최근 발표된 복잡한 관계 추론을 수행하는 심층 신경망은 인공지능이 인간의 핵심 지적 능력인 관계 추론을 보유할 수 있다는 것을 증명하였다. 본 논문에서는 관계 추론 심층 신경망 중에서 Relation Networks (RN)의 성능을 분석 및 관찰해 보고자 Sort-of-CLEVR 데이터 셋을 사용한 시각적 질의응답과 bAbI task를 사용한 텍스트 기반 질의응답 두 유형의 RN 기반 심층 신경망 모델을 구축하여 baseline 모델과의 비교를 통한 성능검증을 하였다. 또한 모델의 성능을 극대화하기 위하여 하이퍼 파라미터 튜닝 등 다양각도의 성능개선 실험으로 관계 추론을 위한 RN 기반 심층 신경망 모델의 성능개선 방법을 제안하였다. 제안한 성능개선 방법은 시각적 질의응답 모델과 텍스트 기반 질의응답 모델에 적용하여 그 효과를 검증하였고, 기존의 RN 모델에서 사용해보지 않았던 Dialog-based LL 데이터 셋을 사용하여 새로운 도메인에서의 제안한 성능개선 방법의 효과를 다시 한 번 검증하였다. 실험 결과 두 유형의 RN 모델 모두에서 초기 학습률이 모델의 성능을 결정하는 핵심 요인임을 알 수 있었고, 제안한 random search 방법에 의해 찾은 최적의 초기 학습률 설정이 모델의 성능을 최고 99.8%까지 향상 시킬 수 있다는 것을 확인하였다.

Multimodal audiovisual speech recognition architecture using a three-feature multi-fusion method for noise-robust systems

  • Sanghun Jeon;Jieun Lee;Dohyeon Yeo;Yong-Ju Lee;SeungJun Kim
    • ETRI Journal
    • /
    • 제46권1호
    • /
    • pp.22-34
    • /
    • 2024
  • Exposure to varied noisy environments impairs the recognition performance of artificial intelligence-based speech recognition technologies. Degraded-performance services can be utilized as limited systems that assure good performance in certain environments, but impair the general quality of speech recognition services. This study introduces an audiovisual speech recognition (AVSR) model robust to various noise settings, mimicking human dialogue recognition elements. The model converts word embeddings and log-Mel spectrograms into feature vectors for audio recognition. A dense spatial-temporal convolutional neural network model extracts features from log-Mel spectrograms, transformed for visual-based recognition. This approach exhibits improved aural and visual recognition capabilities. We assess the signal-to-noise ratio in nine synthesized noise environments, with the proposed model exhibiting lower average error rates. The error rate for the AVSR model using a three-feature multi-fusion method is 1.711%, compared to the general 3.939% rate. This model is applicable in noise-affected environments owing to its enhanced stability and recognition rate.