• 제목/요약/키워드: Visual Intelligence

검색결과 249건 처리시간 0.027초

지능형 개인비서 서비스의 사용경험 비교 연구: 시리, 구글어시스턴트, 빅스비를 중심으로 (A Comparative Study of the Use of Intelligent Personal Assistant Services Experiences: Siri, Google Assistant, Bixby)

  • 유초롱;김송현;김진우
    • 감성과학
    • /
    • 제23권1호
    • /
    • pp.69-78
    • /
    • 2020
  • 본 연구는 지능형 개인비서 서비스의 사용 경험을 HCI의 평가 기준을 바탕으로 비교·분석하여 사용 경험의 긍정적인 요소와 개선되어야 할 요소를 탐색하고자 한다. 현 시장에서 점유율이 가장 높은 지능형 개인비서 서비스인 애플의 시리, 구글의 구글어시스턴트, 삼성의 빅스비를 대상으로 연구를 진행하였다. 연구 방법은 1차로 문헌 연구를 통하여 현 서비스의 개념과 특징에 대해 비교·분석하였고 2차로 약 2주간 UI/UX 디자인 전문가 7명을 대상으로 맥락질문법을 활용하여 인터뷰를 진행하였다. 인터뷰는 피터 모빌(Peter Morville)의 사용자 경험 허니콤(user experience honeycomb) 7가지 사용성 원칙을 5가지로 재구성하여 유용성, 편의성, 시각적 매력성, 신뢰성, 만족도에 대한 질문을 진행하였다. 이후 재구성한 사용성 원칙 내용을 바탕으로 평가 rating 및 시스템 사용성 척도 (SUS) 를 바탕으로 평가를 실시하였다. 본 연구는 인공지능 개인비서 서비스의 사용경험을 정량적, 정성적으로 분석했다는데 의의가 있다.

GuessWhat?! 문제에 대한 분석과 파훼 (Analyzing and Solving GuessWhat?!)

  • 이상우;한철호;허유정;강우영;전재현;장병탁
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.30-35
    • /
    • 2018
  • GuessWhat?!은 질문자와 답변자로 구성된 두 플레이어가 이미지를 보고 질문자에게 비밀로 감추어진 정답 물체에 대해 예/아니오/잘 모르겠음 셋 중 하나로 묻고 답하며, 정답 물체를 추려 나가는 문제이다. GuessWhat?!은 최근 컴퓨터 비전과 인공지능 대화 시스템의 테스트베드로서 컴퓨터 비전과 인공지능 학계의 많은 관심을 받았다. 본 논문에서, 우리는 GuessWhat?! 게임 프레임워크가 가지는 특성에 대해 논의한다. 더 나아가, 우리는 제안된 틀을 기반으로 GuessWhat?!의 간단한 solution을 제안한다. 사람이 평균 4~5개 정도의 질문을 통하여 맞추는 이 문제에 대하여, 우리가 제안한 방법은 2개의 질문만으로 기존 딥러닝 기반 기술의 성능을 상회하는 성능을 보이며, 5개의 질문이 허용되면 인간 수준의 성능을 능가한다.

A Study on the Outlet Blockage Determination Technology of Conveyor System using Deep Learning

  • Jeong, Eui-Han;Suh, Young-Joo;Kim, Dong-Ju
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.11-18
    • /
    • 2020
  • 본 연구는 컨베이어 시스템에서 딥러닝을 이용한 배출구 막힘 판단 기술에 대하여 제안한다. 제안 방법은 산업 현장의 CCTV에서 수집한 영상을 이용하여 배출구 막힘 판단을 위한 다양한 CNN 모델들을 학습시키고, 성능이 가장 좋은 모델을 사용하여 실제 공정에 적용하는 것을 목적으로 한다. CNN 모델로는 잘 알려진 VGGNet, ResNet, DenseNet, 그리고 NASNet을 사용하였으며, 모델 학습과 성능 테스트를 위하여 CCTV에서 수집한 18,000장의 영상을 이용하였다. 다양한 모델에 대한 실험 결과, VGGNet은 99.89%의 정확도와 29.05ms의 처리 시간으로 가장 좋은 성능을 보였으며, 이로부터 배출구 막힘 판단 문제에 VGGNet이 가장 적합함을 확인하였다.

유아들의 안전한 스마트폰 사용 환경 및 콘텐츠 추천 시스템 개발 (The Study of the System Development on the Safe Environment of Children's Smartphone Use and Contents Recommendations)

  • 이경아;박은영
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.845-852
    • /
    • 2018
  • 본 연구에서는 디지털 세대를 위한 스마트폰 중독 방지 런처와 다중지능 및 집단지성을 활용한 머신 러닝 기반 콘텐츠 추천 시스템을 개발하였다. 이를 통해 어린 자녀의 디지털 기기 과다 사용을 불안해하는 부모들에게 편리한 디지털 양육 경험을 제공하고 자녀에게는 즐겁고 안전한 학습 환경과 학습 능률을 제고하는 적응 형 개별 디지털 학습법을 제시한다. 제안하는 앱은 시간제한 설정과 더불어 유해 콘텐츠와 스마트폰 중독의 위험으로부터 자녀를 보호하는 게이미피케이션 런처이다. 수많은 교육용 콘텐츠 및 앱 중에서 선택이 어려운 부모들에게 아이들의 학습 및 활동 정보를 수집 분석하여 빅 데이터 기반의 학습 분석 리포트를 제공 하고 집단지성을 통한 추천 알고리즘으로 자녀에게 필요한 콘텐츠를 추천하는 시스템으로 구성된다.

RDS를 이용한 창의적 문제해결 학습방법 (Learning Method using RDS for Creative Problem Solving)

  • 홍성용
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권11호
    • /
    • pp.1126-1130
    • /
    • 2010
  • 차세대 IT유망 교육 분야로 지능로봇 관련 연구가 활발하게 진행되고 있다. 지능로봇은 실세계의 인간 세계와 가장 근접한 환경을 많이 고려하고 있기 때문에 인간의 행위 혹은 판단 능력을 기능으로 제공할 수 있어야 한다. 이와 같은 이유로 최근 로봇 교육은 다양한 하드웨어 형태의 로봇뿐만 아니라, 많은 기능을 포함한 서비스 컴포넌트 아키텍처 형태의 소프트웨어 로봇 개발 연구가 진행되고 있다. 따라서 본 논문에서는 RDS를 이용한 창의적 문제해결 학습방법에 관하여 제안한다. RDS는 소프트웨어 모듈로서 지능로봇을 제어하거나 프로그램하기 위한 소프트웨어 도구이다. 지능로봇 통합 개발 표준화를 고려한 컴포넌트 프레임워크를 활용하여 다양한 지능로봇의 형태와 여러 환경을 3차원 공간의 시각적 시뮬레이션 환경으로 제공하고 교육시간과 적은 비용으로 지능로봇 실험 환경을 제공할 수 있다.

청각장애인을 위한 재난안전 픽토그램 긴급알림 전달 기술 개발 (Development of Novel Disaster Pictogram Emergency Alert Technology for Hearing Impaired)

  • 김용욱;김현철;조범준
    • 한국재난정보학회 논문집
    • /
    • 제19권1호
    • /
    • pp.76-83
    • /
    • 2023
  • 연구목적: 지진, 호우, 태풍, 화재 등 긴급한 재난 알림 전달이 필요한 상황에서 청각장애인은 소리를 통한 알림을 인지할 수 없으며 문자를 통한 알림의 인지율도 비장애인에 비하여 상대적으로 낮은 편으로서 일반적인 수단의 재난알림을 신속하게 인지하기 어려운 경우가 많다. 이와 같은 청각장애인의 재난안전 긴급알림 인지의 취약성 문제를 해결하고자 픽토그램을 통한 재난안전 긴급알림 시스템이 개발되었다. 연구방법: 본 연구에서는 재난문자 통보문의 문구를 기반으로 청각장애인이 인지하기 보다 용 이한 일련의 픽토그램을 전달하는 시스템을 개발하고 자동 변환하는 방법을 탐색하고자 하였다. 연구결과: 이를 위해 재난안전 관련 긴급 통보문과 관련되는 픽토그램 기반의 알림을 전달하는 시스템이 개발되었고 자동변환에 적합한 인공신경망 구조와 훈련방법을 구성하여 재난문자에 대응되는 픽토그램 기반의 청각장애인 재난안전 긴급알림 시스템 구성이 제안되었다. 결론:본 연구를 통해 청각장애인 뿐만아니라 일반인 또는 한국어를 모르는 외국인도 쉽게 이해할 수 있는 픽토그램이 신속하게 표출될 수 있도록 하여 재난 취약계층의 취약성을 줄이는데 기여할 수 있을 것으로 기대된다.

광고사진 제작에서 ChatGPT의 활용 가능성 탐색: 사례 분석 및 제작 단계별 요소의 타당성 연구 (Exploring the Potential of ChatGPT in Advertising Photography: A Case Study and Validity Research on Elements in Each Production Stage)

  • 장연송;김유진
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.205-211
    • /
    • 2023
  • 본 논문에서는 현재 다양한 분야에서 이슈가 되고 있는 인공지능 기술인 ChatGPT의 광고사진 제작 활용 가능성을 분석하고 이에 대한 타당성을 평가하였다. 이를 위해 광고사진의 시각적 요소와 언어의 관계를 살펴보았고, ChatGPT의 광고 활용 사례를 조사하였다. 또한 광고사진 제작 단계별 요소를 분석한 후 전문가 인터뷰를 통해 광고사진 제작 단계에서 ChatGPT가 어떻게 활용될 수 있는지에 대한 타당성을 알아보았다. 그 결과 일부 제한적이긴 하지만 광고사진 기획 단계에서 실현 가능성이 높은 것으로 조사되었으나 사진 촬영과 후반 작업에서의 실현 가능성은 낮은 것으로 조사되었다. 이러한 결과를 고려할 때, 우리는 인공지능 기술의 발전을 지속적으로 주시할 필요가 있으며, 기술과 인간의 협업을 통해 광고사진 제작의 창의성과 효율성을 높여 나가는 방향으로 노력해야 할 것이다.

Beyond Attention-Deficit Hyperactivity Disorder: Exploring Psychiatric Comorbidities and Their Neuropsychological Consequences in Adults

  • Hyun Jae Roh;Geon Ho Bahn;Seung Yup Lee;Yoo-Sook Joung;Bongseog Kim;Eui-Jung Kim;Soyoung Irene Lee;Minha Hong;Doug Hyun Han;Young Sik Lee;Hanik K Yoo;Soo-Young Bhang
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제34권4호
    • /
    • pp.275-282
    • /
    • 2023
  • Objectives: This study aimed to identify the psychiatric comorbidity status of adult patients diagnosed with attention-deficit hyperactivity disorder (ADHD) and determine the impact of comorbidities on neuropsychological outcomes in ADHD. Methods: The study participants were 124 adult patients with ADHD. Clinical psychiatric assessments were performed by two board-certified psychiatrists in accordance with the Diagnostic and Statistical Manual of Mental Disorders, Fifth Edition. All participants were assessed using the Mini-International Neuropsychiatric Interview Plus version 5.0.0 to evaluate comorbidities. After screening, neuropsychological outcomes were assessed using the Comprehensive Attention Test (CAT) and the Korean version of the Wechsler Adult Intelligence Scale, Fourth Edition (K-WAIS-IV). Results: Mood disorders (38.7%) were the most common comorbidity of ADHD, followed by anxiety (18.5%) and substance use disorders (13.7%). The ADHD with comorbidities group showed worse results on the Perceptual Organization Index and Working Memory Index sections of the K-WAIS than the ADHD-alone group (p=0.015 and p=0.024, respectively). In addition, the presence of comorbidities was associated with worse performance on simple visual commission errors in the CAT tests (p=0.024). Conclusion: These findings suggest that psychiatric comorbidities are associated with poor neuropsychological outcomes in adult patients with ADHD, highlighting the need to identify comorbidities in these patients.

영화산업의 생성형 인공지능(Generative AI) 활용 현황과 문제점 (Current Use and Issues of Generative AI in the Film Industry)

  • 김종국
    • Journal of Information Technology Applications and Management
    • /
    • 제31권3호
    • /
    • pp.181-192
    • /
    • 2024
  • With the introduction of generative artificial intelligence(AI) tools such as OpenAI's Sora into the global film industry, including Hollywood, there has been a simultaneous emergence of innovations in film production as well as various crises. These changes are spreading throughout the entire film production process, including scriptwriting, casting, editing, and acting. This study analyzes the impact of AI on the film industry, particularly Hollywood, and explores how this technology might bring about changes in Korean cinema. AI technologies applied in the film industry offer benefits such as reducing production time and costs. However, they also pose threats to many filmmakers and actors who rely on the traditional production methods, leading to ethical and legal issues. In Hollywood blockbuster films, AI technology is used to create realistic visual effects, analyze scripts, and suggest optimal shooting angles. While these applications improve the qualitative level of films, they also reduce the human resources required in traditional film production processes. The impact on the Korean film industry is also noteworthy. Some Korean film production companies are leveraging AI to create films in a more creative and efficient manner. Efforts are being made to analyze audience data using AI and develop storylines that appeal to a larger audience. However, these technological changes are controversial among many Korean filmmakers who prefer traditional production methods. This study provides an in-depth discussion on whether the adoption of AI in the film industry can bring about positive innovation or inevitably lead to crises. It analyzes how AI technology is transforming traditional roles in the film industry and what new opportunities and challenges this change generates within the industry. Additionally. This study highlights the differences in technology adoption between Hollywood and Korean film industry and explores how each industry is embracing these technological changes.

3차원 자세 추정 기법의 성능 향상을 위한 임의 시점 합성 기반의 고난도 예제 생성 (Hard Example Generation by Novel View Synthesis for 3-D Pose Estimation)

  • 김민지;김성찬
    • 대한임베디드공학회논문지
    • /
    • 제19권1호
    • /
    • pp.9-17
    • /
    • 2024
  • It is widely recognized that for 3D human pose estimation (HPE), dataset acquisition is expensive and the effectiveness of augmentation techniques of conventional visual recognition tasks is limited. We address these difficulties by presenting a simple but effective method that augments input images in terms of viewpoints when training a 3D human pose estimation (HPE) model. Our intuition is that meaningful variants of the input images for HPE could be obtained by viewing a human instance in the images from an arbitrary viewpoint different from that in the original images. The core idea is to synthesize new images that have self-occlusion and thus are difficult to predict at different viewpoints even with the same pose of the original example. We incorporate this idea into the training procedure of the 3D HPE model as an augmentation stage of the input samples. We show that a strategy for augmenting the synthesized example should be carefully designed in terms of the frequency of performing the augmentation and the selection of viewpoints for synthesizing the samples. To this end, we propose a new metric to measure the prediction difficulty of input images for 3D HPE in terms of the distance between corresponding keypoints on both sides of a human body. Extensive exploration of the space of augmentation probability choices and example selection according to the proposed distance metric leads to a performance gain of up to 6.2% on Human3.6M, the well-known pose estimation dataset.