• 제목/요약/키워드: 텍스트 증강

검색결과 42건 처리시간 0.029초

구조물 정보 제공을 위한 위치기반의 증강현실(AR)에 대한 연구: 캠퍼스 중심으로 (A Study of AR based on GPS for Structure Information Service: Focused on Campus)

  • 나은찬;이영재;김현규;최성률;김영종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.661-663
    • /
    • 2019
  • 4차 산업 혁명의 핵심기술로 손꼽히는 AR을 이용하여 캠퍼스 이용에 유용한 정보를 제공한다. 사물인식, 위치기반의 AR구현 방식을 사용하며 AR네비게이션 방식으로 입체화된 길안내 정보를 제공한다. AR을 통해 제공되는 정보는 이미지 혹은 텍스트가 될 수 있고 3D모델, 미디어 그리고 이들의 모든 조합의 형태를 취할 수 있다.

AR툴킷에 의한 AR 트래픽 북(Traffic Book) : 매력적인 사항들에 대한 재검토 (AR Traffic Book by ARToolkit: A Review of Some Selected Challenging Issues)

  • ;오치민;송대현;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.829-834
    • /
    • 2008
  • 증강 현실(Augmented reality)은 실세계와 가상현실을 연결한다. AR 시스템의 가장 근본적인 목적은 보조 기구를 통하여 실세계에 3D 가상물이 동시에 존재하도록 하여 사용자의 두 세계 사이의 인지력을 개선시키는데 있다. AR 툴킷은 AR 어플리케이션 개발에 널리 이용되고 있다. 그러나 아직 많은 해결해야 할 문제들과 제약 조건들이 있다. 이 논문에서는 AR 툴킷을 이용하여 시스템을 개발할 때 생기는 몇 가지 문제에 대하여 전반적으로 검토 하고자 한다. 그리고 이러한 문제들과 관련된 3D 가상물과 소리를 가지고 있는 AR 트래픽 북이라는 실제 증강 텍스트 북을 소개한다. 이 논문에서는, 우선 가상물체, 렌더링, 카메라 교정, 추적 같은 가장 일반적인 문제들에 접근한다.

  • PDF

예비 초등교사의 확장현실 교육 및 현장 적용 사례 연구 (Case study of extended reality education and field application of pre-service elementary teachers)

  • 조정희;홍갑주
    • 정보교육학회논문지
    • /
    • 제26권5호
    • /
    • pp.307-315
    • /
    • 2022
  • 본 연구의 목적은 예비 초등교사를 대상으로 확장현실(extended reality)의 기초 소양 강화를 위해 관련 기술들의 기본 개념을 이해시키고 교육용 콘텐츠를 제작하는 기본기를 갖출 수 있는 교육 프로그램을 설계하고 적용하는 것이며, 교육을 통해 습득한 지식을 실제 교육 현장에 적용해 볼 수 있는 기회를 제공하는 것이다. 이를 위해, 국내의 한 초등교원 양성대학에 재학 중인 다양한 전공의 학부생 12명을 연구대상자로 선정하고 6주에 걸쳐서 총 6회 동안 가상현실, 증강현실, 혼합현실의 기본적인 개념 및 콘텐츠의 제작 과정을 습득하기 위한 연수에 참여하도록 하였다. 연수 프로그램이 종료된 후에는 해당 교육을 통해 습득한 지식을 기반으로 초등 교육에 활용하기 위한 수업 콘텐츠를 직접 기획하고 제작하여 6학년 학생 22명을 대상으로 시범 수업을 시행하도록 하였으며 설문 조사를 실시하였다. 향후 연구의 개선을 위해서는 1) 교육 장비들의 확충 및 2) 단기간의 집중 연수 방식을 고려해야 하고, 3) 텍스트 프로그래밍의 선제 교육 및 4) 설문 조사 방식의 개선이 필요한 것으로 분석되었다.

데이터 증강을 통한 딥러닝 기반 주가 패턴 예측 정확도 향상 방안 (Increasing Accuracy of Stock Price Pattern Prediction through Data Augmentation for Deep Learning)

  • 김영준;김여정;이인선;이홍주
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.1-12
    • /
    • 2019
  • 인공지능 기술이 발전하면서 이미지, 음성, 텍스트 등 다양한 분야에 적용되고 있으며, 데이터가 충분한 경우 기존 기법들에 비해 좋은 결과를 보인다. 주식시장은 경제, 정치와 같은 많은 변수에 의해 영향을 받기 때문에, 주식 가격의 움직임 예측은 어려운 과제로 알려져 있다. 다양한 기계학습 기법과 인공지능 기법을 이용하여 주가 패턴을 연구하여 주가의 등락을 예측하려는 시도가 있어왔다. 본 연구는 딥러닝 기법 중 컨볼루셔널 뉴럴 네트워크(CNN)를 기반으로 주가 패턴 예측률 향상을 위한 데이터 증강 방안을 제안한다. CNN은 컨볼루셔널 계층을 통해 이미지에서 특징을 추출하여 뉴럴 네트워크를 이용하여 이미지를 분류한다. 따라서, 본 연구는 주식 데이터를 캔들스틱 차트 이미지로 만들어 CNN을 통해 패턴을 예측하고 분류하고자 한다. 딥러닝은 다량의 데이터가 필요하기에, 주식 차트 이미지에 다양한 데이터 증강(Data Augmentation) 방안을 적용하여 분류 정확도를 향상 시키는 방법을 제안한다. 데이터 증강 방안으로는 차트를 랜덤하게 변경하는 방안과 차트에 가우시안 노이즈를 적용하여 추가 데이터를 생성하였으며, 추가 생성된 데이터를 활용하여 학습하고 테스트 집합에 대한 분류 정확도를 비교하였다. 랜덤하게 차트를 변경하여 데이터를 증강시킨 경우의 분류 정확도는 79.92%였고, 가우시안 노이즈를 적용하여 생성된 데이터를 가지고 학습한 경우의 분류 정확도는 80.98%이었다. 주가의 다음날 상승/하락으로 분류하는 경우에는 60분 단위 캔들 차트가 82.60%의 정확도를 기록하였다.

  • PDF

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.

적외선 반사 특성 제어를 통한 텍스트 문서 증강 (Augmenting Text Document by Controlling Its IR-Reflectance)

  • 박한훈;문광석
    • 한국멀티미디어학회논문지
    • /
    • 제20권6호
    • /
    • pp.882-892
    • /
    • 2017
  • Locally Likely Arrangement Hashing (LLAH) is a method that describes image features based on the geometry between their neighbors. Thus, it has been preferred to implement augmented reality on poorly-textured objects such as text documents. However, LLAH strongly requires that image features be detected with high repeatability and located at a distance from one another. To fulfill the requirement for text document, this paper proposes a method that facilitates the word detection in infrared (IR) range by adjusting the IR-reflectance of words. Specifically, the words are printed out with two different black inks: one is using the K(carbon black) ink only, the other is mixing the C(cyan), M(magenta), Y(yellow) inks. Since only the words printed out with the K ink is visible in IR range, a part of words are selected in advance to be used as features and printed out the K ink. The selected words can be robustly detected with high repeatability in IR range and this enables to implement augmented reality on text documents with high fidelity. The validity of the proposed method was verified through experiments.

치매 환자를 포함한 한국 노인 음성 데이터 딥러닝 기반 음성인식 (Deep learning-based speech recognition for Korean elderly speech data including dementia patients)

  • 문정현;강준서;김기웅;배종빈;이현준;임창원
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.33-48
    • /
    • 2023
  • 본 연구에서는 발화자가 동물이나 채소와 같은 일련의 단어를 무작위로 일 분 동안 말하는 한국어 음성 데이터에 대한 자동 음성 인식(ASR) 문제를 고려하였다. 발화자의 대부분은 60세 이상의 노인이며 치매 환자를 포함하고 있다. 우리의 목표는 이러한 데이터에 대한 딥러닝 기반 자동 음성 인식 모델을 비교하고 성능이 좋은 모델을 찾는 것이다. 자동 음성 인식은 컴퓨터가 사람이 말하는 말을 자동으로 인식하여 음성을 텍스트로 변환할 수 있는 기술이다. 최근 들어 자동 음성 인식 분야에서 성능이 좋은 딥러닝 모델들이 많이 개발되어 왔다. 이러한 딥러닝 모델을 학습시키기 위한 데이터는 대부분 대화나 문장 형식으로 이루어져 있다. 게다가, 발화자들 대부분은 어휘를 정확하게 발음할 수 있어야 한다. 반면에, 우리 데이터의 발화자 대부분은 60세 이상의 노인으로 발음이 부정확한 경우가 많다. 또한, 우리 데이터는 발화자가 1분 동안 문장이 아닌 일련의 단어를 무작위로 말하는 한국어 음성 데이터이다. 따라서 이러한 일반적인 훈련 데이터를 기반으로 한 사전 훈련 모델은 본 논문에서 고려하는 우리 데이터에 적합하지 않을 수 있으므로, 우리는 우리의 데이터를 사용하여 딥러닝 기반 자동 음성 인식 모델을 처음부터 훈련한다. 또한 데이터 크기가 작기 때문에 일부 데이터 증강 방법도 적용한다.

스마트 팩토리에서의 AR 기반 원격 협업을 위한 CMS 플랫폼에 관한 연구 (A Study on a CMS Platform for AR-based Remote Collaboration in a Smart Factory)

  • 임황용;노광현
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.327-334
    • /
    • 2018
  • 본 연구에서는 스마트 팩토리에서의 AR 기반 원격 협업을 위한 CMS 플랫폼을 제안한다. 스마트 팩토리 현장에서는 시간과 비용 절감을 위해 다양한 형태의 AR 기술을 활용하고 있다. 스마트 팩토리 수준이 높아짐에 따라 사람 중심의 작업에서 기계장치 설비 같은 시스템 중심의 작업이 이루어진다. 따라서 기계장치 설비의 고장 시 작업자가 현장에서 즉시 수리하거나 필요시 도움을 받을 수 있는 시스템이 필요하다. 원격 협업 CMS 플랫폼은 현장의 작업자와 원격지의 시스템 전문가가 필요시 텍스트, 2D 3D 콘텐츠와 스마트 팩토리 사업을 통해 구축된 ERP, MES/POP, PLM 시스템의 DATABASE와 연동하여 기계장치 설비의 상태, 관리 및 수리방법, 매뉴얼 등의 정보를 공유하여 신속하게 수리 관리하여 시간과 비용을 절감하는데 본 연구의 의의가 있다.

메타버스 콘텐츠의 재미 요소 분류 (Classification of fun elements in metaverse content)

  • 이준석;이대웅
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1148-1157
    • /
    • 2022
  • 2019년 코로나로 인하여 사람들의 많은 생활에 변화를 주었다. 그중 메타버스는 다양한 방식을 통한 비대면 서비스를 지원하여 일상에서 하던 일을 대체하고 있다. 이런 현상은 코로나19의 장기화로 하나의 문화처럼 만들어지고 형성되었다. 본 논문은 메타버스의 재미요인을 알기 위해 기존 게임에서 사용한 재미요소를 정리하여 전문가 5명과 함께 항목, 내용을 메타버스에 맞게 재분류하였다. 분류는 재매개성을 사용하여 분류하였고 감각적 재미[시각(그래픽), 청각, 텍스트, 조작, 감정이입, 유희, 시점], 도전적 재미[몰입, 도전, 성취, 발견, 스릴, 보상, 문제해결], 상상적 재미[새로운 이야기, 사랑, 자유도, 대리자아, 기대감, 변화], 사회적 재미[규칙, 경쟁, 사회적 행위, 지위, 협동, 참여, 교류, 소속, 화폐거래], 상호작용적 재미[의사결정, 커뮤니케이션 공유, 하드웨어, 감정이입, 육성, 자율성], 현실적 재미[현실 일체감, 학습 용이성, 순응, 지적문제해결, 패턴 인식, 실재감, 커뮤니티], 창조적 재미[응용, 창조, 커스텀마이징, 가상세계]로 구분하였다.

모던 웹 브라우저(Modern-Web-Browser) 기반 애플리케이션 성능분석을 위한 요소 연구 (Research for the Element to Analyze the Performance of Modern-Web-Browser Based Applications)

  • 박진태;김현국;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.278-281
    • /
    • 2018
  • 초기의 웹 기술은 텍스트 위주의 정보를 브라우저를 통해 보여주는 것이었다. 하지만 웹 기술이 발전하면서 브라우저를 통해 대용량의 멀티미디어 데이터를 보여주는 것이 가능해졌다. 웹 기술이 센서 네트워크, 하드웨어 제어, 빅 데이터와 인공지능 서비스를 위한 데이터 수집 및 분석 등 다양한 분야에 적용되고 있다. 대표적으로 사물인터넷의 인터페이스에 웹 브라우저를 탑재해 HTTP 통신으로 센서를 제어하고, 정보를 사용자에게 제공하는 사물 웹 플랫폼에 대한 표준이 마련되었다. 또한, 최근에는 웹 어셈블리의 개발로 웹 브라우저에서 실행할 수 없었던 3D 객체, 가상/증강 현실 콘텐츠를 C계열의 네이티브 언어를 통해 실행 가능해졌다. 기존 웹 애플리케이션의 성능을 평가하는 요소는 퍼포먼스, 네트워크 리소스, 보안 등의 요소들이 있었다. 하지만 웹 애플리케이션이 적용되는 분야가 다양해진 만큼 이 요소들에 대한 재해석과 검토가 필요한 시점이다. 이에 본 논문에서는 웹 애플리케이션의 성능을 평가하는 요소들에 대한 분석을 진행하고자 한다. 각 요소들에 대한 분석과 주요점, 보완되어야 하는 사항 등을 검토하여, 웹 기반 애플리케이션 개발의 한 지표를 정립하고자 한다.

  • PDF