• 제목/요약/키워드: 텍스트 인식

검색결과 771건 처리시간 0.025초

파일 단위 공간데이터 변경 인식 데이터 운영 기법 (Operation Technique of Spatial Data Change Recognition Data per File)

  • 이봉준
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.184-193
    • /
    • 2021
  • 공간 데이터를 관리하는 시스템은 저장된 정보의 갱신을 위하여 신규 입수되는 공간정보 파일에 대하여 기존 정보와 달라진 정보만을 추출하여 기존 정보를 갱신 한다. 기존 정보와 달라진 객체만을 추출하기 위해서는 신규 입수된 공간 정보 파일 내에 포함된 모든 객체에 대하여 기존 정보와 달라진 부분이 있는지 비교하게 된다. 수시로 갱신되는 공간 정보의 양이 증가하고 전국 단위의 데이터 갱신이 요구되는 상황에서 이러한 전수 검사 방식을 개선 하고자 본 연구가 진행 되었다. 본 연구에서는 신규 입수 공간 정보 파일내의 개별 객체를 검사하기 이전에, 파일의 정보만으로 개별 공간 객체가 변경 되었는지 여부를 판단할 수 있는 방법에 대하여 고찰해 보았다. 공간 데이터 파일은 일반적인 이미지나 텍스트 문서 파일과는 다른 정형화된 데이터 특성을 가지므로 기존의 파일 hash를 생성하여 관리하는 방식과 비교하여 좀 더 단순한 방식으로 이와 같은 파일단위 변경여부 판단이 가능하다. 전수 검사가 필요한 대상 파일의 숫자를 줄임으로써 전체적인 데이터 품질 검사 시간과 변경 데이터 추출 시간을 절약하여 시스템의 리소스 사용을 개선할 것으로 기대한다.

스마트 미러간 화상 통화와 메시징 기능을 가진 CoMirror 시스템 구현 (Implementation of CoMirror System with Video Call and Messaging Function between Smart Mirrors)

  • 황기태;김경미;김유진;박채원;유송연;정인환;이재문
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.121-127
    • /
    • 2022
  • 스마트 미러는 거울에 디스플레이와 임베디드 컴퓨터를 부착하여 거울 기능과 함께 사용자에게 다양한 정보를 제공해주는 IoT 장치이다. 본 논문은 스마트 미러가 사용자에게 정보를 제공하는 독립형 장치(stand alone device)라는 개념에서 벗어나 스마트 미러들이 연결되는 네트워크를 구성하고 사용자들이 다른 스마트 미러 사용자들과 대화하고 정보를 공유하는 CoMirror 시스템을 제안하고 구현하였다. CoMirror 시스템은 1개의 CoMirror 서버를 중심으로 여러 CoMirror 클라이언트들이 연결되는 구조이다. CoMirror 클라이언트는 라즈베리파이와 미러 필름, 터치 패드, 디스플레이 장치, 웹 카메라 등으로 구성되며, 서버에는 얼굴 학습과 인식, 사용자 관리, 클라이언트들 사이의 메시지 교환을 위한 중계 역할, 화상 통화 연결 설정 등의 기능이 구현되었다. 사용자들은 서버를 경유하여 다른 CoMirror 사용자들과 텍스트, 이미지, 오디오 등의 메시지를 주고받을 뿐 아니라, 1:1 화상 통화를 할 수 있도록 구현되었다.

3개 신문사 기사에 나타난 장애관 연구 : 장애인복지법상 장애 종류를 중심으로 (Three Newspapers Research from The Perspective of Disability : Focusing on The Types of Disabilities on The Disabled Person Welfare Law)

  • 임옥희;조원일
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권7호
    • /
    • pp.487-500
    • /
    • 2020
  • 본 연구는 3개 신문사에 나타난 「장애인복지법」상장애에 대한 기사를 분석했다. 3개 신문사는 <동아일보>, <한국일보>, <한겨레신문>의 신문사 홈페이지에서 수집한 장애관련 기사는 총 7,684건이다. 네트워크 텍스트분석과 내용분석을 통하여 다중장애모델의 '장애관'을 고찰하였다. 본 연구의 결과로 개별모델 및 사회모델을 비교로 개별모델 64.31%, 사회모델 35.69%로 개별모델이 상당히 높게 나타났다. 3개 신문사에 나타난 장애관은 전통적 개별모델의 장애로 개인이 해결해야 하는 것으로 나타났다. 사회 환경적 및 제도적 문제는 낮게 나타나 사회적 약자인 장애인에 대한 국민들의 관심과 배려가 요구된다. 본 연구의 사회복지적 함의는 장애를 바라보는 시대 변화에도 신문은 전통적 패러다임에 머물고 있었다. 장애를 장애인의 관점에서 바라보는 것이 요구되며, 개별적 욕구의 다양성을 인식하는 성숙한 의식이 필요하다. 본 연구는 신문기사에 나타난 장애관을 양적·질적 데이터의 양방향 시도를 고찰한 점에서 의의가 있다.

스마트도시 구현을 위한 시민참여의 역할과 방향에 관한 연구 (Civic Participation in Smart City : A Role and Direction)

  • 남우민;박건철
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.79-86
    • /
    • 2022
  • 본 연구는 스마트도시 구축과정에서 시민참여 활성화를 위한 연구동향을 파악하고자 한다. 이를 바탕으로 스마트도시에서 시민참여의 역할과 방향을 제시하고 시민참여를 유인할 수 있는 정책적·산업적·학술적·방향성을 제시하는데 있다. 전 세계적으로 급격하게 진행되는 도시화와 도시인구 증가로 교통, 환경, 에너지 등 각종사회 문제가 도시를 중심으로 확산 및 심화되고 있다. 세계 각국은 이런 도시문제 해결 및 지속가능한 발전을 이루기 위해 스마트도시를 도입하고 있다. 최근에는 인프라 확대 등 스마트도시 건설을 위한 기존의 하향식(Top-Down) 도시계획 방식에서 벗어나 시민들이 직·간접적으로 도시건설 과정에 참여 및 상호작용할 수 있는 상향식(Bottom-Up) 방식으로의 접근이 경주되고 있다. 한편, 국내에서도 국가전략관점에서 스마트도시 건설이 추진되고 있지만, 스마트도시에 대한 일반 시민의 인식과 참여는 낮은 것으로 나타나고 있다. 이런 상황을 극복하기 위해 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 연구가 시급한 상황이다. 따라서 본 연구에서는 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 전략모색을 위해 Scopus DB에서 'Smart City'와 'Participation(Engagement)'가 동시에 포함된 문헌 995건을 수집 후 토픽모델링 기법을 활용하여 관련 연구주제를 유형화하고, 연구동향을 분석하였다. 이를 통해 스마트도시에서 시민참여에 관한 연구방향을 이해하고, 향후 관련 연구에 대한 방향성을 제시하는 근거자료로 활용될 수 있을 것으로 기대된다.

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

토픽모델링 기반의 국내외 미래 자동차 연구동향 비교 분석: CASE 키워드 중심으로 (Analysis of domestic and foreign future automobile research trends based on topic modeling)

  • 정호정;김건욱;김나경;장원준;정원웅;박대영
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.463-476
    • /
    • 2022
  • 과거 산업화 이후 자동차 산업은 내연기관 중심의 지속적인 성장을 하였으나, 최근 4차 산업혁명으로 큰 변화를 맞이하고 있다. 대다수의 기업들이 전기 자동차, 자율주행으로의 전환을 준비하고 있으며, 현시점에서 국내와 국외의 미래 자동차 연구동향을 비교 분석할 필요가 있다. 이에 본 연구에서는 미래 자동차 트렌드를 대표하는 CASE(Connectivity, Autonomous, Sharing, Electrification)와 관련된 키워드가 포함된 국내 4,002건, 국외 68,372건 논문을 수집하여 LDA 알고리즘 기반의 토픽모델링을 수행하였으며, 국내외 미래 자동차 연구동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 교통 인프라, 도시 내 교통효율, 교통정책 등과 같은 거시적인 측면에서의 연구가 주를 이루는 것으로 나타났으며, 국외는 객체인식, 사물인터넷, 전기자동차 소음 등의 차량기술과 관련된 연구가 활성화되고 있음을 확인할 수 있었다. 이를 통해 국내 공유자동차 부문에 있어 MaaS(Mobility-as-a-Service)와 관련한 정부의 기술지원이 필요하고 교통수단별 데이터 개방 필요성 등에 대하여 제시하였고, 이러한 분석결과는 미래 자동차 산업을 위한 기초자료로 활용될 수 있을 것으로 판단된다.

얼굴 메이크업을 도와주는 지능형 스마트 거울 앱의설계 (Design of an Intellectual Smart Mirror Appication helping Face Makeup)

  • 오선진;이윤석
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.497-502
    • /
    • 2022
  • 최근 젊은 세대를 중심으로 정보의 유통이나 공유 수단으로 텍스트보다는 비주얼 기반의 정보 전달을 선호하는 경향이 뚜렷하며, 인터넷상의 유투브나 1인 방송 등을 통한 정보의 유통이 일상화되고 있다. 즉, 젊은 세대들은 대부분의 원하는 정보를 이러한 유통 과정을 거쳐 습득하게 되며 활용하는 상황이다. 또한, 많은 젊은 세대들은 자신을 개성있게 꾸미고 장식하는 데에 매우 과감하고 적극적이다. 얼굴 화장이나 헤어 스타일링 및 패션 연출에 있어 남녀구분 없이 적극적인 표현과 시도를 통해 개인의 개성을 거리낌이 없이 연출하는 경향이 있다. 특히, 얼굴 메이크업은 여자들은 물론이고 최근 남자들 사이에서도 관심의 대상이 되고 있으며, 자신의 개성을 표출할 수 있는 중요한 수단으로 인식되는 상황이다. 본 연구에서는 이러한 시대적 흐름에 발맞추어 자신의 독특한 개성을 나타내기 위한 얼굴메이크업을 연출하기 위해 자신의 얼굴 모양, 헤어 컬러 및 스타일, 피부 톤, 패션 스타일과 의상 컬러 등과 잘 어울리는 얼굴 메이크업을 구현하도록 인터넷상의 유명한 전문 메이크업 아티스트 들의 유투브나 1인 방송 영상 중 관련영상을 효율적으로 검색하여 추천하고, 사용자의 평소 검색 패턴과 외모 특징들을 학습시켜 축적된 정보를 바탕으로 최적의 솔루션을 제공할 수 있도록 인공지능 기법을 도입하며, 추천된 영상을 통해 자세한 메이크업 과정을 실제 단계별로 수행하면서 메이크업 스킬을 습득하도록 하는 지능형 스마트 거울 앱을 설계하고 구현하고자 한다.

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

실시간 이슈의 지속성 분석을 통한 사용자 정보 습득에 대한 특성과 패턴에 대한 연구 (A Study on the user attributes for acquisition of information by analyzing the durability of real-time issues)

  • 오준엽;이승규;이주엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.299-314
    • /
    • 2017
  • 미디어의 기술 발전은 병렬적으로 사용자의 인식을 확장시켜왔다. 동시에 정보습득의 과정에서 수동적 대상이었던 사용자와의 상호작용을 시도하였으며 이러한 과정에서 등장한 모바일은 종래의 전통적인 미디어 정보 채널의 구조와 내용을 전혀 다른 차원으로 탈바꿈한다. 한국의 모바일 환경은 대형 포털로 사용자가 수렴하고, 그 안에서 재매개를 통해 발산하는 양상으로 발전하고 있으며, 다른 특징은 '실시간 이슈' 서비스를 제공한다는 점이다. 이는 실시간으로 현재 사용자가 가장 관심을 갖는 10개의 이슈를 키워드로 제공하는 방식인데, 다른 나라에는 없는 한국만의 독특한 정보전달방식이다. 본 연구는 사용자의 욕구를 실시간으로 반영하는 실시간 이슈의 높은 지속성이 지닌 의미를 이전의 미디어와의 비교를 통해 언론학적으로 고찰하고, 이를 바탕으로 여러 가지 분석을 진행하였다. 분석을 위해 특정 기간 동안 총 2,199,420개의 다음(Daum)의 실시간 이슈 키워드와 해당 키워드의 맥락을 파악하기 위한 263,487개의 기사를 네이버(Naver)에서 언론사의 구별 없이 수집하였다. 수집한 데이터를 바탕으로 키워드에 대한 정량적 분석과 당시의 실시간 이슈가 지닌 맥락과 관련된 여러 가지의 정성적 분석, 사용자의 이용 패턴 등 다차원적으로 분석을 진행하였다. 이를 통해 실시간 이슈가 지닌 영향력을 조명하고, 나아가 한국 사용자가 지닌 정보 습득에 대한 특성과 욕구를 밝히고자 하였다.

메가 스포츠이벤트의 공식스폰서와 일반기업의 미디어 노출 분석 (Media exposure analysis of official sponsors and general companies of mega sport event)

  • 김주학;조선미
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권4호
    • /
    • pp.171-181
    • /
    • 2018
  • 스포츠이벤트가 스포츠 산업에서 차지하는 비중이 커짐에 따라 스포츠이벤트의 공식스폰서 마케팅 시장도 증대되고 있다. 그러나 공식스폰서는 제한적이고, 그 비용도 높기 때문에 일부 기업은 엠부시(Ambish)마케팅을 방법으로 스포츠이벤트에 접근한다. 이 연구는 메가 스포츠이벤트의 공식스폰서 기업과 일반기업의 미디어 노출의 차이를 분석하는 연구이다. 연구의 목적달성을 위해 2016 리우올림픽의 1년 전, 올림픽기간, 1년 후의 미디어 기사를 수집하여 텍스트 분석을 실시하였다. 기사 수집을 위해 파이선(Python)을 활용해 웹크롤링을 실시하였고, 통계프로그램 R의 KoNLP 패키지와 TM 패키지를 활용하여 형태소 분석을 실시하고 빈도를 분석하였다. 또한, 전문가 의견수렴을 실시하여 미디어에 나타난 기업 또는 조직을 올림픽조직위원회와 공식스폰서기업, 일반기업으로 분류하였다. 분석결과 올림픽조직위원회와 관련한 빈도 5,220건, 올림픽 공식스폰서 관련 빈도 7,845건, 일반기업 관련 빈도는 7,028건으로 분석되었다. 일반기업의 노출 빈도가 공식스폰서의 노출 빈도와 큰 차이를 보이지 않았다는 것은 엠부시(Ambush) 마케팅이 전략적인 마케팅 기법으로 인식되고 있음을 시사한다. IOC는 이러한 사회적 현상을 인지하고, 공식스폰서 기업과 일반기업의 마케팅 활동에 대한 합리적 기준을 마련해야할 것이며 이 연구는 스포츠이벤트의 공정한 스폰서 활동 또는 마케팅 활동의 기준을 위한 기초자료가 될 것이다.